Om du har massor av inskannade PDF-filer och andra bildfiler lagrade i molnet, hur kan du snabbt hitta det du söker? Med OCR (Optical Character Recognition) går det snabbt och enkelt. OCR extraherar faktisk text från inskannade bilder så att du bara kan söka efter din bild med termer eller nyckelord.

Med Dropbox slipper du det tidskrävande arbetet med att behandla stora dokument manuellt. Skanna och lagra kvitton, räkningar, bilder, avtal, infografik eller varför inte programmet för nästa resa. När du behöver komma åt dessa filer i Dropbox kan du bara söka med ett nyckelord i sökfältet. En kort lista med ord eller miniatyrbilder kommer att visas så att du kan hitta rätt dokument snabbt.

I princip alla företag kan dra nytta av OCR-teknik för bättre produktivitet. En jurist kan till exempel söka efter ett fall med valfritt sökord. Banker, vårdcentraler och reklambyråer kan alla använda OCR för att strömlinjeforma verksamheten och mer eller mindre eliminera behovet av att lagra och förvara fysiska pappersdokument.

Vanliga frågor
OCR står för Optical Character Recognition, det vill säga optisk teckenläsning. OCR är en teknologi som används för att avläsa text i bildfiler. OCR konverterar bilder av text skriven för hand eller med dator från filer, inklusive skannade dokument, fotografier av dokument, fotografier med skyltar eller scener med text eller bilder med undertexter, till text som en dator kan behandla och söka i. Dropbox använder för närvarande OCR för att identifiera texten i PDF-filer och göra dem sökbara enligt innehåll.
Ja, OCR bygger på maskininlärning. OCR-tekniken återskapar människans förmåga att känna igen olika textmönster, typsnitt och stilar i till exempel bilder eller dokument. Denna teknik är möjlig eftersom maskiner har förmågan att lära sig. OCR är ett bra exempel på den sortens storskaliga projekt som involverar dataläsning och maskininlärning som utvecklarna på Dropbox arbetar med hela tiden.
Även om de låter ungefär likadant är det stor skillnad på OCR och ICR. OCR förvandlar inskannade bilder av text till maskinkodad text. ICR är en slags OCR men är mer specifik för text. En ICR kan lära sig olika typsnitt och handstilar utöver att bara översätta text från en inskannad bild.
OCR använder mönster- eller funktionsigenkänning för att definiera varje enskilt tecken på olika vis, och ”läser” sedan texten och konverterar den till en indexerad fil som är sökbar.