如果雲端儲存空間儲存了許多已掃描的 PDF 和其他圖片檔案,你要如何在緊要關頭找到所需的資料?有了光學字元辨識 (OCR) 工具,就能快速輕鬆地辦到。OCR 會從已掃描的影像中擷取實際文字,您只需要利用字詞或關鍵字搜尋影像即可。
利用線上 OCR 變得更加井然有序

將已掃描的圖片轉換成可搜尋文字的 PDF
Dropbox 替我們省去手動處理大型文件的耗時工作。掃描及儲存收據、帳單、相片、法律合約、工作資訊圖表,甚至是下個航班行程。當您準備從 Dropbox 存取這些檔案時,只要在搜尋列輸入文字關鍵字即可。系統會彈出文字或縮圖圖片的簡短清單,讓您快速搜尋文件。

探索 OCR 如何協助您的企業
幾乎任何企業都能受益於 OCR 技術,並提高生產力。舉例來說,律師只要搜尋特定文字,就可搜尋到任何案件檔。銀行、醫療辦公室以及廣告和行銷公司全都可以使用 OCR 來簡化業務,而且幾乎可以免去將實際紙本文件歸檔與存放的需求。

常見問題集
OCR 為光學字元辨識或光學字元讀取技術的縮寫。OCR 技術可「辨識」或「讀取」影像檔案中的文字。OCR 可以將檔案 (包含已掃描的文件、文件相片、內有標誌的相片或具有打字字體的場景) 中的打字、手寫或印刷文字影像,或是影像上的字幕轉換成機器能處理並搜尋的文字。Dropbox 目前利用 OCR 來辨識您 PDF 檔案中的文字,以便讓您能夠依內容搜尋檔案。
是的,OCR 是以機器學習為基礎。OCR 技術複製了人類辨識各種文字模式、字型、圖片樣式或文件等的能力。由於機器具備學習能力,因此這項技術是可行的。Dropbox 工程師一直以來致力進行大型電腦視覺與機器學習專案,而 OCR 正是主要範例之一。
即便 OCR 和 ICR 聽起來很像,但還是有很大的區別。OCR 可以轉譯已掃描圖片的文字,然後將掃描內容轉換成機器編碼文字。ICR 是 OCR 的一種,但更偏向文字專用。ICR 不單只是轉譯已掃描影像的文字,還可以學習不同字型和手寫樣式。
OCR 會運用模式或特徵辨識,以不同方式來定義每個獨立字元,然後「讀取」該文字並將其轉換成可搜尋的索引檔案。