OCR은 광학 문자 인식(Optical Character Recognition) 또는 광학 문자 판독기(Optical Character Reader)의 약자로, 이미지 파일에 포함된 텍스트를 '인식'하거나 '판독'하는 데 사용되는 기술을 말합니다.
OCR은 손으로 쓰거나, 입력하거나, 인쇄된 텍스트 이미지를 파일에서 추출한 다음 기계가 처리하고 검색할 수 있는 텍스트로 변환합니다. 여기에는 스캔한 문서, 문서 사진, 문자가 입력된 표지판이나 장면을 찍은 사진, 이미지에 입력된 자막이 포함됩니다.
현재 Dropbox는 OCR로 PDF 파일의 텍스트를 인식해 파일에 담긴 내용으로 파일을 간편하게 검색할 수 있는 기능을 지원하고 있습니다. 시간을 엄청나게 절약할 수 있는 유용한 기능이죠.