หากคุณมีไฟล์ PDF ที่สแกนและไฟล์ภาพอื่นๆ ที่บันทึกไว้ในบริการพื้นที่จัดเก็บบนคลาวด์เป็นจำนวนมาก คุณจะค้นหาสิ่งที่คุณต้องการอย่างเร่งด่วนได้อย่างไร การค้นหาทำได้อย่างรวดเร็วและง่ายดายโดยใช้ Optical Character Recognition (OCR) OCR จะดึงข้อความจากภาพที่สแกน สิ่งที่คุณต้องทำจึงมีเพียงแค่ค้นหาภาพโดยใช้คำศัพท์หรือคำสำคัญ

Dropbox ขจัดงานที่ต้องใช้เวลา นั่นคือการประมวลผลเอกสารขนาดใหญ่ด้วยตนเอง สแกนและจัดเก็บใบเสร็จ ใบแจ้งค่าบริการ รูปภาพ สัญญาทางกฎหมาย อินโฟกราฟิกจากงาน หรือแม้กระทั่งรายละเอียดการเดินทางเที่ยวบินต่อไปของคุณ เมื่อคุณพร้อมเข้าถึงไฟล์เหล่านี้จาก Dropbox เพียงป้อนข้อความสำคัญในแถบค้นหา รายการคำศัพท์หรือภาพตัวอย่างขนาดย่อจะปรากฏขึ้นเพื่อให้คุณค้นหาเอกสารของคุณได้อย่างรวดเร็ว

แทบทุกธุรกิจสามารถได้ประโยชน์จากเทคโนโลยี OCR เพื่อประสิทธิภาพที่ดียิ่งขึ้น ตัวอย่างเช่น ทนายความสามารถค้นหาไฟล์คดีใดก็ได้เพียงแค่ค้นหาคำที่ต้องการ ธนาคาร สำนักงานทางการแพทย์ รวมทั้งบริษัทโฆษณาและการตลาดล้วนสามารถใช้ OCR เพื่อปรับปรุงธุรกิจของตนและขจัดความจำเป็นในการจัดทำและจัดเก็บเอกสารกระดาษ

คำถามที่พบบ่อย
OCR ย่อมาจาก Optical Character Recognition (การอ่านอักขระด้วยแสง) หรือ Optical Character Reader (โปรแกรมอ่านอักขระด้วยแสง) OCR เป็นเทคโนโลยีที่ใช้เพื่อ "รู้จำ" หรือ "อ่าน" ข้อความที่ปรากฏในไฟล์ภาพ OCR จะแปลงภาพที่มีข้อความซึ่งพิมพ์ด้วยมือ เขียน หรือพิมพ์ด้วยเครื่องพิมพ์จากไฟล์ โดยรวมถึงเอกสารที่ผ่านการสแกน รูปภาพเอกสาร รูปภาพที่มีสัญลักษณ์หรือฉากที่มีเครื่องหมาย หรือคำบรรยายใต้ภาพในภาพ ให้กลายเป็นข้อความซึ่งเครื่องจักรสามารถประมวลผลและค้นหาได้ ในปัจจุบัน Dropbox ใช้ OCR เพื่ออ่านข้อความบน PDF ของคุณและทำให้ผู้คนค้นหาข้อความนั้นจากเนื้อหาภายในได้
ใช่ OCR มีพื้นฐานมาจากการเรียนรู้ของเครื่อง เทคโนโลยี OCR จำลองความสามารถของมนุษย์ในการจดจำรูปแบบข้อความ แบบอักษร หรือลักษณะต่างๆ บนภาพ เอกสาร และอื่นๆ เทคโนโลยีนี้เป็นไปได้เพราะความสามารถของเครื่องจักรในการเรียนรู้ OCR เป็นตัวอย่างที่ดีของโครงการขนาดใหญ่ประเภทที่เกี่ยวข้องกับคอมพิวเตอร์วิทัศน์และการเรียนรู้ของเครื่องจักรที่วิศวกรของ Dropbox พัฒนาอยู่ตลอดเวลา
แม้อาจจะฟังดูคล้ายกัน แต่ OCR และ ICR ก็มีความแตกต่างที่สำคัญอยู่บ้าง OCR จะแปลรูปภาพที่สแกนของข้อความและเปลี่ยนรูปภาพที่สแกนเหล่านี้เป็นข้อความที่เข้ารหัสด้วยเครื่อง ส่วน ICR เป็น OCR ประเภทหนึ่ง แต่เน้นเฉพาะข้อความมากกว่า ICR สามารถเรียนรู้แบบอักษรและลักษณะลายมือที่แตกต่างกันได้ มากกว่าแค่แปลข้อความจากภาพที่สแกน
OCR ใช้การจดจำรูปแบบหรือคุณสมบัติเพื่อกำหนดอักขระแต่ละตัวในรูปแบบที่แตกต่างกัน จากนั้นจึง "อ่าน" ข้อความและแปลงเป็นไฟล์ดัชนีที่สามารถค้นหาได้