Comment retrouver rapidement ce que vous cherchez dans les nombreux PDF scannés et fichiers image de votre stockage cloud ? Grâce à la reconnaissance optique de caractères (OCR), cela devient un jeu d'enfant. Cette technologie extrait le texte des images scannées pour vous permettre d'y effectuer des recherches par mots clés.

Avec Dropbox, plus besoin de passer des heures à traiter manuellement vos documents volumineux. Scannez et enregistrez vos reçus, factures, photos, contrats, infographies et même l'itinéraire de votre prochain vol. Lorsque vous souhaitez accéder à ces fichiers dans Dropbox, saisissez simplement un mot clé dans la barre de recherche. Une courte liste de mots ou de vignettes s'affiche alors pour vous permettre de retrouver rapidement vos documents.

Toutes les entreprises peuvent utiliser la technologie OCR pour gagner en productivité. Un cabinet d'avocats, par exemple, pourra l'utiliser pour retrouver un document spécifique à l'aide d'un simple mot clé. Une banque, un cabinet médical ou encore une agence marketing pourront s'en servir pour simplifier leur façon de travailler et ne plus avoir à stocker de documents papier.

FAQ
ROC signifie Reconnaissance optique de caractères. La technologie ROC est utilisée pour "reconnaître" ou "lire" du texte contenu dans des fichiers image. Elle convertit les images de texte dactylographié, manuscrit ou imprimé à partir des fichiers (y compris des documents numérisés, des photos d'un document, des photos avec des signes ou des scènes avec typographie, ou les sous-titres d'une image) en un texte que les ordinateurs et appareils peuvent traiter et parcourir. Dropbox utilise la reconnaissance optique de caractères pour reconnaître le texte de vos fichiers PDF et vous permettre d'effectuer des recherches de texte à l'intérieur.
Oui, elle est basée sur l'apprentissage automatique. La technologie OCR imite la capacité humaine à reconnaître différents formats, polices ou styles de texte dans des images, des documents et plus. Pour cela, elle s'appuie sur les facultés d'apprentissage automatique des ordinateurs. La technologie OCR est un exemple typique de projet faisant appel à la vision par ordinateur et à l'apprentissage automatique, et sur lequel les ingénieurs Dropbox travaillent en permanence.
Même si les acronymes semblent similaires, il y a de grosses différences entre ces deux technologies. La technologie OCR permet de scanner des images et d'en extraire le texte dans un format compréhensible pour la machine. La technologie ICR ("Intelligent Character Recognition", ou reconnaissance intelligente de caractères) est un type d'OCR, mais spécifique au traitement de texte. Elle ne se contente pas d'extraire le texte d'une image scannée, mais est capable d'apprendre à reconnaître différentes polices et différents styles d'écriture manuscrite.
La technologie OCR utilise la reconnaissance de motifs ou de caractéristiques pour définir chaque lettre de plusieurs façons, puis elle "lit" le texte et le convertit en fichier indexé dans lequel il est ensuite possible d'effectuer des recherches.