メイン コンテンツにスキップする

OCR 機能で画像ファイルをすばやく検索

Dropbox では、画像やスキャンしたドキュメントに含まれるテキストを検索できるので、目的のファイルをすばやく簡単に見つけることができます。

Dropbox に保存されている OCR スキャン済み PDF のライブラリ
オンラインの OCR 機能で整理整頓

クラウド ストレージに大量のスキャン済み PDF やその他の画像ファイルを保存している場合、目的のファイルをすぐに見つけるにはどうすればよいでしょうか?そんな時は光学文字認識(OCR)の技術を使うことで、すばやく簡単にファイルが見つかります。OCR はスキャンした画像から実際のテキストを抜き出すことができるので、用語やキーワードを入力するだけで目的の画像を簡単に検索できます。

署名されたドキュメントをスキャンしている iPhone
スキャンした画像をテキスト検索可能な PDF に変換

Dropbox を使えば、膨大なドキュメントを処理する手間と時間が不要になります。領収書、請求書、写真、契約書、仕事で使うインフォグラフィック、そしてフライト日程表さえも、スキャンして保存することができます。保存したファイルが必要になった時には、Dropbox の検索バーにキーワードとなるテキストを入力するだけです。検索すると、キーワードやサムネイル画像のリストがポップアップ表示されるので、ドキュメントをすばやく見つけ出すことができます。

Dropbox に保存するドキュメントをスキャンしている iPhone
OCR はビジネスの生産性を高める技術

OCR 技術は、あらゆるビジネスの生産性を高めることができます。たとえば弁護士なら、特定の言葉で検索することで目的の案件を簡単に見つけ出すことができます。銀行、医療事務、広告代理店などでも OCR 技術でビジネスを効率化し、物理書類を保管する必要性を大幅に削減できます。

それぞれ緑のチェックマークが付いたスマートフォン、デスクトップ モニター、タブレットのアイコン

よくある質問

OCR とは、光学文字認識または光学式文字読み取り装置の略称で、画像ファイルに含まれるテキストの「認識」や「読み取り」に用いられる技術です。OCR は、ファイルに含まれる文字列(キー入力、手書き、印刷)の画像を、コンピュータでの処理や検索が可能なテキストに変換します。このファイルには、たとえばドキュメントのスキャン画像や写真、印刷物が写っている写真、画像の字幕などが含まれます。現在、Dropbox では PDF のテキストを認識し、コンテンツによる検索ができるように OCR を使用しています。

はい。OCR は、機械学習の技術を応用しています。OCR 技術は、画像、ドキュメント、その他のファイルに表示されている多様なテキスト パターン、フォント、スタイルを認識する人間の能力を再現します。この技術は、機械学習の能力を活用することで実現しています。OCR は、Dropbox のエンジニアが常に取り組んできた、コンピュータ ビジョンと機械学習を活用した大規模プロジェクトの代表例です。

名前は似ていますが、OCR と ICR には大きな違いがあります。OCR はスキャンされたテキスト画像を認識し、マシン エンコーディングされたテキストに変換します。ICR は OCR の 1 つの形態ですが、テキストの処理に特化しています。ICR は、スキャンされた画像からテキストを抽出するのではなく、人が手書きしたさまざまなフォントやスタイルを学習する技術です。

OCR はパターンや特徴を認識して個々の文字をさまざまな方法で定義します。その後、テキスト情報の「読み取り」を行い、検索可能なインデックス化ファイルに変換します。

その他の機能

ドキュメントにコメントするユーザー

コンテンツ コラボレーション

チーム メンバーとの共同作業、編集、コンテンツ共有が簡単に

クラウドにバックアップされているファイル

ファイルのバックアップ

シンプルかつ安全な方法でファイルをバックアップし、データの損失を防止

雲とカメラのアイコンが付いた青いファイル フォルダ

写真バックアップ

どのデバイスからも写真をクラウドに自動でバックアップ

ドキュメント スキャナー アプリ

ドキュメント スキャナー アプリ

書類や写真はドキュメントスキャナーでデータとして保存