【無料】Googleドライブで画像から文字を抽出する方法

画像ファイル上に表示されている文字は、通常、そのままでは選択やコピーすることができません。

画像上の文字をテキストデータとして使用したい場合、文字数が少なければ目視かつキーボードからの手入力で文字起こしすることも可能ではありますが、文字数や画像ファイル数が多ければ大変な作業となります。

このような場合、画像上の文字をテキストデータとして抽出することができれば、文字起こし作業の手間を省くことができます。また、テキストデータを抽出することによって、文字のコピー、検索、集計などにも使用できるようになり大変便利です。

実際に画像データから文字を抽出するには、高価なアプリも難しい操作も必要ありません。誰でも使用可能な「Googleドライブ」と「Googleドキュメント」を使用すれば、誰でも簡単に、かつ無料で、画像ファイルからテキストデータを抽出することができます。

画像ファイルから文字を抽出する事前準備

本ページでご紹介する方法は、「Googleドライブ」と「Googleドキュメント」を使用します。以下の内容をご準備ください。

インターネットに接続可能なPC
Windows / Mac など、パソコン上からWebブラウザにアクセス可能な環境をご用意ください。
Googleアカウント
「Googleドライブ」と「Googleドキュメント」を使用するため、「Googleアカウント」をご用意ください。

GoogleのWebページ上には「おすすめの方法」として以下の記載があります。
以下の内容を満たしていなくても画像/PDFから文字を抽出することは可能ですが、以下の条件に近ければよりテキスト抽出の精度が上がります。

「Googleドライブ」と「Googleドキュメント」を使用して、画像/PDFファイルから文字を抽出する方法は以下の手順となります。

「Googleドライブ」に画像/PDFファイルをアップロード
「Googleドライブ」に文字を抽出したい画像/PDFファイルをアップロードします。
「Google ドキュメント」で開く
アップロードした画像を右クリックし、表示されたメニューで「アプリで開く」>「Google ドキュメント」の順で選択します。

「Google ドキュメント」が開いた後、画像/PDFの下に抽出された文字が表示され、編集やコピーが可能となります。

「Googleドライブ」と「Googleドキュメント」を使用すれば、上記の方法により画像/PDFファイルから文字を抽出することができます。テキスト抽出後は、コピー、編集、検索などが可能になるため大変便利です。

しかし、画像/PDFファイル上のテキストが単純に抽出されるため、画像/PDFファイル上に表示されているテキストのレイアウトは保持されません。

また、手書きの文字や背景が複雑な場合、正確にテキストが抽出されない場合があります。

このため、抽出されたテキストを再利用する場合は、必ず内容が正しいかチェックすることをお勧めします。

「Googleドライブ」と「Googleドキュメント」を使用したテキスト抽出方法は、簡単かつ無料なので大変便利です。しかし、元となる画像/PDFファイルの状態によっては、正確にテキストが抽出されない場合もあります。

レイアウトの保持やより制度の高いテキスト抽出が必要な場合は、有料の「OCR」アプリなどを探してみてください。