AIsmiley Magazine

AIsmiley編集部によるAI・人工知能サービスの導入事例や活用事例などの情報を記事にしてお届けします

AI・人工知能サービス

無料のOCRフリーソフトを紹介!PDFや書類をテキスト変換!

  • 業種・業態
  • 編集部記事

OCR

OCR(光学認識技術)とは、紙文書のデータを読み込んでデジタル化する技術のことです。日本のオフィスワーカーの生産性向上を阻む壁のひとつに、大量の紙文書の存在があるとされており、OCRの活用がその解決につながると期待されています。ただ、新たなソフトウェアや技術を導入する時に、まずはスモールスタートで始めてみたいというニーズはあるでしょう。そうした方におすすめしたいのが、フリーソフトの活用です。

■OCRの仕組み

OCRのフリーソフトについてご紹介していく前に、まずはOCRの仕組みについて詳しくみていきましょう。

一般的なOCR処理の場合、スキャナーでスキャニングするだけで実行されるわけではありません。スキャニングを行った後にOCRの専用ソフトを使用してテキストを抽出し、ドキュメントとして出力されるというのが一般的です。そんなOCR処理の具体的な流れは、以下のようになっています。

 

1.画像の取り込み

まずは書籍や書類などをスキャナーでスキャニングして、画像として取り込みます。この時点ではまだOCR処理は施されていません。

 

2.画像と文字列の分離

ここから本格的にOCR処理が始まります。書籍や書類は段組で記載されているケースが多いため、まず画像と文字列を分離させ、解析を行う文字列を明確にします。

 

3.文字列の解析

画像と文字列の分離が終わったら、文字列を1行ずつ分解した上で、さらに1文字ずつの分解を行います。

 

4.文字の解析

1文字ずつの分解が終了したら、「ターゲットの文字が何の文字か」という解析を1文字ずつ行っていきます。その文字がどのような線で構成されているのか、特徴をしっかりと捉えた上で、ソフト内から該当する文字のマッチングを行っていくわけです。そして、文字の前後から該当する単語があるかどうかを確認し、合致した場合にはそれをデータとして決定します。

 

5.出力

最後に、PDFなどの画像に出力したり、WordやExcelなどのドキュメントに出力したりすれば、OCR処理の完了です。

 

■OCRを利用することで得られるメリット

■OCRを利用することで得られるメリット|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

OCRを利用することで得られるメリットとしては、主に以下のような点が挙げられるでしょう。

 

・書籍や書類の保管スペースを削減できる

書籍や書類といった紙媒体を保管する場合、保管スペースを用意しなければなりません。そのため、年数が経過するごとに保管スペースの空きが少なくなり、いずれは保管スペースが足らなくなってしまう可能性もあるのです。
しかし、OCRで紙媒体をデータ化してしまえば、段ボール1箱分ほどの書類データもわずか数MBほどのデータとして保存できてしまうため、オフィスの空きスペースを圧迫してしまう心配がありません。スペースを別の用途で有効活用することもできますので、非常にメリットは大きいといえるでしょう。

 

・データを簡単に探し出せる

紙媒体を保管している場合、必要な書類をピンポイントで探し出すのは決して簡単ではありません。場合によっては探し出す作業に多くの時間を費やしてしまうこともあるでしょう。その点、OCRを活用すればパソコン上でいつでも簡単に情報を検索することができるため、必要な書類を探し出すための時間を削減できるのです。

 

・データの編集や活用も簡単に行える

紙媒体の場合、その情報を編集したりグラフ作成に活用したりする際にも手間がかかってしまいます。しかし、OCRでテキストデータ化しておけば、より簡単にデータを編集したり、表計算ソフトに活用したりすることが可能です。最近では、読み取ったテキストを自動的に翻訳して、相手に転送できる機能が備わっているアプリも存在します。

 

■OCRのデメリット

OCRは、必ずしもメリットばかりというわけではありません。いくつかデメリットも存在するため、あらかじめ把握しておく必要があります。主なデメリットとして挙げられるのは、以下のような点です。

 

・定型ではない伝票には対応できないケースがある

もともとOCRは、決められたレイアウトの伝票や通帳に書かれている文字を認識することが目的でした。そのため、レイアウトが変更されると、文字を認識できなくなる可能性があるのです。たとえば、明細欄の行数が増えたり減ったりした場合、本来の文字を認識すべき位置とは異なる部分に文字が存在することになります。それが原因となり、データ化に失敗してしまうケースがあるわけです。こういった、柔軟性にかける点はデメリットといえるでしょう。

 

・100%文字認識できるわけではない

OCRは、読み取り精度が100%というわけではありません。操作が簡単であることはメリットといえますが、読みにくい筆跡・フォントによる文書の場合、OCRが誤読してしまい表示できない可能性があります。当然、誤読が判明した際には修正作業が必要になりますので、場合によっては負担が増加してしまう可能性もあることを把握しておく必要があるでしょう。

 

■意外な盲点?!身近なGoogleドライブでもOCRが無料で体験できる

フリーのOCR活用の第一歩としておすすめしたいのが、GoogleドライブのOCR文字抽出機能です。使い方は簡単で、データ化したいPDFファイルや画像ファイルなどをGoogleドライブにアップロードし、Googleドキュメントで開くだけ。Googleのサービスのひとつなのでもちろん無料で使えますし、操作も簡単です。それでいて漢字の識字率などもかなり高度で、日本語の縦書き文書などにもある程度対応しています。

意外な盲点?!GoogleドライブでもOCRが利用できる|AI・人工知能製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるメディア

最近の学生は、黒板の板書をスマホで撮影してOCRを使ってデータ化、という使い方もするのだとか。身近なGoogleのサービスで、OCRを無料体験できるのは盲点といえるのではないでしょうか。

文字認識の精度はまだ完璧とはいえないかもしれませんが、GoogleはAI・人工知能による学習機能を取り入れており、他のサービスに比べて圧倒的に利用者の母数が多いので、次第に精度は改善されていくと考えられます。

また、Googleによると以下のポイントを抑えれば、よりOCRの精度が高まるとのことです。

 

・ファイル形式はJPEG、PNG、GIF、PDF(複数ページのドキュメント)のいずれか

・ファイルサイズは 2 MB 以下にする

・テキストの解像度は高さ 10 ピクセル以上にする

・ドキュメントを正しい向きで取り込む。画像の向きが間違っている場合は、回転させてから Google ドライブにアップロードする

・ Google ドライブではドキュメントの言語は検出されない

・フォントは、Arial や Times New Roman のような一般的なフォントを使用する

・明るさが均一でコントラストがはっきりしたシャープな画像が最適

 

また、Evernote(エバーノート)にも標準でOCR機能が備わっています。ただ、Googleドライブのようにテキストとして文字起こしはできず、一部機能は有料です。

(参照:Googleドライブ ヘルプ PDF や写真のファイルをテキストに変換する)

 

■Googleドライブ以外のOCRフリーソフトも活用してみよう

OCRフリーソフトとして特に有名なのは上記でご紹介したGoogleドライブですが、他にも無料で利用できるソフトは多く存在します。ここからは、いくつか代表的なOCRフリーソフトをご紹介しますので、ぜひ有効活用してみてはいかがでしょうか。

 

・Light PDF

(参照:LightPDF – PDFファイルをオンラインで無料で編集・変換する)

Light PDFは、オンライン上でPDFの編集を行ったり、他のフォーマットへの変換を行ったりする機能がメインのフリーソフトです。ただ、OCR機能も備わっているので、OCRを無料で利用したい人にもおすすめのソフトといえます。そんなLight PDFの大きな特徴としては、Google Chromeの拡張機能として使用できるため、MacでもWindowsでも利用できて利便性が高いこと挙げられるでしょう。
ちなみにLight PDFには無料版と有料版の2種類が存在するのですが、無料版では1言語の認識が可能です。出力形式に関しても、無料版はtxtファイル形式のみとなっているので、より多様な使い方を想定している場合には、無料版で試した後に有料版を検討していくのが良いでしょう。

 

・OCR.Space

(参照:Best Free OCR API, Online OCR, Searchable PDF – Fresh 2020 On-Premise OCR Software)

OCR.Spaceは、JPGやPNG、PDFなどのさまざまなファイルをテキストファイルに変換できるフリーソフトです。Light PDFと同様にソフトウェアのインストール不要なので、MacでもWindowsでも利用することができます。また、アカウントを作成する必要がないという点も大きな特徴のひとつでしょう。言語も20ヶ国語に対応しているなど、汎用性の高さが大きな魅力となっています。
ただ、利用する際の注意点として、利用できるファイルの容量に上限が設けられていることが挙げられます。イメージファイルとPDFファイルに関しては5MBが上限となっており、手書きのドキュメントも使用できないため注意が必要です。

 

・i2OCR

(参照:i2OCR – Free Online OCR)

i2OCRも、Light PDFやOCR.Spaceと同様にブラウザ上での利用が可能なOCRフリーソフトです。大きな特徴としては、100を超える言語に対応していることや、JPG・PNG、TIF、BMPといった多くのファイル形式に対応していることなどが挙げられます。
また、イメージファイルをテキストファイルに変換するのはもちろんのこと、ブラウザ上にある画像をテキストファイルに変換する機能も備わっているため、より多様な使い方が可能です。さらに、画像の枚数制限も設けられていないので、積極的に活用することができます。ただ、ファイルサイズに関しては「最大10MB」となっているため注意しましょう。
なお、日本語の認識精度が高くないという弱点があるため、日本語だけを使用する方は不便さを感じることも多いかもしれません。一方、外国語を多用する人であれば柔軟な使い方ができるでしょう。

 

・PDFelement

(参照:PDFの作成・編集ならPDFエレメント | Wondershare PDFelement)

PDFelementは、完全無料のフリーソフトというわけではありませんが、無料試用版が用意されているため、気軽にOCR活用することができます。OCR実行後に、スキャンした文章の検索を行ったり、コピー&ペーストしたりすることができるのが特徴です。もちろん、テキストの編集を行ったり、書式の変更を行ったりすることもできます。OCRをインストールした後であればオフラインで利用できる点も魅力のひとつです。

また、PDFを他の形式に変換したり、画像のサイズを変更したりすることもできるため、さまざまな形式の書類を作成する機会がある方におすすめのソフトといえるでしょう。

 

・NewOCR

(参照:Free Online OCR – Convert JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu to Text)

NewOCRは、テキストをサーチ可能な状態に変換したり、編集可能な状態に変換したりすることができるOCRフリーソフトです。対応している形式が多く、アップロードするファイルの制限がないという点は大きな特徴といえるでしょう。また、多くの言語に対応しているという点も大きな特徴であるため、さまざまな言語の文書を扱うことがある人におすすめです。

写真のスキャンが多少悪くてもしっかりと認識することができ、変換した後にクリップボードにコピーしてDLすることもできるので、ぜひ気軽に利用してみてはいかがでしょうか。

 

・Hipdf

(参照:HiPDF:オールインワン 無料オンラインPDFソリューション)

Hipdfは、完全無料のフリーソフトというわけではないものの、体験版が用意されているオンラインOCRです。日本語はもちろんのこと、英語やフランス語、イタリア語といった言語も認識することができます。

有料のオンライン版であれば、サイトにファイルをドラッグして言語を選択するだけで簡単に変換を行うことが可能です。そして、変換されたファイルはダウンロードすることもでき、広告などで邪魔される心配もありません。

ちなみにオンライン版は有料ですが、デスクトップ版であれば無料試用することができるので、まずはデスクトップ版を利用してみて有料版の利用を検討するという方法も有効なのではないでしょうか。

なお、オンライン版とデスクトップ版の違いとしては、ファイル制限や変換速度などが挙げられます。オンライン版の場合、OCR処理時間が少し長くなってしまいますが、デスクトップ版は6倍速での変換が可能です。また、オンライン版のファイル制限は「最大100MBのファイルサイズ」となっていますが、デスクトップ版であれば「サイズやページの制限なし」なので、OCRを利用する機会が多い人にはデスクトップ版がおすすめといえるでしょう。

さらに、オンライン版よりもデスクトップ版のほうが多くの言語をサポートしているという特徴がありますので、用いる言語が多い方もデスクトップ版のほうがおすすめといえるでしょう。

 

・Convertio

・Convertio

(参照:OCR (光学文字認識)。オンライン フリー — Convertio)

Convertioは、スキャンしたドキュメントを編集可能なWord、PDF、Excel、Txt(テキスト)といった出力ファイル形式に変換することができるツールです。使い方は非常にシンプルで、まずは画像・PDFのいずれかをアップロードします。次に、文書で使用されている言語をすべて選択し、最後に「変換」をクリックすれば認識可能なテキストファイルとしてダウンロードが可能になります。

より多くのドキュメントを変換したい場合はサインインする必要がありますが、10ページまでであればサインインせずに変換でき、インストールも必要ありません。なお、中国語、韓国語、ドイツ語、オランダ語、英語、フランス語、イタリア語など、さまざまな言語に対応しているのも魅力のひとつです。

 

・eight

・eight

(参照:「Eight」が名刺の即時データ化に対応、OCR+手入力で素早く正確に – INTERNET Watch)

Sansan株式会社が提供している個人向け名刺管理アプリ「eight」では、OCRを活用した「名刺の即時データ化機能」が搭載されています。この機能を活用すれば、名刺をスマホで撮影するだけで、その場でデータ化することが可能です。

また、名刺を4枚までまとめて取り込むことができる「クイックスキャン」機能も搭載されているので、スキャンに時間がかかることもありません。なお、データ化完了後は、「ネットワーク」ページで確認が可能です。

 

・myBridge

・myBridge

(参照:myBridge – LINEの名刺管理アプリ)

myBridgeは、LINEが提供している名刺管理アプリです。スマホで名刺を撮影するだけで、簡単に名刺情報をデータ化することができます。また、検索・チームでの共有・連絡帳への連携・オンライン名刺交換といった、さまざまな機能が簡単に使えるのも大きな魅力です。

国際規格(ISO)の情報保護・セキュリティ対策が行われているので、情報漏洩の心配もなく安全といえます。枚数上限や機能制限は設けられておらず、すべて無料で使えるので、より多くの名刺情報をデータ化したい人にとっては魅力的なアプリといえるでしょう。

 

■面倒な請求書や領収書の処理もAI-OCRで

■面倒な請求書や領収書の処理もAI-OCRで|人工知能を搭載した製品・サービスの比較一覧・導入活用事例・資料請求が無料でできるAIポータルメディア

オフィス業務でのOCR活用で効果が期待されているのが、請求書の読み取り作業です。

月末になると請求書が大量に送られてくるものの、取引先ごとに形式はバラバラ。既存のOCRソフトではうまく読み取りができず、結局人力での読み取りと入力作業が必要・・・・・・という悩みを抱えている企業も多いかもしれません。

そうした場合に活用したいのが、一歩進んだOCR技術「AI-OCR」です。人工知能とOCRを組み合わせることで、フォーマットがばらばらの請求書のような非定型帳票もスムーズにデータ化してくれます。「請求書の枚数が多く、入力作業に時間かかる」「入力ミスが多く、データのチェックや修正に時間をとられる」「正確性を期すためにダブルチェック、トリプルチェックが必要」といったケースには、AI-OCRの活用を検討するとよいかもしれません。

ここからは、いくつか代表的なAI-OCRをご紹介していきますので、ぜひ参考にしてみてください。

 

◆AI-OCRソフト1:FEEDER

FEEDERは、領収書をスマホで撮影してアップロードするだけで経費精算レポートが作成できるOCRソフトウェアです。大きな特徴としては、識字率が極めて高いことが挙げられるでしょう。FEEDERの画像からの活字識字率は1文字単位で99%と極めて高く、複数の文字を認識する場合の識字率に関しても90%となっています。

もちろん、読み取ったデータはAIが学習するための材料にもなるため、使用するごとに識字率は向上していくでしょう。

また、領収書には「日付」「金額」「費目」「取引先」といったさまざまな項目が存在しますが、FEEDERはそれらの項目をAIが自動で判定していくため、経費精算業務の負担を大幅に軽減させることができます。

さらに、スマートフォンで領収書を撮影し、そのままアップロードしていくことも可能です。スマホで手軽にアップロードできるという点は、効率よく業務を進める上でも有効なものといえるのではないでしょうか。

 

FEEDERの詳細を見る

 

◆AI-OCRソフト2:sweeep

sweeepは、請求書の読み取りに特化したOCRソフトウェアです。100枚の請求書をわずか3分で処理することができる点などは大きな特徴とえるでしょう。

また、3つのステップで簡単に自動化できるという点も、sweeepの大きな魅力です。1つ目のステップでは、スキャナで請求書を読み取り、sweeepに連携します。これは非定型のレイアウトでも問題ありません。

2つ目のステップでは、sweeepがOCR技術によって請求書を読み取ります。内容を自動で判別して仕分けデータを作成してくれるため、特に難しい操作を行う必要もありません。

そして3つ目のステップでは、sweeepから仕分けデータをダウンロードします。そして会計システムに連携させれば終了です。OCRに対して「操作が難しそう」といったイメージをお持ちの方もいらっしゃるかもしれませんが、sweeepのような操作が簡単なソフトウェアであれば、気軽に導入していくことができるでしょう。

また、以下のような便利な機能も、「経理にとって必要な作業は何か」をしっかりと考えた上で作られたものであるため、より経理業務の負担を軽減させることができるでしょう。

 

・高精度OCR

高い認識率のOCRでスキャンされた請求書を、正確にデータ化することができます。一度スキャンした請求書はAIが記憶していくため、さらに読み取りの精度を高めていくことも可能です。

 

・自動帳票定義AI

一般的なOCRの場合、どこに何が書いてあるのかを指定する「帳票定義」を手動で行わなくてはなりません。しかし、sweeepにはAIが搭載されているため、これらをすべて自動化させることができます。

 

・IP制限

sweeepを利用するIPアドレスを制限することが可能です。この制限を設けることにより、外部からの侵入を防ぎ、外部への情報漏洩リスクを下げることができます。

 

◆AI-OCRソフト2:ReiWorQ

ReiWorQ AI-OCRは、高精度な文字認識機能はもちろん、システム設定に不慣れな方でも簡単に設定・操作が可能なAI-OCRソフトです。

従来のOCRでは、「文字認識の精度が低い」「読取位置の調整が必須」「チェック作業に時間がかかる」といった非効率な業務が発生する課題がありました。その点、AI-OCRでは、従来のOCRにAIのDeep Learning(ディープラーニング)機能を取り入れることで、手書き文字の認識精度が向上するため、非定型書類の処理・チェック作業の効率化を実現することが可能です。

そんなReiWorQ AI-OCRの特徴としては、95%を超える高精度な文字認識率を実現できる点が挙げられます。さまざまなユーザーが記入する手書き文字を高精度でデジタルデータ化し、乱筆文字であっても高い精度での読み取りが可能です。

 

ReiWorQ AI-OCRの詳細を見る

 

◆AI-OCRソフト3:AimeCard

株式会社アイメソフト・ジャパンが提供する「AimeCard」は、活字や手書き書類はもちろん、車両のナンバープレートや看板や壁上の文字認識のほか、印鑑やロゴ、IDカードの顔写真などのオブジェクト認識にも対応したAI-OCRです。日本語、英語、ベトナム語の活字では、文字レベルの精度は99%以上を達成しています。

認識できなかった手書き文字などは、学習を繰り返すことで精度を向上させることができます。その他にも、高頻度で出現する単語を優先させる辞書追加や、画像品質改善やノイズ削除などの前処理、台形補正や回転、斜め校正など、正面を向いた画像でなくても前処理をすることにより高精度な認識結果を出すことが可能です。

 

AimeCardの詳細を見る

 

フリーソフトでは、AI-OCRを活用して請求書の読み取りに特化した高度なものはまだ出ていないかもしれませんが、有料ソフトの中にも機能を限定した体験版やある一定のトライアル期間を無料で設けているものもあるので、そうした機会を利用して検討してみるのも良いかもしれません。

自社にとって必要な機能は何かを明確にした上で、AI-OCRを比較検討してみてはいかがでしょうか。

 

AI-OCRのサービス比較と企業一覧を見る

 

このAI記事が気に入ったら
いいね ! しよう

Twitter でAIポータルメディアAIsmileyを
この記事で紹介されたAIサービスを無料で資料請求