経営虎の巻 第83回「AI-OCRの活用」
OCRとは「Optical Character Recognition」の略で、画像データのテキスト部分を認識し、文字データに変換する光学文字認識機能のことをいいます。
具体的には、紙文書をスキャナで読み込み、書かれている文字を認識してデジタル化する技術です。
このようなOCRの機能がここ最近、業務効率化ツールとして注目されています。
OCRの主な利用用途を2つご紹介します。
1つ目は、「データ入力作業の手間削減」です。
紙資料の入力を手作業で行っている場合に、OCRを利用し、スキャンと同時に文書をデータ化することで、入力作業の手間を削減します。
2つ目は、「データの検索性向上」です。通常、スキャナ保存は、画像形式の保存のため、どういう書類かファイルを開いて内容を確認しないと分かりません(予め設定したファイル名を元に検索するしかありません)。
OCRを用いて、Word・Excel・PowerPoint等のテキストデータに変換することで、キーワード検索が可能となります。
非常に便利そうに見えるOCRですが、課題は認識率(正しく読み取る確率)の低さにあります。
OCRの認識率は、60%あれば上出来といわれています。
特に、日本語は言語そのものが難しく、認識率が下がる傾向にあります。
この課題解決に一役買うのが、AI(人工知能)を取り入れた「AI-OCR」です。
AI-OCRの特徴は、最初の文字認識精度が低くても、利用するごとにAIが学習し、精度が上がっていくことです。
AI-OCRを用いることで、認識率を100%に近づけていくことができます(最大99%ともいわれています)。
他にも、フォーマットの異なる帳票への対応、歪みの自動補正などあらゆることに対応可能です。
事務作業の業務改善に向けた、今後注目のツールです。