• Column
  • DXのラストワンマイルを支えるAI-OCR

どうしてもなくせない“紙”をデジタル化するAI-OCR

脱・手入力から業務プロセスの自動化、データ活用まで

齋藤 公二(インサイト)
2025年1月17日

OCRとAI-OCRの違い2:フォーマット(書式)と内容

 OCRが処理対象にするフォーマット(書式)は、定型か非定型か、手書きか活字かに分けられる。

 定型フォーマットは、数字やフリガナなどを1マスに1文字を書き込む形式や、姓名や住所などをマス目なしに特定の記入欄に記入する形式による帳票などである。非定型フォーマットは、納品書や請求書など取引先ごとに入力項目や場所がバラバラな帳票や、アンケートの自由記述欄のように文字の大きさも文字数が大きく変化する帳票などだ。それぞれに、手書きのものと、ワープロなどで作成された活字文字のものがある。

 定型フォーマットの活字に対してはOCRも高い認識精度を出せる。だが非定型フォーマットや手書きに対しては十分な認識精度を出せない。AI-OCRでは、フォーマットに対しても学習により認識精度を高められる。

OCRとAI-OCRの違い3:学習による進化

 OCRが「人間が決めたルール」に基づいて認識しているのに対し、AI-OCRは、認識対象の特徴や識別のポイントを学習していると説明したように、AI-OCRは、さまざまな帳票や文字を学習することで認識精度を高めている。学習データを用意することで、氏名や住所など汎用的な用途に合わせたり、特定の業務に特化して精度を高めたりが容易になる。

人手による入力ミスの削減やセキュリティの向上も

 認識精度が高まったAI-OCRは、OCRが目指してきた業務効率化や生産性向上を、より高度に実現できるようになった。データ化できる情報が増えることで、情報の検索性や活用度、保存・保管が容易になる。セキュリティを高める効果も期待できる。そのメリットは以下などである(図2の左)。

図2:AI-OCRのメリットと留意点

●メリット1=業務効率化 :各種手作業の削減や、確認・検証作業の軽減。人手による入力ミスなども軽減できる
●メリット2=生産性向上 :業務の自動化によるスピードアップ
●メリット3=情報活用 :データのデジタル化と共有による情報活用
●メリット4=セキュリティ :アクセス保護や隔離などデータの保存性の向上

 これらメリットを生かしたユースケースとしては以下などが挙げられる。

ユースケース1:定型、汎用型、活字(一部手書き)への適用

 定型の受発注伝票や郵送物の送り状などに印字された文字を読み取る。従来のOCRでも対応できるが、AI-OCRを利用することで手書きが混じるケースなどにも対応できる。定型、汎用型のためAIモデルの個別学習は基本的に不要である。

ユースケース2:非定型、汎用型、活字(一部手書き)への適用

 取引先ごとにフォーマットが異なる請求書や納品書などを読み取る。さまざまな帳票やフォーマットへの対応が容易になる。手書きが混じるケースに対応できる。ただし、帳票の種類やフォーマットの違いを学習するための手間と時間が必要になることはある。

ユースケース3:非定型、業務特化型、手書きへの適用

 手書きによるアンケートや各種申請書類、問診表など、自由記述欄があり特定の業務内容を扱うことが容易になる。従来のOCRでは難しかった。特定業務に合わせるための学習を製品ベンダー側が事前に実施できれば、利用者側での学習を不要にできることがある。