• Column
  • DXのラストワンマイルを支えるAI-OCR

どうしてもなくせない“紙”をデジタル化するAI-OCR

脱・手入力から業務プロセスの自動化、データ活用まで

齋藤 公二(インサイト)
2025年1月17日

AI-OCRは、AI(Artificial Intelligent:人工知能)技術を用いて認識精度を高めたOCR(Optical Character Recognition:光学文字認識)である。手書き文字や紙に印刷された文書などを画像データとして取り込み、テキストデータ(文字コード)に変換する。OCRそのものは決して新しい技術ではない。だが、DX(デジタルトランスフォーメーション)への取り組みが本格化し、データ活用への期待が高まる中、紙に代表されるアナログ情報をデジタル環境に取り組む手段として改めて注目を集めている。

 OCR(Optical Character Recognition:光学文字認識)は、米国で1920年代に特許出願された技術領域だ。日本では1968年、東芝がハガキなどを郵便番号から送付先別に振り分けるために日本初の国産OCRを開発した。国内でも既に50年以上の実績がある技術である。
 ただ日本企業がOCRを広く利用するようになったのは1990年以降である。それでも、認識精度などの課題から業種によっては、まだまだ普及率は低いとされる。

AIによる画像認識精度の向上とデータ活用ニーズとが合致

 そうした中、OCRが改めて注目されている理由の1つがAI(Artificial Intelligent:人工知能)技術を用いて認識精度を高めたAI-OCRの登場だ。手書き文字などを認識するための画像認識技術は、AI技術の中でも特に開発速度が速い分野であり、認識精度の向上に大きく寄与している。

 実際、2022年度にOCR市場の規模は、前年比106.3%の532億円だったが、そのうち汎用OCR市場が前年比100.5%の399億円で、ほぼ横ばいなのに対し、AI-OCR市場は前年比126.5%の132億円にまで伸びた(デロイトトーマツミック経済研究所調べ)。今後も2桁成長が続くという。

 技術の進歩と並行して、企業側のニーズも大きく変化した。少子高齢化に伴う人手不足に加え、DX(デジタルトランスフォーメーション)への取り組みが本格化したことで、紙をベースにした業務における労働生産性の改善や、コロナ禍以降の加速したリモートワークなど各種業務のデジタル化、データ分析に基づく意思決定といったニーズが再浮上してきた。

 業務のデジタル化への対応では、AI-OCRとRPA(Robotic Process Automation)ツールなどと組み合わせた自動化の推進が注目されている。

 例えば第一生命保険は、2016年から導入してきたRPAにAI-OCRを組み合わせることで2019年度末までに約700業務、延べ20万時間強の業務時間を削減。以後、対象業務を拡大している。さいたま市も、RPAとAI-OCRを組み合わせて手書き書類のデータ化を推進。2019年の実証実験では、高齢介護関連の受付入力業務を平均87.2%削減できる効果を確認している。

AI技術の適用で認識精度に加え認識対象の柔軟性も向上

 では、AI技術を適用したAI-OCRは従来のOCRから、どう進化しているのだろうか。

 AI技術は現在のニューラルネットワークやディープラーニング(Deep Learning:深層学習)につながる論文が2006年に発表され、第3次AIブームが起こった。以後、OCRにAIを活用する取り組みも急速に進み、画像認識に畳み込みニューラルネット(CNN)などの技術が適用されるようになった。2020年以降、各種のAI-OCRの製品/サービスが多数、展開されている。従来のOCRとの違いは大きく3つある(図1)。

図1:従来のOCRとAI-OCRの相違点

OCRとAI-OCRの違い1:認識精度

 認識精度について、OCRが「95%程度が上限」とされてきたのに対し、AI-OCRでは、95%を超え、高精度な製品/サービスでは99%以上を実現している。OCRが「人間が決めたルール」に基づいて文字(画像)を認識しているのに対し、AI-OCRは、認識対象の特徴や識別のポイントを学習し結果を導き出しているためだ。

 例えば、人間が決めたルールでは、文字の位置や切れ目がどこか、事前に登録した文字に近いかどうかなどに基づいて、事前登録した文字との違いをパターンマッチングなどのロジックで判断する。AI-OCRでは、文字列をディープラーニングなどで学習することで特徴や識別ポイントを抽出し、その特徴や識別ポイントに認識対象の文字列がマッチするかどうかで判断する。

 特に手書き文字の認識に有効だ。個人のクセが強かったり文字同士がつながっていたりすると、識別するパターン数が増えるため、OCRでは精度が出せなかった。特徴を自動抽出するAI-OCRでは、文字のかすれや、文字同士や罫線との重なり、取り消し線など、手書き特有の状況にも対応できるようになった。