文字認識技術とは、手書き文字や印刷文字を識別する技術のことです。OCR(Optical Character Recognition)とも呼ばれます。

 

文字認識技術とは

文字認識技術とは、手書き文字や印刷文字を識別する技術のことです。OCR(Optical Character Recognition)とも呼ばれます。 画像として読み込んだデータをテキストデータに変換することができます。
文字認識技術には、オフライン文字認識とオンライン文字認識の2種類があります。
オフライン文字認識では文字の形状から静的に文字を識別します。
オンライン文字認識では書き順など、動的な過程も参考に文字を識別します。OCRはオフライン文字認識です。
もともとは視覚障碍者のための文字認識技術として発展しました。文字認識技術自体は新しい技術ではなく、郵便局における仕分け作業などで用いられています。
文字認識では、まず入力画像から文字領域を抽出します。そして、行を切り出し、文字を切り出して1文字ずつ識別していきます。
識別処理では、正規化により文字の大きさをそろえ、文字中の線の向きなどの特徴を抽出してから、データベース中の文字とマッチングさせます。
手書き文字の認識など、難しいとされる文字認識もありましたが、ディープラーニング技術の発展に伴い画像認識技術が向上したことで、従来よりも適用範囲が広がっています。
文字認識技術は、帳票整理などの事務作業効率化だけでなく、看板などの情景画像中の文字の翻訳などに活用されます。

文字認識のフロー

(1) 入力画像から文字領域を抽出。
(2) 文字領域中から行を切り出す。
(3) 切り出した行から文字を切り出す。
(4) 1文字ずつ文字の識別する。
 (1) 文字の大きさをそろえる(正規化)。
 (2) 文字中の線の向きなど、文字の特徴を抽出する。
 (3) データベースに登録済みの文字とマッチングする。

概念図

商品/デモ

作成中