TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025164271
公報種別
公開特許公報(A)
公開日
2025-10-30
出願番号
2024068099
出願日
2024-04-19
発明の名称
情報処理装置、文字認識方法、プログラム
出願人
株式会社PFU
代理人
個人
,
個人
主分類
G06V
30/412 20220101AFI20251023BHJP(計算;計数)
要約
【課題】準定型OCRの認識精度をより向上させること
【解決手段】情報処理装置は、帳票の画像データにおいて文字認識の対象とする第1の値を囲むユーザ指定座標を受け付ける操作受付部と、ユーザ指定座標の周囲の第1のキーワードを取得し、ユーザ指定座標と対応付けて学習データとして保存する学習データ取得部と、帳票の画像データを取得する取得部と、取得部が取得した画像データの全文認識結果から、予め設定されている項目定義に基づいて第2のキーワードと、項目定義により定義された1つ以上の第2の値を抽出する値抽出部と、第2の値の座標と、第2の値に対応付けられている第2のキーワードと同じ第1のキーワードであって、学習データで該第1のキーワードに対応付けられているユーザ指定座標との第1距離に基づいて、第2のキーワードの項目値とする第2の値を決定する値決定部と、を有する。
【選択図】図14
特許請求の範囲
【請求項1】
OCRによる文字認識を行う情報処理装置であって、
帳票の画像データにおいて文字認識の対象とする第1の値を囲むユーザ指定座標を受け付ける操作受付部と、
前記ユーザ指定座標の周囲の第1のキーワードを取得し、前記ユーザ指定座標と対応付けて学習データとして保存する学習データ取得部と、
帳票の画像データを取得する取得部と、
前記取得部が取得した画像データの全文認識結果から、予め設定されている項目定義に基づいて第2のキーワードと、前記項目定義により定義された1つ以上の第2の値を抽出する値抽出部と、
前記第2の値の座標と、前記第2の値に対応付けられている前記第2のキーワードと同じ前記第1のキーワードであって、前記学習データで該第1のキーワードに対応付けられている前記ユーザ指定座標との第1距離に基づいて、前記第2のキーワードの項目値とする前記第2の値を決定する値決定部と、
を有する情報処理装置。
続きを表示(約 2,700 文字)
【請求項2】
前記値決定部は、前記第2の値の座標と、前記第2の値に対応付けられている前記第2のキーワードの座標との第2距離に基づいて、前記第2のキーワードの項目値とする前記第2の値を決定する請求項1に記載の情報処理装置。
【請求項3】
前記値決定部は、前記第2の値を囲む矩形のサイズと、
前記第2の値に対応付けられている前記第2のキーワードと同じ前記第1のキーワードであって、前記学習データで該第1のキーワードに対応付けられている前記ユーザ指定座標が囲む前記第1の値のサイズとの差に基づいて、前記第2のキーワードの項目値とする前記第2の値を決定する請求項1に記載の情報処理装置。
【請求項4】
前記第2の値の座標と、前記第2の値に対応付けられている前記第2のキーワードと同じ前記第1のキーワードであって、前記学習データで該第1のキーワードに対応付けられている前記ユーザ指定座標との第1距離、
前記第2の値の座標と、前記第2の値に対応付けられている前記第2のキーワードの座標との第2距離、
前記第2の値を囲む矩形のサイズと、前記第2の値に対応付けられている前記第2のキーワードと同じ前記第1のキーワードであって、前記学習データで該第1のキーワードに対応付けられている前記ユーザ指定座標が囲む前記第1の値のサイズとの差、の少なくとも1つに基づいて、前記第2の値を前記第2のキーワードの項目値とすることの確からしさに関するスコアを算出するスコア算出部を有し、
前記値抽出部が抽出した前記第2の値のなかに、前記スコアが基準を満たす前記第2の値がない場合、
前記値決定部は、前記全文認識結果に含まれる全ての前記第2の値の座標と、前記学習データに含まれる全ての前記第1の値の前記ユーザ指定座標との距離、及び、
前記全文認識結果に含まれる全ての前記第2の値を囲む矩形のサイズと、前記学習データに含まれる全ての前記第1の値の領域のサイズとの差、に基づいて、前記第2の値と前記ユーザ指定座標のセットを特定し、
特定した前記ユーザ指定座標と前記学習データにおいて対応付けられている前記キーワードの項目値を、特定した前記第2の値に決定する請求項1に記載の情報処理装置。
【請求項5】
OCRによる文字認識を行う情報処理装置であって、
明細表を含む画像データに対しOCRを行い、予め設定されている項目定義に基づいて前記明細表の項目名を取得する文字認識部と、
前記明細表の1行目にある各項目値を囲むユーザ指定座標を受け付ける操作受付部と、
前記ユーザ指定座標と前記明細表の項目名を対応付けて保存する学習データ取得部と、
明細表を含む画像データを取得する取得部と、を有し、
前記文字認識部は前記明細表の横罫線を検出し、
前記取得部が取得した画像データの認識結果のうち前記ユーザ指定座標の上端を前記明細表の上端に、前記横罫線のうち最も下方にある横罫線を前記明細表の下端に決定し、
前記認識結果のうち前記明細表の上端と下端の間にある文字列に基づいて上端と下端の間を行に分割する明細項目抽出部と、
を有する情報処理装置。
【請求項6】
前記明細項目抽出部は、前記明細表の上端と下端の間にある文字列が前記明細表の高さ方向に重なっている場合に、重なっている文字列のうち最も上にある文字列から最も下にある文字列までを1行とみなすことで、前記明細表の上端と下端の間を1つ以上の行に分割する請求項5に記載の情報処理装置。
【請求項7】
前記明細項目抽出部は、前記明細表の1行目にある各項目値について受け付けた前記ユーザ指定座標の幅方向の座標に基づいて、前記明細表を列に区切る請求項5又は6に記載の情報処理装置。
【請求項8】
OCRによる文字認識を行う情報処理装置であって、
帳票の画像データの全文認識結果から取得される第1の項目名と前記第1の項目名の座標を対応付けてレイアウトの識別辞書として保存する辞書作成部と、
前記画像データにおいて文字認識の対象とする第1の値の領域のユーザ指定座標を受け付ける操作受付部と、
前記ユーザ指定座標の周囲にある第2の項目名と前記ユーザ指定座標とを対応付けて学習データとして保存する学習データ取得部と、
帳票の画像データを取得する取得部と、
前記取得部が取得した画像データの認識結果に含まれる文字列のうち、前記識別辞書に含まれる前記第1の項目名と部分一致する前記文字列の座標と、前記第1の項目名の座標との距離に基づいて、前記取得部が取得した画像データのレイアウトに適合する前記識別辞書を特定するレイアウト識別部と、
前記画像データのレイアウトに適合する前記識別辞書に対応付けられている前記学習データを用いて文字認識する文字認識部と、
を有する情報処理装置。
【請求項9】
前記レイアウト識別部は、前記取得部が取得した画像データの認識結果に含まれる文字列のうち、前記識別辞書に含まれる前記第1の項目名と一致する文字数を前記距離の重み付けに使用して、該距離を算出する請求項8に記載の情報処理装置。
【請求項10】
情報処理装置がOCRにより文字認識を行う認識方法であって、
操作受付部が、帳票の画像データにおいて文字認識の対象とする第1の値を囲むユーザ指定座標を受け付けるステップと、
学習データ取得部が、前記ユーザ指定座標の周囲の第1のキーワードを取得し、前記ユーザ指定座標と対応付けて学習データとして保存するステップと、
取得部が、帳票の画像データを取得するステップと、
値抽出部が、前記取得部が取得した画像データの全文認識結果から、予め設定されている項目定義に基づいて第2のキーワードと、前記項目定義により定義された1つ以上の第2の値を抽出するステップと、
値決定部が、前記第2の値の座標と、前記第2の値に対応付けられている前記第2のキーワードと同じ前記第1のキーワードであって、前記学習データで該第1のキーワードに対応付けられている前記ユーザ指定座標との第1距離に基づいて、前記第2のキーワードの項目値とする前記第2の値を決定するステップと、
を有する認識方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、情報処理装置、文字認識方法、及びプログラムに関する。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
帳票から値を抽出するOCR(Optical Character Recognition/Reader)技術は、主に定型OCRと準定型OCRの2つに分けられる。定型OCRは、固定されたレイアウトを持つ帳票の固定された領域に対しOCRによる文字認識を行う技術である。準定型OCRは、固定された領域に文字認識は行わず、帳票全体の全文認識結果から、予め定義された項目名を抽出し、一定のルールにしたがって項目の付近にある項目値を抽出する技術である。準定型OCRは、レイアウトが異なる準定型帳票も認識できる。しかし、確実に読み取りたい領域が定義されている定型OCRと比較して、認識精度が低下する傾向がある。
【0003】
OCRの認識精度を向上させる技術が知られている(例えば、特許文献1参照)。特許文献1には、帳票画像データにある表中の任意の枠がドラッグ操作に応じて指定された場合、指定された箇所の座標値を検出し、当該座標値から枠領域を抽出する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2013-250927号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来の技術は、OCRの認識精度を向上させることができない場合がある。例えば、従来の技術では、指定された座標に枠領域がなければ認識結果を抽出できない。
【0006】
本発明は、上記課題に鑑み、OCRの認識精度をより向上させることを課題とする。
【課題を解決するための手段】
【0007】
本発明は、OCRによる文字認識を行う情報処理装置であって、帳票の画像データにおいて文字認識の対象とする第1の値を囲むユーザ指定座標を受け付ける操作受付部と、前記ユーザ指定座標の周囲の第1のキーワードを取得し、前記ユーザ指定座標と対応付けて学習データとして保存する学習データ取得部と、帳票の画像データを取得する取得部と、前記取得部が取得した画像データの全文認識結果から、予め設定されている項目定義に基づいて第2のキーワードと、前記項目定義により定義された1つ以上の第2の値を抽出する値抽出部と、前記第2の値の座標と、前記第2の値に対応付けられている前記第2のキーワードと同じ前記第1のキーワードであって、前記学習データで該第1のキーワードに対応付けられている前記ユーザ指定座標との第1距離に基づいて、前記第2のキーワードの項目値とする前記第2の値を決定する値決定部と、を有する。
【発明の効果】
【0008】
OCRの認識精度をより向上させることができる。
【図面の簡単な説明】
【0009】
定型OCRと準定型OCRのメリット、デメリットを比較して示す図である。
不都合が生じうる帳票の例を示す図である。
通常項目の改善を説明する図である。
ユーザが設定したユーザ指定座標を示す図の一例である。
図4の帳票に対する準定型OCRによる全文認識結果の一例を示す図である。
ユーザ指定座標と、全文認識結果から抽出された明細項目を示す図の一例である。
同じレイアウトだが、印字位置が異なる2つの帳票を示す図の一例である。
OCR処理システムの全体構成を例示する図である。
OCR処理装置の一例のハードウェア構成を示す図である。
項目定義が持つ情報の一例を示す図である。
準定型OCR認識を説明する図である。
認識結果の確認、修正、学習を説明する図である。
OCR処理装置の機能をブロックにわけて説明する機能ブロック図の一例である。
通常項目の改善を含め、OCR処理装置2が行う処理を説明するフローチャート図の一例である。
処理(1)について説明する図である。
項目定義におけるキーワード、Value抽出条件、及び、結果候補の抽出ルールを抜粋した情報を示す図の一例である。
抽出されたキーワードとValueについて説明する図である。
認識結果候補の抽出方法を説明する図である。
キーワード特徴スコア及び位置スコアの算出方法を説明する図である。
OCR処理装置の機能をブロックにわけて説明する機能ブロック図の一例である。
明細表の結果修正画面及びユーザ指定座標登録画面を示す図の一例である。
学習データの一例を示す図である。
OCR処理装置が明細項目を取得する処理を説明するフローチャート図の一例である。
明細行の抽出を説明する図である。
y座標が重複する矩形枠の座標の結合を説明する図である。
抽出された明細列を示す図の一例である。
比較技術において、行抽出及びヘッダ抽出の方法を説明する図である。
OCR処理装置の機能をブロックにわけて説明する機能ブロック図の一例である。
入力文書に対しユーザが指定したユーザ指定座標を示す図の一例である。
識別辞書の一例を示す図である。
学習データの一例を示す図である。
OCR処理装置が識別辞書と学習データを用いて帳票識別処理を改善する処理を説明するフローチャート図の一例である。
全文認識結果の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明を実施するための形態の一例として、OCR処理装置とOCR処理装置が行う文字認識方法について図面を参照しながら説明する。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
株式会社PFU
情報処理装置、文字認識方法、プログラム
11日前
株式会社PFU
媒体搬送装置
3日前
株式会社PFU
媒体搬送装置
11日前
株式会社PFU
媒体搬送装置
27日前
個人
詐欺保険
27日前
個人
縁伊達ポイン
27日前
個人
5掛けポイント
3日前
個人
RFタグシート
14日前
個人
ペルソナ認証方式
11日前
個人
QRコードの彩色
1か月前
個人
地球保全システム
1か月前
個人
情報処理装置
6日前
個人
自動調理装置
13日前
個人
表変換編集支援システム
2か月前
個人
農作物用途分配システム
26日前
個人
残土処理システム
1か月前
個人
インターネットの利用構造
10日前
個人
タッチパネル操作指代替具
20日前
個人
知的財産出願支援システム
1か月前
個人
携帯端末障害問合せシステム
19日前
個人
行動時間管理システム
2か月前
個人
パスワード管理支援システム
2か月前
個人
スケジュール調整プログラム
19日前
株式会社キーエンス
受発注システム
1か月前
個人
エリアガイドナビAIシステム
11日前
個人
海外支援型農作物活用システム
1か月前
株式会社キーエンス
受発注システム
1か月前
個人
AIキャラクター制御システム
2か月前
株式会社キーエンス
受発注システム
1か月前
個人
食品レシピ生成システム
1か月前
個人
システム及びプログラム
1か月前
株式会社ケアコム
項目選択装置
6日前
個人
音声対話型帳票生成支援システム
2か月前
エッグス株式会社
情報処理装置
20日前
個人
SaaS型勤務調整支援システム
2か月前
個人
人格進化型対話応答制御システム
2か月前
続きを見る
他の特許を見る