TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024174274
公報種別
公開特許公報(A)
公開日
2024-12-16
出願番号
2023092013
出願日
2023-06-04
発明の名称
文字認識装置
出願人
株式会社SEKT
代理人
個人
主分類
G06V
30/14 20220101AFI20241209BHJP(計算;計数)
要約
【課題】帳票の所定の範囲に記入された認識対象項目を精度よく取得する文字認識装置を提供する。
【解決手段】文字認識装置10の情報取得部22、31は、基準帳票および処理対象帳票の画像全体に画像認識を行い、枠座標及び文字列を取得する。第1ガイド設定部23は枠内に文字が認識された基準帳票の枠を基準ガイド枠に設定し、第1範囲設定部25は基準帳票の認識対象項目の記入範囲を基準エントリ範囲に設定する。第2ガイド設定部32は、枠内に文字が認識された処理対象帳票の枠のうち、基準ガイド枠の文字列と同じ文字列が記載され、且つ基準ガイド枠と比較して枠縦横比同士の比が所定範囲内である枠を処理対象ガイド枠に設定する。第2範囲設定部35は、両ガイド枠の相対関係に基づき基準エントリ範囲に対応する処理対象帳票の範囲を処理対象エントリ範囲として設定する。項目取得部36は処理対象エントリ範囲に文字認識を行う。
【選択図】図1
特許請求の範囲
【請求項1】
枠線および文字で構成された帳票のうち、所定の範囲に記入された認識対象項目を取得する文字認識装置であって、
任意の文字を記入するための記入枠が未記入である原本の帳票を基準帳票と定義し、前記記入枠に任意の文字が記入された帳票を処理対象帳票と定義し、枠の幅と高さとの比率を枠縦横比と定義すると、
前記基準帳票の画像全体に枠線および文字を認識するための画像認識を行い、枠座標および文字列を取得する第1情報取得部と、
前記基準帳票の画像認識において枠内に文字が認識された枠を基準ガイド枠として設定する第1ガイド設定部と、
前記基準帳票のうち前記認識対象項目を記入するための範囲を基準エントリ範囲として設定する第1範囲設定部と、
前記処理対象帳票の画像全体に画像認識を行い、枠座標および枠内の文字列を取得する第2情報取得部と、
前記処理対象帳票の画像認識において枠内に文字が認識された枠のうち、前記基準ガイド枠の文字列と同じ文字列が記載され、且つ、当該基準ガイド枠と比較して枠縦横比同士の比が所定範囲内である枠が1つのみの場合、当該枠を処理対象ガイド枠として設定する第2ガイド設定部と、
前記基準ガイド枠と前記処理対象ガイド枠との相対関係に基づき、前記基準エントリ範囲に対応する前記処理対象帳票の範囲を特定し、当該範囲を処理対象エントリ範囲として設定する第2範囲設定部と、
前記処理対象帳票の画像のうち前記処理対象エントリ範囲の部分に文字認識を行い、前記認識対象項目を取得する項目取得部と、
を備える文字認識装置。
続きを表示(約 1,000 文字)
【請求項2】
前記文字認識装置は、
前記基準帳票の画像認識にて認識された枠のうち、前記基準ガイド枠以外の枠を基準ガイド候補枠として設定するガイド候補設定部と、
前記基準ガイド枠と前記処理対象ガイド枠との相対関係に基づき、前記処理対象帳票上で前記基準ガイド候補枠に相当する理論上の枠を算出し、当該理論上の枠との関係において、前記処理対象帳票の画像認識にて認識された実際の枠のうち所定の一致条件を満たす枠を前記処理対象ガイド枠として設定するとともに、当該枠に対応する前記基準ガイド候補枠を前記基準ガイド枠として設定する昇格判定部と、
をさらに備える、請求項1に記載の文字認識装置。
【請求項3】
前記基準エントリ範囲からの高さ方向の距離が所定値よりも大きい前記基準ガイド枠が存在するか否かの判定を、距離判定と定義すると、
前記第2範囲設定部は、
前記距離判定が肯定される場合、前記基準エントリ範囲に高さ方向で最も近い前記基準ガイド枠と、当該基準ガイド枠に対応する前記処理対象ガイド枠との相対関係に基づき、前記処理対象エントリ範囲を特定し、
前記距離判定が否定される場合、前記基準エントリ範囲に幅方向で最も近い前記基準ガイド枠と、当該基準ガイド枠に対応する前記処理対象ガイド枠との相対関係に基づき、前記処理対象エントリ範囲を特定する、請求項1に記載の文字認識装置。
【請求項4】
前記基準エントリ範囲の高さが前記基準帳票の枠の高さ一杯に設定されることを、枠に属すると定義し、当該属する枠を所属枠と定義し、前記基準エントリ範囲が枠に属し且つ前記所属枠に対応する前記処理対象ガイド枠が存在するか否かの判定を所属枠判定と定義すると、
前記第2範囲設定部は、
前記所属枠判定が肯定される場合、前記所属枠と当該所属枠に対応する前記処理対象ガイド枠との相対関係に基づき、前記処理対象帳票上で前記基準エントリ範囲に相当する範囲を算出し、当該範囲を前記処理対象エントリ範囲として設定し、
前記所属枠判定が否定される場合、前記基準ガイド枠と前記処理対象ガイド枠との相対関係に基づき、前記処理対象帳票上で前記基準エントリ範囲に相当する範囲を算出し、当該範囲を前記処理対象エントリ範囲として設定する、請求項1に記載の文字認識装置。
発明の詳細な説明
【技術分野】
【0001】
本発明は、枠線および文字で構成された帳票のうち、所定の範囲に記入された認識対象項目を取得する文字認識装置に関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
近年、帳票に記載された文字列を文字認識によりテキスト化する技術が活用されている。この技術では、処理対象帳票の画像の文字列部分を特定し、当該文字列部分を切り出した画像に文字認識を実施する事が一般的である。特許文献1には、帳票の画像から、第1方向に配列された枠の集まりである第1グループ矩形と、第2方向に配列された枠の集まりである第2グループ矩形との交差範囲を記入枠として認識し、当該記入枠内の画像を切り出して文字認識を行う技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
特開2023-36833号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、文字列部分を切り出すにあたり、文字列以外の枠線情報や、要求対象範囲外の文字列がノイズとして混じり込まないように該当文字列部分だけを切り出せないと、文字認識精度に大きく影響する事が課題となっている。
【0005】
また、帳票が定型様式であったとしても、イメージ化された処理対象帳票の各項目が帳票原本と同じ位置に存在しているとは限らない。多くの処理対象帳票はスキャナ等を使用してイメージ化されたものであり、イメージ化過程において帳票原本と比べて余白の設定や縮尺などが異なる場合が多いことや、イメージ化する処理対象帳票自体が帳票原本をコピーする等して作成された複製品であるからである。そのため、処理対象帳票の画像に対して帳票原本と同じ座標位置の部分を自動的に切り出すことは実用的ではない。
【0006】
また、例えば特許文献1に開示されているように処理対象帳票の画像に対して枠線を認識する処理を行い、枠に基づき認識対象項目の記載部分の特定を試みることが考えられる。しかし、どの枠が認識対象項目の記載部分に相当する枠であるのか判定が正確にはできない。さらに、枠認識や文字認識の処理特性上、処理対象帳票に対して常に同じ枠および同じ文字列が認識されるとは限らず、イメージ化の状態などに応じて一部の枠線が認識されなかったり、文字が誤認識されたりする。したがって、常に認識対象項目の記載部分に相当する枠が検出されているとは限らない。
【0007】
本発明の目的は、帳票の所定の範囲に記入された認識対象項目を精度よく取得する文字認識装置を提供することにある。
【課題を解決するための手段】
【0008】
本発明にかかる文字認識装置は、第1情報取得部と、第1ガイド設定部と、第1範囲設定部と、第2情報取得部と、第2ガイド設定部と、第2範囲設定部と、項目取得部とを備える。
ここで、任意の文字を記入するための記入枠が未記入である原本の帳票を基準帳票と定義し、記入枠に任意の文字が記入された帳票を処理対象帳票と定義し、枠の幅と高さとの比率を枠縦横比と定義する。
【0009】
第1情報取得部は、基準帳票の画像全体に枠線および文字を認識するための画像認識を行い、枠座標および文字列を取得する。第1ガイド設定部は、基準帳票の画像認識において枠内に文字が認識された枠を基準ガイド枠として設定する。第1範囲設定部は、基準帳票のうち認識対象項目を記入するための範囲を基準エントリ範囲として設定する。
【0010】
第2情報取得部は、処理対象帳票の画像全体に画像認識を行い、枠座標および枠内の文字列を取得する。第2ガイド設定部は、処理対象帳票の画像認識において枠内に文字が認識された枠のうち、基準ガイド枠の文字列と同じ文字列が記載され、且つ、当該基準ガイド枠と比較して枠縦横比同士の比が所定範囲内である枠が1つのみの場合、当該枠を処理対象ガイド枠として設定する。第2範囲設定部は、基準ガイド枠と処理対象ガイド枠との相対関係に基づき、基準エントリ範囲に対応する処理対象帳票の範囲を特定し、当該範囲を処理対象エントリ範囲として設定する。項目取得部は、処理対象帳票の画像のうち処理対象エントリ範囲の部分に文字認識を行い、認識対象項目を取得する。
(【0011】以降は省略されています)
特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する
関連特許
株式会社SEKT
文字認識装置
1か月前
個人
物品
1か月前
個人
認証システム
1か月前
個人
自動精算システム
4日前
個人
RFタグ読取装置
13日前
個人
自動精算システム
1か月前
個人
売買システム
10日前
個人
保証金管理システム
1か月前
個人
鑑定証明システム
1か月前
個人
管理サーバ
24日前
個人
救急搬送システム
1か月前
個人
市場受発注システム
2日前
キヤノン株式会社
印刷装置
1か月前
日本精機株式会社
車両用表示装置
12日前
日本精機株式会社
車両用表示装置
12日前
個人
VRによる人体各部位の立体化
24日前
井関農機株式会社
ロボット作業車両
4日前
個人
生成AIとの常時接続システム
1か月前
株式会社MRC
集客システム
1か月前
個人
技術マッチングシステム
2か月前
株式会社SEKT
文字認識装置
1か月前
トヨタ自動車株式会社
分析装置
1か月前
個人
未来型家系図構築システム
1か月前
キヤノン株式会社
情報処理装置
26日前
株式会社COLORS
表示装置
1か月前
トヨタ自動車株式会社
推定装置
1か月前
個人
コンテンツ開示順位判定システム
1か月前
キヤノン株式会社
印刷管理装置
1か月前
株式会社ネットブリッジ
展示販売装置
2か月前
キヤノン電子株式会社
業務管理システム
1か月前
ローム株式会社
ソース機器
1か月前
トヨタ自動車株式会社
表認識装置
1か月前
個人
文字入力方法、文字入力プログラム
2か月前
ミサワホーム株式会社
プログラム
1か月前
トヨタ自動車株式会社
記号識別方法
26日前
個人
販売支援システム
4日前
続きを見る
他の特許を見る