TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025117494
公報種別
公開特許公報(A)
公開日
2025-08-12
出願番号
2024061921
出願日
2024-04-08
発明の名称
文書画像処理システム
出願人
ネットスマイル株式会社
代理人
個人
主分類
G06Q
10/10 20230101AFI20250804BHJP(計算;計数)
要約
【課題】 文書画像内の複数の文字列における特定の関連性を有する文字列集合についての抽出ミスを低減する。
【解決手段】 文書画像処理部22は、文書画像に含まれる複数の文字列を文字認識処理で抽出するとともに、当該複数の文字列のそれぞれの位置を特定する。データ抽出部24は、その複数の文字列のうち、特定の関連性を有する文字列集合を抽出する。文書データ管理部27は、文書画像ごとに、文書画像で抽出された文字列集合および文字列集合における文字列の位置データを少なくとも文書データベース12に蓄積していく。抽出データ検証部25は、文書データベースを使用して、処理対象の文書画像に対する類似文書画像についての文字列集合に基づいて、処理対象の文書画像から抽出された文字列集合の正当性を検証する。
【選択図】 図1
特許請求の範囲
【請求項1】
文書画像に含まれる複数の文字列を文字認識処理で抽出するとともに、当該複数の文字列のそれぞれの位置を特定する文書画像処理部と、
前記複数の文字列のうち、特定の関連性を有する文字列集合を抽出するデータ抽出部と、
前記文書画像ごとに、前記文書画像で抽出された前記文字列集合を少なくとも文書データベースに蓄積していく文書データ管理部と、
前記文書データベースを使用して、処理対象の文書画像に対する類似文書画像についての前記文字列集合に基づいて、前記処理対象の文書画像から抽出された前記文字列集合の正当性を検証する抽出データ検証部と、
を備えることを特徴とする文書画像処理システム。
続きを表示(約 2,800 文字)
【請求項2】
前記文書画像処理部は、前記文書画像の文書ベクトルを生成し、
前記文書データ管理部は、前記文書画像ごとに、前記文字列集合とともに前記文書ベクトルを前記文書データベースに蓄積していき、
前記類似文書画像は、前記文書データベースにおいて、前記処理対象の文書画像の文書ベクトルに対する類似度に基づいて検出されること、
を特徴とする請求項1記載の文書画像処理システム。
【請求項3】
前記抽出データ検証部は、前記類似文書画像についての前記文字列集合に基づいて、前記処理対象の文書画像から抽出された前記文字列集合に、前記処理対象の文書画像から抽出されるべき文字列集合がすべて含まれているか否かを検証することを特徴とする請求項1記載の文書画像処理システム。
【請求項4】
前記文書データ管理部は、前記文書画像ごとに、前記文字列集合とともに前記文字列集合における文字列の位置データを前記文書データベースに蓄積していき、
前記抽出データ検証部は、前記処理対象の文書画像から抽出された前記文字列集合のうち、正当ではないと判定された文字列集合に対して、前記類似文書画像についての前記文字列集合および前記位置データに基づいて前記複数の文字列から選択される文字列で自動的に補正し、
前記文書データ管理部は、前記文書画像で抽出された前記文字列集合として、自動的に補正された前記文字列集合を前記文書データベースに蓄積すること、
を特徴とする請求項1記載の文書画像処理システム。
【請求項5】
表示装置と、
入力装置と、
抽出データ手動補正部とをさらに備え、
前記抽出データ手動補正部は、(a)抽出された前記文字列集合をユーザーに前記表示装置で呈示し、(b)正当ではないとユーザーにより判断された前記文字列集合に対する補正指示を示すユーザー操作が前記入力装置で検出されると、前記ユーザー操作に従って前記文字列集合を補正し、
前記文書データ管理部は、前記文書画像で抽出された前記文字列集合として、前記ユーザー操作に従って補正された前記文字列集合を前記文書データベースに蓄積すること、
を特徴とする請求項1記載の文書画像処理システム。
【請求項6】
前記特定の関連性は、属性ラベルと属性値という関連性であり、
前記文字列集合は、前記属性ラベルの文字列および前記属性値の文字列を含み、
前記抽出データ手動補正部は、(a)前記文書画像を前記表示装置に表示するとともに、前記属性ラベルの文字列と前記属性値の文字列との対のリストを前記表示装置に表示し、(b)前記対のリストにおいて前記ユーザーによりユーザー操作で指定された前記対を特定し、(c)表示されている前記文書画像において前記ユーザーによりユーザー操作で指定された画像位置を特定し、(d)前記文書画像処理部により特定された前記複数の文字列の位置に基づいて、前記画像位置に対応する文字列を特定し、(e)特定した前記文字列で、前記対における前記属性値の文字列を更新すること、
を特徴とする請求項5記載の文書画像処理システム。
【請求項7】
複数の文書タイプをそれぞれ有する1組の複数の文書画像における各文書画像の文書タイプを判定する文書タイプ判定部をさらに備え、
前記特定の関連性は、ある属性項目についての属性ラベルと属性値という関連性であり、
前記文字列集合は、前記属性ラベルの文字列および前記属性値の文字列を含み、
前記文書画像処理部は、前記1組の複数の文書画像のそれぞれの文書画像に含まれる複数の文字列を文字認識処理で抽出するとともに、当該複数の文字列のそれぞれの位置を特定し、
前記抽出データ手動補正部は、(a)前記属性項目ごとに、前記複数の文書画像にそれぞれ含まれる当該属性項目に対応する前記属性値の文字列を特定し、(b)前記複数の文書画像に対応して特定された複数の前記属性値の文字列が互いに一致しているか否かを判定し、(c)前記複数の前記属性値の文字列が互いに一致しているか否かの判定結果を前記表示装置に表示すること、
を特徴とする請求項5記載の文書画像処理システム。
【請求項8】
前記抽出データ手動補正部は、(a)前記属性項目ごとに特定した前記複数の属性値の文字列のリストを前記表示装置に表示し、(b)前記複数の属性値の文字列のリストにおいて前記ユーザーによりユーザー操作で指定された属性値の文字列に対応する文書画像を特定し、(c)特定した前記文書画像を前記表示装置に表示するとともに、特定した前記文書画像についての前記属性ラベルの文字列と前記属性値の文字列との対のリストを前記表示装置に表示し、(d)前記対のリストにおいて前記ユーザーによりユーザー操作で指定された前記対を特定し、(e)表示されている前記文書画像において前記ユーザーによりユーザー操作で指定された画像位置を特定し、(f)前記文書画像処理部により特定された前記複数の文字列の位置に基づいて、前記画像位置に対応する文字列を特定し、(e)特定した前記文字列で、前記対における前記属性値の文字列を更新すること、
を特徴とする請求項7記載の文書画像処理システム。
【請求項9】
前記データ抽出部は、前記複数の文字列のそれぞれの文字列の文字列ベクトルをノードとし前記関連性を前記ノード間の結合とした、機械学習されたグラフニューラルネットワークを使用して、前記特定の関連性を有する文字列集合を抽出することを特徴とする請求項1記載の文書画像処理システム。
【請求項10】
前記文書画像の文書タイプを判定する文書タイプ判定部をさらに備え、
前記文書データ管理部は、前記文書画像ごとに、前記文字列集合および前記文書ベクトルとともに、前記文書タイプを前記文書データベースに蓄積していき、
前記文書タイプ判定部は、(a)前記文書データベースで前記類似文書画像の文書タイプを特定し、(b)特定した前記文書タイプを前記処理対象の文書画像の文書タイプとし、
前記データ抽出部は、前記文書タイプごとに機械学習された学習器で、前記特定の関連性を有する文字列集合を抽出し、
前記抽出データ検証部は、当該類似文書画像についての前記文字列集合に基づいて、前記処理対象の文書画像から抽出された前記文字列集合の正当性を検証すること、
を特徴とする請求項2記載の文書画像処理システム。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、文書画像処理システムに関するものである。
続きを表示(約 1,500 文字)
【背景技術】
【0002】
あるシステムは、(a)文書画像内の文字画像集合を抽出し、その文字画像集合のテキストデータ(文字列)を生成し、(b)文字画像集合のテキストデータに対応する特徴ベクトルを生成し、(c)そのテキストデータから、特定属性についての属性ラベル候補および属性値候補を検出し、それらのペアをペア候補とする。その際、文字画像集合のテキストデータの特徴ベクトルに基づいて属性ラベル候補が検出され、例えば両者の関連度に基づいて、属性ラベルと属性値とのペアが特定される(例えば特許文献1参照)。これにより、テンプレートデータを使用せずに、ある属性の属性値が正確に特定される。
【先行技術文献】
【特許文献】
【0003】
特開2022-178723号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述のシステムでは、関連度に基づいて、文書画像内の複数の文字列のうちの、属性ラベルと、その属性ラベルに対応する属性値とのペアが抽出される。そのため、関連度が正確に導出されれば、不適切なペアが抽出されることはないが、不定形の(任意の)様々なレイアウトの文書画像から属性ラベルと属性値とのペアを抽出する場合、ペアの抽出ミス(抽出されるべきペアの不抽出など)が発生する可能性がある。
【0005】
本発明は、上記の問題に鑑みてなされたものであり、文書画像内の複数の文字列における特定の関連性を有する文字列集合についての抽出ミスを低減する文書画像処理システムを得ることを目的とする。
【課題を解決するための手段】
【0006】
本発明に係る文書画像処理システムは、文書画像に含まれる複数の文字列を文字認識処理で抽出するとともに、当該複数の文字列のそれぞれの位置を特定する文書画像処理部と、その複数の文字列のうち、特定の関連性を有する文字列集合を抽出するデータ抽出部と、文書画像ごとに、文書画像で抽出された文字列集合を少なくとも文書データベースに蓄積していく文書データ管理部と、文書データベースを使用して、処理対象の文書画像に対する類似文書画像についての文字列集合に基づいて、処理対象の文書画像から抽出された文字列集合の正当性を検証する抽出データ検証部とを備える。
【0007】
本発明に係る文書画像処理方法は、文書画像に含まれる複数の文字列を文字認識処理で抽出するとともに、当該複数の文字列のそれぞれの位置を特定するステップと、その複数の文字列のうち、特定の関連性を有する文字列集合を抽出するステップと、文書画像ごとに、文書画像で抽出された文字列集合を少なくとも文書データベースに蓄積していくステップと、文書データベースを使用して、処理対象の文書画像に対する類似文書画像についての文字列集合に基づいて、処理対象の文書画像から抽出された文字列集合の正当性を検証するステップとを備える。
【0008】
本発明に係る文書画像処理プログラムは、コンピュータを、上記の文書画像処理部、上記のデータ抽出部、上記の文書データ管理部、および上記の抽出データ検証部として機能させる。
【発明の効果】
【0009】
本発明によれば、文書画像内の複数の文字列における特定の関連性を有する文字列集合についての抽出ミスを低減する文書画像処理システムが得られる。
【0010】
本発明の上記又は他の目的、特徴および優位性は、添付の図面とともに以下の詳細な説明から更に明らかになる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
対話装置
2か月前
個人
裁判のAI化
27日前
個人
情報処理装置
2か月前
個人
フラワーコートA
6日前
個人
情報処理システム
1か月前
個人
記入設定プラグイン
1か月前
個人
情報処理装置
1か月前
個人
検査システム
1か月前
個人
介護情報提供システム
13日前
個人
設計支援システム
19日前
個人
設計支援システム
19日前
キヤノン電子株式会社
携帯装置
1か月前
個人
情報入力装置
2か月前
株式会社サタケ
籾摺・調製設備
1か月前
個人
不動産売買システム
1か月前
株式会社カクシン
支援装置
22日前
個人
物価スライド機能付生命保険
2か月前
個人
備蓄品の管理方法
1か月前
個人
マイホーム非電子入札システム
2か月前
個人
アンケート支援システム
8日前
サクサ株式会社
中継装置
9日前
サクサ株式会社
中継装置
1か月前
個人
ジェスチャーパッドのガイド部材
12日前
株式会社BONNOU
管理装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
キヤノン電子株式会社
名刺管理システム
1か月前
株式会社寺岡精工
システム
12日前
東洋電装株式会社
操作装置
1か月前
東洋電装株式会社
操作装置
1か月前
アスエネ株式会社
排水量管理方法
1か月前
ホシデン株式会社
タッチ入力装置
1か月前
株式会社東芝
電子機器
1か月前
株式会社アジラ
移動方向推定装置
7日前
株式会社ワコム
電子消去具
1か月前
個人
リテールレボリューションAIタグ
5日前
続きを見る
他の特許を見る