TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024165401
公報種別
公開特許公報(A)
公開日
2024-11-28
出願番号
2023081573
出願日
2023-05-17
発明の名称
文字認識装置及びプログラム
出願人
大日本印刷株式会社
代理人
個人
,
個人
,
個人
主分類
G06V
30/14 20220101AFI20241121BHJP(計算;計数)
要約
【課題】文書画像に含まれる文字列を適切にグルーピングするための工夫をした文字認識装置及びプログラムを提供する。
【解決手段】文字取得処理サーバ1は、文書画像から文字を検出し、検出した文字の文字間隔に応じて文字列とする前処理部13と、文字列の位置情報及び文字列の文字サイズを含む文字列情報を取得し、文字列について、文字の読み方向における先頭の文字列から読み方向の順に、文字列と文字列に続く他の文字列との間の距離及び文字列情報の差分を算出し、算出した距離及び差分と予め設定された閾値とに基づき、文字列と文字列に続く他の文字列とをグループ化するか否かを判定する矩形外処理部14と、を備える。
【選択図】図1
特許請求の範囲
【請求項1】
文書画像から文字を検出する文字検出手段と、
検出した前記文字の文字間隔に応じて文字列とする文字列取得手段と、
前記文字列取得手段が取得した前記文字列の位置情報及び前記文字列の文字サイズを含む文字列情報を取得する文字列情報取得手段と、
前記文字列取得手段が取得した前記文字列について、文字の読み方向における先頭の前記文字列から前記読み方向の順に、前記文字列と前記文字列に続く他の前記文字列との間の距離及び前記文字列情報の差分を算出する差分算出手段と、
前記差分算出手段が算出した前記距離及び前記差分と予め設定された閾値とに基づき、前記文字列と前記文字列に続く他の前記文字列とをグループ化するか否かを判定するグループ判定手段と、
を備える、文字認識装置。
続きを表示(約 1,700 文字)
【請求項2】
請求項1に記載の文字認識装置において、
前記グループ判定手段は、前記差分算出手段が算出した前記距離及び前記差分が前記閾値より小さい場合に、前記文字列と前記文字列に続く他の前記文字列とをグループ化すると判定する、文字認識装置。
【請求項3】
請求項2に記載の文字認識装置において、
前記グループ判定手段での判定に用いる前記距離と比較する前記閾値は、前記文書画像の全体における前記文字列の大きさの比率又は前記文字列の文字の大きさに基づき設定する、文字認識装置。
【請求項4】
請求項1から請求項3までのいずれかに記載の文字認識装置において、
前記文書画像から罫線を抽出する罫線抽出手段と、
前記文字列取得手段が取得した前記文字列が、前記罫線抽出手段が抽出した前記罫線で囲まれた矩形内にあるか否かを判定する矩形判定手段を備え、
文字列情報取得手段は、前記矩形判定手段により前記矩形内にないと判定した前記文字列について、前記文字列情報を取得する、文字認識装置。
【請求項5】
請求項4に記載の文字認識装置において、
前記矩形判定手段が前記矩形内にあることを判定した場合に、前記矩形内の前記文字列をテキストに変換するテキスト変換手段と、
前記テキスト変換手段により変換した前記テキストを出力するテキスト出力手段と、
を備える、文字認識装置。
【請求項6】
請求項5に記載の文字認識装置において、
前記テキスト出力手段は、前記矩形内の前記テキストを1つのかたまりにして区切り文字により区切って出力する、文字認識装置。
【請求項7】
請求項1から請求項3までのいずれかに記載の文字認識装置において、
前記グループ判定手段がグループ化すると判定した場合に、判定対象の複数の前記文字列を1つのグループにするグループ化手段と、
前記文字列をテキストに変換するテキスト変換手段と、
前記テキスト変換手段により変換した前記テキストを出力するテキスト出力手段と、
を備え、
前記テキスト変換手段は、前記グループ化手段による前記1つのグループに含まれる各文字列の間に区切り文字を挿入して前記テキストに変換する、文字認識装置。
【請求項8】
請求項7に記載の文字認識装置において、
前記テキスト出力手段は、前記テキストの位置情報と共に前記テキストを出力する、文字認識装置。
【請求項9】
請求項1から請求項3までのいずれかに記載の文字認識装置において、
前記差分算出手段は、前記文字列取得手段が取得した前記文字列について、前記読み方向における先頭の前記文字列から前記読み方向に対して垂直方向の順に、前記文字列と前記文字列に続く他の前記文字列との間の距離及び前記文字列情報の差分を算出し、
前記グループ判定手段により、前記文字列に対して前記読み方向及び前記垂直方向におけるグループ化が判定された場合、グループ化の妥当性を判断する妥当性判断手段を備える、文字認識装置。
【請求項10】
コンピュータを、
文書画像から文字を検出する文字検出手段と、
検出した前記文字の文字間隔に応じて文字列とする文字列取得手段と、
前記文字列取得手段が取得した前記文字列の位置情報及び前記文字列の文字サイズを含む文字列情報を取得する文字列情報取得手段と、
前記文字列取得手段が取得した前記文字列について、文字の読み方向における先頭の前記文字列から前記読み方向の順に、前記文字列と前記文字列に続く他の前記文字列との間の距離及び前記文字列情報の差分を算出する差分算出手段と、
前記差分算出手段が算出した前記距離及び前記差分と予め設定された閾値とに基づき、前記文字列と前記文字列に続く他の前記文字列とをグループ化するか否かを判定するグループ判定手段と、
して機能させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、文字認識装置及びプログラムに関する。
続きを表示(約 3,600 文字)
【背景技術】
【0002】
従来、見積書や請求書等の発行元によってフォーマットが異なる書類を、データとしてシステムに登録する際に、文字入力を手作業で行っており、時間及び人的なコストがかかっている。
そのため、コストの削減のために、文字入力を自動的に行う様々な取り組みが検討されている。OCR(Optical Character Recognition/Reader)の使用は、その一例である。しかし、OCRでは、情報がバラバラに取得されてしまい、テキストの意味を理解することができない。
そこで、例えば、書類における特定の属性の記述位置を指定するテンプレートを使用するもの(例えば、特許文献1)や、書類に含まれる文字画像集合のテキストデータに対応する特徴ベクトルを生成して使用するもの(例えば、特許文献2)がある。
【先行技術文献】
【特許文献】
【0003】
特開2019-86984号公報
特開2022-178723号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1では、フォーマットを書類ごとに準備する必要があり煩雑であった。また、特許文献2では、文字オブジェクトの検出及びグルーピングをする過程において、グルーピングするか否かの判断が適切に行われる必要があった。
【0005】
そこで、本発明は、文書画像に含まれる文字列を適切にグルーピングするための工夫をした文字認識装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、以下のような解決手段により、前記課題を解決する。
第1の発明は、文書画像から文字を検出する文字検出手段と、検出した前記文字の文字間隔に応じて文字列とする文字列取得手段と、前記文字列取得手段が取得した前記文字列の位置情報及び前記文字列の文字サイズを含む文字列情報を取得する文字列情報取得手段と、前記文字列取得手段が取得した前記文字列について、文字の読み方向における先頭の前記文字列から前記読み方向の順に、前記文字列と前記文字列に続く他の前記文字列との間の距離及び前記文字列情報の差分を算出する差分算出手段と、前記差分算出手段が算出した前記距離及び前記差分と予め設定された閾値とに基づき、前記文字列と前記文字列に続く他の前記文字列とをグループ化するか否かを判定するグループ判定手段と、を備える、文字認識装置である。
第2の発明は、第1の発明の文字認識装置において、前記グループ判定手段は、前記差分算出手段が算出した前記距離及び前記差分が前記閾値より小さい場合に、前記文字列と前記文字列に続く他の前記文字列とをグループ化すると判定する、文字認識装置である。
第3の発明は、第2の発明の文字認識装置において、前記グループ判定手段での判定に用いる前記距離と比較する前記閾値は、前記文書画像の全体における前記文字列の大きさの比率又は前記文字列の文字の大きさに基づき設定する、文字認識装置である。
第4の発明は、第1の発明から第3の発明までのいずれかの文字認識装置において、前記文書画像から罫線を抽出する罫線抽出手段と、前記文字列取得手段が取得した前記文字列が、前記罫線抽出手段が抽出した前記罫線で囲まれた矩形内にあるか否かを判定する矩形判定手段を備え、文字列情報取得手段は、前記矩形判定手段により前記矩形内にないと判定した前記文字列について、前記文字列情報を取得する、文字認識装置である。
第5の発明は、第4の発明の文字認識装置において、前記矩形判定手段が前記矩形内にあることを判定した場合に、前記矩形内の前記文字列をテキストに変換するテキスト変換手段と、前記テキスト変換手段により変換した前記テキストを出力するテキスト出力手段と、を備える、文字認識装置である。
第6の発明は、第5の発明の文字認識装置において、前記テキスト出力手段は、前記矩形内の前記テキストを1つのかたまりにして区切り文字により区切って出力する、文字認識装置である。
第7の発明は、第1の発明から第4の発明までのいずれかの文字認識装置において、前記グループ判定手段がグループ化すると判定した場合に、判定対象の複数の前記文字列を1つのグループにするグループ化手段と、前記文字列をテキストに変換するテキスト変換手段と、前記テキスト変換手段により変換した前記テキストを出力するテキスト出力手段と、を備え、前記テキスト変換手段は、前記グループ化手段による前記1つのグループに含まれる各文字列の間に区切り文字を挿入して前記テキストに変換する、文字認識装置である。
第8の発明は、第7の発明の文字認識装置において、前記テキスト出力手段は、前記テキストの位置情報と共に前記テキストを出力する、文字認識装置である。
第9の発明は、第1の発明から第8の発明までのいずれかの文字認識装置において、前記差分算出手段は、前記文字列取得手段が取得した前記文字列について、前記読み方向における先頭の前記文字列から前記読み方向に対して垂直方向の順に、前記文字列と前記文字列に続く他の前記文字列との間の距離及び前記文字列情報の差分を算出し、前記グループ判定手段により、前記文字列に対して前記読み方向及び前記垂直方向におけるグループ化が判定された場合、グループ化の妥当性を判断する妥当性判断手段を備える、文字認識装置である。
第10の発明は、第1の発明から第9の発明までのいずれかの文字認識装置としてコンピュータを機能させるためのプログラムである。
【発明の効果】
【0007】
本発明によれば、文書画像に含まれる文字列を適切にグルーピングするための工夫をした文字認識装置及びプログラムを提供することができる。
【図面の簡単な説明】
【0008】
本実施形態に係る文字取得処理システムの全体構成図及び文字取得処理サーバの機能ブロック図である。
本実施形態に係る文字取得処理サーバの制御部の一部についての機能ブロック図である。
本実施形態に係る文字取得処理サーバの妥当性判断ルール記憶部及び正規表現パターン定義ファイルの例を示す図である。
本実施形態に係る文字取得処理サーバにおける処理の概要を説明するための図である。
本実施形態に係る文字取得処理サーバの文字取得処理を示すフローチャートである。
本実施形態に係る文字取得処理サーバの矩形外処理を示すフローチャートである。
本実施形態に係る文字取得処理サーバにおける処理を説明するための図である。
本実施形態に係る文字取得処理サーバにおける処理を説明するための図である。
本実施形態に係る文字取得処理サーバにおける処理を説明するための図である。
本実施形態に係る文字取得処理サーバの項目値抽出処理を示すフローチャートである。
変形形態に係る文字取得処理サーバにおける処理を説明するための図である。
【発明を実施するための形態】
【0009】
以下、本発明を実施するための形態について、図を参照しながら説明する。なお、これは、あくまでも一例であって、本発明の技術的範囲は、これに限られるものではない。
(実施形態)
<文字取得処理システム100の全体構成>
図1は、本実施形態に係る文字取得処理システム100の全体構成図及び文字取得処理サーバ1の機能ブロック図である。
図2は、本実施形態に係る文字取得処理サーバ1の制御部10の一部についての機能ブロック図である。
図3は、本実施形態に係る文字取得処理サーバ1の妥当性判断ルール記憶部23及び正規表現パターン定義ファイル31の例を示す図である。
【0010】
図1に示すように、文字取得処理システム100は、文字取得処理サーバ1(文字認識装置)と、ユーザ端末5と、OCR装置6とを備える。文字取得処理サーバ1と、ユーザ端末5と、OCR装置6とは、通信ネットワークNを介して接続されている。
文字取得処理システム100は、文書画像データに対して文字認識処理を行って得たテキストから、予め決められた抽出対象項目名と抽出対象項目名に対する項目値とを抽出して出力する処理を行うシステムである。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
認証システム
10日前
個人
保証金管理システム
4日前
個人
鑑定証明システム
10日前
個人
人的価値発掘システム
1か月前
アズビル株式会社
防爆装置
1か月前
個人
業界地図作成システム
1か月前
個人
技術マッチングシステム
16日前
株式会社セガフェイブ
遊戯機
1か月前
株式会社宗建
SNSサーバー
1か月前
株式会社MRC
集客システム
4日前
キヤノン電子株式会社
情報処理装置
1か月前
キヤノン株式会社
印刷管理装置
2日前
株式会社ネットブリッジ
展示販売装置
11日前
キヤノン株式会社
印刷制御装置
25日前
個人
配送システムおよび同包箱
1か月前
ミサワホーム株式会社
システム
1か月前
トヨタ自動車株式会社
分析装置
4日前
ミサワホーム株式会社
管理装置
1か月前
個人
文字入力方法、文字入力プログラム
17日前
個人
動作のデザイン評価の方法及び装置
1か月前
オムロン株式会社
認証中継サーバ
1か月前
大同特殊鋼株式会社
棒材計数装置
1か月前
ミサワホーム株式会社
プログラム
10日前
アスエネ株式会社
森林管理の方法
1か月前
個人
口座悪用を防止する口座管理システム
1か月前
株式会社八咲
イベント管理システム
1か月前
個人
後払いポイントシステム「先用後利」
11日前
株式会社チノー
ユーザ認証システム
1か月前
株式会社LIFE
送迎管理システム
3日前
株式会社インザック
コンピュータシステム
16日前
トヨタ自動車株式会社
車載機
10日前
トヨタ自動車株式会社
部品管理装置
10日前
トヨタ自動車株式会社
作業評価装置
23日前
三菱電機モビリティ株式会社
メモリ制御装置
1か月前
ローム株式会社
コントローラ回路
1か月前
ミサワホーム株式会社
水素配送システム
1か月前
続きを見る
他の特許を見る