TOP特許意匠商標
特許ウォッチ DM通知 Twitter
公開番号2023022573
公報種別公開特許公報(A)
公開日2023-02-15
出願番号2021127511
出願日2021-08-03
発明の名称画像情報処理システム
出願人キヤノン株式会社
代理人個人
主分類G06V 30/412 20220101AFI20230208BHJP(計算;計数)
要約【課題】 手書きで記載された情報を抽出することができる画像情報処理システムを提供する。
【解決手段】 画像情報処理システムは、画像データを手書き画像と印刷画像に分離する手段522と、印刷画像を認識し印刷文字列を出力する手段523と、手書き画像を認識し手書き文字列を出力する手段524と、印刷文字列と手書き文字列を対応付ける手段525と手書き文字列から情報抽出する文字列を決定する手段526とで構成され、抽出文字列決定手段526は、手書き文字列に対応付けられた印刷文字列が情報抽出対象でないことを示す手書き文字列以外を列挙した第一の抽出文字列候補を出力する手段S901と、手書き文字列に対応付けられた印刷文字列が、情報抽出対象であることを表す手書き文字列を列挙した第二の抽出文字列候補を出力する手段S904と、第一と第二の抽出文字列候補から一つの情報抽出文字列を選択する手段S906、S907を有する。
【選択図】 図5
特許請求の範囲【請求項1】
画像読取手段で読み取った画像データから文字情報を抽出する画像情報処理システムであって、
前記画像データを手書き画像と印刷画像に分離する画像分離手段と、
前記印刷画像を文字認識して1または複数の印刷文字列を出力する印刷文字認識手段と、
前記手書き画像を文字認識して1または複数の手書き文字列を出力する手書き文字認識手段と、
前記印刷文字列と前記手書き文字列を対応付ける認識文字列対応付け手段と、
前記手書き文字列から情報抽出する文字列を決定する情報抽出文字列決定手段と、
から構成され、
前記抽出文字列決定手段は、
前記手書き文字列に対応付けられた前記印刷文字列が、情報抽出対象でないことを表している前記手書き文字列以外を列挙した、第一の抽出文字列候補を出力する、第一の抽出文字列候補列挙手段と、
前記手書き文字列に対応付けられた前記印刷文字列が、情報抽出対象であることを表している前記手書き文字列を列挙した、第二の抽出文字列候補を出力する、第二の抽出文字列候補列挙手段と、
前記第一の抽出文字列候補と第二の抽出文字列候補のいずれかから、一つの情報抽出文字列を選択する、抽出文字列選択手段を有することを特徴とする画像情報処理システム。
続きを表示(約 410 文字)【請求項2】
請求項1の画像情報処理システムにおいて、前記抽出文字列決定手段は、前記第一の抽出文字列候補が無いときには、情報を抽出する文字列が無いと判定することを特徴とする画像情報処理システム。
【請求項3】
請求項1又は2記載の画像情報処理システムにおいて、前記抽出文字列決定手段は、前記第二の抽出文字列候補がある時には、前記第二の抽出文字列候補から一つの情報抽出文字列を選択し、前記第二の抽出文字候補が無いときには、前記第一の抽出文字候補から一つの情報抽出文字列を選択することを特徴とする画像情報処理システム。
【請求項4】
請求項1~3のいずれか1項に記載の画像情報処理システムにおいて、前記抽出文字列決定手段は、前記抽出文字列選択処理が選択した抽出文字列について、前記手書き文字認識手段が出力する下位認識候補で前記手書き文字列を補正することを特徴とする画像情報処理システム。

発明の詳細な説明【技術分野】
【0001】
本発明は、画像情報処理システムにおいて、スキャンした画像データから文字情報を抽出する技術に関する。特に、手書き文字と印刷文字の混在した画像データから手書き文字の情報を抽出する技術に関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
従来、領収書の合計金額・日付情報を経費精算システムに登録したり、各種申込書から氏名や電話番号を顧客管理システム登録したりするような、手書きで情報が記入された紙の帳票から、その情報を業務システムに転記する、という転記業務が行われてきた。一方近年では、画像形成装置において、画像形成装置でスキャンした画像データに対して、OCR(Optical Character Recognition)処理を行うことで、画像データ内容の文字列をデジタルデータとして抽出する技術が発展している。そこで、手書き情報の転記業務にもOCR処理を適用し、自動で業務システムへの転記を行うニーズが高まってきている。この場合、画像データ上のどの部分に対してOCR処理を行い、情報を抽出するかを決定する必要がある。従来、これは画像データ上でユーザあるいはシステムエンジニアが手動で設定していたが、これでは紙の帳票のフォーマットが変わるごとに手動で設定を行わなければならない。
【0003】
特許文献1では、手書き部分と印刷部分に分離した画像に対してそれぞれにOCR処理を行い、手書き部分に対して印刷部分の文字列を対応付ける技術が開示されている。これにより、印刷部分の文字列を基に手書き部分の情報が何であるかを判別することができる。例えば、印刷部分が「金額」という文字列であれば、手書き部分は金額を表していると判別することができ、これを経費精算システムに転記することが可能である。
【先行技術文献】
【特許文献】
【0004】
特開2006―92027号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、手書き文字列に対応する印刷文字列が存在しないことが多い。例えば、手書きで合計金額を記入するようになっている市販領収証の多くには、合計金額を表す文字が印刷されていないことが多い。特許文献1の技術によれば、印刷部分と手書き部分の対応から手書き部分の属性を判断しているため、印刷部分が無ければ判断が困難である。
【0006】
本発明の目的は、手書き文字認識結果と印刷文字認識結果から、印刷文字が対応していない手書き文字が何を表しているかが判別することができ、手書き文字列の内容から所望の情報を抽出することができる画像情報処理システムを提供することにある。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の画像情報処理システムは、画像読取手段(501)で読み取った画像データから文字情報を抽出する画像情報処理システムであって、前記画像データを手書き画像と印刷画像に分離する画像分離手段(522)と、前記印刷画像を文字認識して1または複数の印刷文字列を出力する印刷文字認識手段(523)と、前記手書き画像を文字認識して1または複数の手書き文字列を出力する手書き文字認識手段(524)と、前記印刷文字列と前記手書き文字列を対応付ける認識文字列対応付け手段(525)と、前記手書き文字列から情報抽出する文字列を決定する情報抽出文字列決定手段(526)とから構成され、前記抽出文字列決定手段は、前記手書き文字列に対応付けられた前記印刷文字列が、情報抽出対象でないことを表している前記手書き文字列以外を列挙した、第一の抽出文字列候補を出力する、第一の抽出文字列候補列挙手段(S901)と、前記手書き文字列に対応付けられた前記印刷文字列が、情報抽出対象であることを表している前記手書き文字列を列挙した、第二の抽出文字列候補を出力する、第二の抽出文字列候補列挙手段(S904)と、前記第一の抽出文字列候補と第二の抽出文字列候補のいずれかから、一つの情報抽出文字列を選択する、抽出文字列選択手段(S906、S907)を有することを特徴とする。
【発明の効果】
【0008】
本発明によれば、手書き文字認識結果と印刷文字認識結果から、印刷文字が対応していない手書き文字が何を表しているかが判別することができ、手書き文字列の内容から所望の情報を抽出することができる。
【図面の簡単な説明】
【0009】
本実施例の画像情報処理システムの構成例を示す図である。
画像形成装置のハードウェア構成例を示す図である。
画像情報処理システムを構成するサーバのハードウェア構成例を示す図である。
画像情報処理システムの全体処理手順を説明するフローチャートである。
画像情報処理システムのソフトウェア構成例を示す図である。
文字情報抽出処理の処理手順を説明するフローチャートである。
文字情報抽出処理の処理データ例を示す図である。
抽出文字列決定処理の使用するデータ例を示す図である。
抽出文字列決定処理の処理手順を説明するフローチャートである。
【発明を実施するための形態】
【0010】
以下、本発明を実施するための形態について図面を用いて説明する。
【実施例】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
自動算定システム
1か月前
個人
全加算器風値返戻器
24日前
個人
銀行デビットカード
1か月前
個人
自動投資売買システム
1か月前
個人
多言語翻訳会話システム
1か月前
個人
インターネット運用手法
12日前
個人
感情分類の方法及び装置
22日前
個人
オンライン学習予約システム
1か月前
個人
リユース容器を回収する方法
16日前
個人
不動産売買の支援装置
10日前
個人
農作物の直販システム
16日前
株式会社ルビス
デザイン生成装置
5日前
合同会社新生産業
広告方法
16日前
KYB株式会社
検査システム
24日前
株式会社プロテリアル
外観検査方法
1か月前
個人
知の統合を可能にする構想設計法
1か月前
個人
訪問記録地図表示システム
18日前
株式会社ダハ
販売支援システム
1か月前
凸版印刷株式会社
RFIDタグ読取装置
24日前
大同特殊鋼株式会社
棒材の検出方法
25日前
株式会社自侑自財
空輸管理システム
4日前
株式会社PacPort
サーバ装置
26日前
株式会社リコー
情報表示装置
18日前
オンキヨー株式会社
電子機器、及び、方法
18日前
個人
取引システム、取引方法及びプログラム
18日前
日本信号株式会社
認証システム
5日前
個人
企業版ふるさと納税促進システム
10日前
株式会社小野測器
移動量計測システム
16日前
長屋印刷株式会社
遠隔受発注システム
1か月前
株式会社ノーリツ
住宅設備機器
18日前
株式会社ショウワ
災害備蓄方法
19日前
三菱鉛筆株式会社
入力装置
9日前
トヨタ自動車株式会社
認識器の生成方法
1か月前
株式会社丸和製作所
触覚付与装置
25日前
有限会社アッズ・クー
顧客管理システム
1か月前
三菱鉛筆株式会社
入力装置
9日前
続きを見る