TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025049850
公報種別
公開特許公報(A)
公開日
2025-04-04
出願番号
2023158309
出願日
2023-09-22
発明の名称
画像処理システム、画像処理方法、及び画像処理プログラム
出願人
シャープ株式会社
代理人
個人
,
個人
,
個人
主分類
G06V
30/26 20220101AFI20250327BHJP(計算;計数)
要約
【課題】入力画像の文字列の認識精度を向上させることが可能な画像処理システム、画像処理方法、及び画像処理プログラムを提供する。
【解決手段】取得処理部113は、画像に含まれる所定の項目の文字列に対して実行される文字認識処理の結果を取得する。算出処理部114は、前記文字認識処理の結果に含まれる複数の文字列候補のそれぞれに設定される設定値に基づいて、前記所定の項目に対応する予め登録された複数の登録文字列のそれぞれについて評価値を算出する。特定処理部115は、算出処理部114により算出される前記複数の登録文字列のそれぞれの前記評価値に基づいて、所定の登録文字列を特定する。出力処理部116は、特定処理部115により特定される前記所定の登録文字列を出力する。
【選択図】図1
特許請求の範囲
【請求項1】
画像に含まれる所定の項目の文字列に対して実行される文字認識処理の結果を取得する取得処理部と、
前記文字認識処理の結果に含まれる複数の文字列候補のそれぞれに設定される設定値に基づいて、前記所定の項目に対応する予め登録された複数の登録文字列のそれぞれについて評価値を算出する算出処理部と、
前記算出処理部により算出される前記複数の登録文字列のそれぞれの前記評価値に基づいて、所定の登録文字列を特定する特定処理部と、
前記特定処理部により特定される前記所定の登録文字列を出力する出力処理部と、
を備える画像処理システム。
続きを表示(約 1,300 文字)
【請求項2】
前記算出処理部は、前記複数の登録文字列のそれぞれについて、
前記登録文字列を構成する一つの文字ごとに、前記複数の文字列候補のうち当該文字が含まれる前記文字列候補を特定し、特定した前記文字列候補に対応する前記設定値を設定し、
前記文字ごとに設定される前記設定値の合計値に基づいて前記評価値を算出する、
請求項1に記載の画像処理システム。
【請求項3】
前記算出処理部は、前記複数の登録文字列のそれぞれについて、前記合計値を前記登録文字列の文字数で除算して前記評価値を算出する、
請求項2に記載の画像処理システム。
【請求項4】
前記特定処理部は、前記複数の登録文字列のうち前記評価値が最小又は最大となる前記登録文字列を特定する、
請求項3に記載の画像処理システム。
【請求項5】
前記複数の文字列候補のそれぞれに対して、前記文字認識の精度が高い程、低い又は高い前記設定値が設定される、
請求項1に記載の画像処理システム。
【請求項6】
前記算出処理部は、前記文字列に対する前記文字認識処理において検出されなかった文字が存在する場合に、検出されなかった文字の位置を示す文字欠け位置を特定し、特定した前記文字欠け位置に基づいて、前記登録文字列を構成する一つの文字ごとに前記設定値を設定する、
請求項2~5のいずれかに記載の画像処理システム。
【請求項7】
前記算出処理部は、前記文字列の領域である文字列矩形と、前記文字列を構成する一つの文字ごとの領域である一文字矩形とを検出し、前記文字列に対する前記文字認識処理の結果と前記文字列矩形及び前記一文字矩形とに基づいて前記文字欠け位置を特定する、
請求項6に記載の画像処理システム。
【請求項8】
前記算出処理部は、前記文字列に対する前記文字認識処理の結果と、前記画像上に設定される基準座標に対する前記文字列矩形及び前記一文字矩形のそれぞれの位置座標とに基づいて前記文字欠け位置を特定する、
請求項7に記載の画像処理システム。
【請求項9】
前記所定の項目は、文書画像に含まれる住所、電話番号、郵便番号、及び会社名の少なくともいずれかである、
請求項1に記載の画像処理システム。
【請求項10】
画像に含まれる所定の項目の文字列に対して実行される文字認識処理の結果を取得することと、
前記文字認識処理の結果に含まれる複数の文字列候補のそれぞれに設定される設定値に基づいて、前記所定の項目に対応する予め登録された複数の登録文字列のそれぞれについて評価値を算出することと、
前記複数の登録文字列のそれぞれの前記評価値に基づいて、所定の登録文字列を特定することと、
前記所定の登録文字列を出力することと、
を一又は複数のプロセッサーが実行する画像処理方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、文書などの画像に対して文字認識の画像処理を実行する技術に関する。
続きを表示(約 2,500 文字)
【背景技術】
【0002】
従来、文書、帳票等の書類の画像から文字列を検出する技術が知られている。例えば、設定した基準値に基づいて矩形の有効/無効を判断し、領域識別処理の結果に基づいて行方向の設定を行い、有効矩形を対象に切り出した行矩形を1文字単位に分割し、切り出した1文字の画像特徴とパターン辞書の文字特徴とを比較して文字認識する文字認識装置が知られている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
特開2003-256772号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の文字認識処理(OCR処理)では、例えば複数の文字で構成される文字列について、各文字の文字矩形を正しく検出できてもいずれかの文字を誤認識したり、いずれかの文字の文字矩形の検出に失敗したりする問題が生じる。
【0005】
本開示の目的は、入力画像の文字列の認識精度を向上させることが可能な画像処理システム、画像処理方法、及び画像処理プログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示の一の態様に係る画像処理システムは、取得処理部と算出処理部と特定処理部と出力処理部とを備える。前記取得処理部は、画像に含まれる所定の項目の文字列に対して実行される文字認識処理の結果を取得する。前記算出処理部は、前記文字認識処理の結果に含まれる複数の文字列候補のそれぞれに設定される設定値に基づいて、前記所定の項目に対応する予め登録された複数の登録文字列のそれぞれについて評価値を算出する。前記特定処理部は、前記算出処理部により算出される前記複数の登録文字列のそれぞれの前記評価値に基づいて、所定の登録文字列を特定する。前記出力処理部は、前記特定処理部により特定される前記所定の登録文字列を出力する。
【0007】
本開示の他の態様に係る画像処理方法は、画像に含まれる所定の項目の文字列に対して実行される文字認識処理の結果を取得することと、前記文字認識処理の結果に含まれる複数の文字列候補のそれぞれに設定される設定値に基づいて、前記所定の項目に対応する予め登録された複数の登録文字列のそれぞれについて評価値を算出することと、前記複数の登録文字列のそれぞれの前記評価値に基づいて、所定の登録文字列を特定することと、前記所定の登録文字列を出力することと、を一又は複数のプロセッサーが実行する方法である。
【0008】
本開示の他の態様に係る画像処理プログラムは、画像に含まれる所定の項目の文字列に対して実行される文字認識処理の結果を取得することと、前記文字認識処理の結果に含まれる複数の文字列候補のそれぞれに設定される設定値に基づいて、前記所定の項目に対応する予め登録された複数の登録文字列のそれぞれについて評価値を算出することと、前記複数の登録文字列のそれぞれの前記評価値に基づいて、所定の登録文字列を特定することと、前記所定の登録文字列を出力することと、を一又は複数のプロセッサーに実行させるためのプログラムである。
【発明の効果】
【0009】
本開示によれば、入力画像の文字列の認識精度を向上させることが可能な画像処理システム、画像処理方法、及び画像処理プログラムを提供することができる。
【図面の簡単な説明】
【0010】
図1は、本開示の実施形態に係る画像処理装置の構成を示す機能ブロック図である。
図2は、本開示の実施形態に係る文書の一例(見積書)を示す図である。
図3Aは、本開示の実施形態に係る文字認識処理の対象文字列の一例を示す図である。
図3Bは、本開示の実施形態に係る対象文字列の文字を検出した文字矩形の一例を示す図である。
図3Cは、従来の文字認識処理の結果を示す図である。
図4は、本開示の実施形態に係る画像処理装置において利用されるスコア情報の一例を示す図である。
図5は、本開示の実施形態に係る画像処理装置において利用される住所リストの一例を示す図である。
図6Aは、本開示の実施形態に係る文字認識処理の一例を示す図である。
図6Bは、本開示の実施形態に係る文字認識処理の一例を示す図である。
図7Aは、本開示の実施形態に係る文字認識処理の一例を示す図である。
図7Bは、本開示の実施形態に係る文字認識処理の一例を示す図である。
図8は、本開示の実施形態に係る画像処理装置において実行される画像処理の手順の一例を示すフローチャートである。
図9Aは、本開示の実施形態に係る文字認識処理の対象文字列の一例を示す図である。
図9Bは、本開示の実施形態に係る対象文字列の文字を検出した文字矩形の一例を示す図である。
図9Cは、従来の文字認識処理の結果を示す図である。
図10は、本開示の実施形態に係る文字認識処理の一例を示す図である。
図11Aは、本開示の実施形態に係る文字認識処理の他の例を示す図である。
図11Bは、本開示の実施形態に係る文字認識処理の他の例を示す図である。
図12Aは、本開示の実施形態に係る文字認識処理の対象文字列の他の例を示す図である。
図12Bは、本開示の実施形態に係る対象文字列の文字を検出した文字矩形の他の例を示す図である。
図13Aは、本開示の実施形態に係る文字認識処理の対象文字列の他の例を示す図である。
図13Bは、本開示の実施形態に係る対象文字列の文字を検出した文字矩形の他の例を示す図である。
図14Aは、本開示の実施形態に係る文字認識処理の対象文字列の他の例を示す図である。
図14Bは、本開示の実施形態に係る対象文字列の文字を検出した文字矩形の他の例を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
シャープ株式会社
加湿器
10日前
シャープ株式会社
表示装置
5日前
シャープ株式会社
画像形成装置
11日前
シャープ株式会社
画像形成装置
10日前
シャープ株式会社
フロー型電池セル
11日前
シャープ株式会社
機器および表示装置
5日前
シャープ株式会社
騒音低減装置および掃除機
2日前
シャープ株式会社
騒音低減装置および掃除機
2日前
シャープ株式会社
保湿剤及び保湿剤の使用方法
11日前
シャープ株式会社
表示装置およびその制御方法
4日前
シャープ株式会社
表示装置およびその制御方法
4日前
シャープ株式会社
加熱調理器、および調理方法
4日前
シャープ株式会社
フロー型金属空気電池用充電部
12日前
シャープ株式会社
梱包材および冷却装置の梱包体
4日前
シャープ株式会社
表示制御装置及び表示制御方法
4日前
シャープ株式会社
表示装置および表示装置の制御方法
4日前
シャープ株式会社
加熱部材、定着装置及び画像形成装置
11日前
シャープ株式会社
駐車場管理システム及び駐車場管理方法
11日前
シャープ株式会社
受信装置、放送システム、および、受信方法
3日前
シャープ株式会社
画像処理装置及び書き換え保護の実行制御方法
5日前
シャープ株式会社
フロー型電池セルおよびフロー型金属空気電池
9日前
シャープ株式会社
走行システム、走行方法、及び走行プログラム
10日前
シャープ株式会社
3Dデータ復号装置および3Dデータ符号化装置
4日前
シャープ株式会社
3Dデータ符号化装置および3Dデータ復号装置
2日前
シャープ株式会社
文字処理システム、文字処理方法、及び文字処理プログラム
2日前
シャープ株式会社
画像処理システム、画像処理方法、及び画像処理プログラム
2日前
シャープ株式会社
画像処理システム、画像処理方法、及び画像処理プログラム
2日前
シャープ株式会社
画像処理システム、画像処理方法、及び画像処理プログラム
2日前
シャープ株式会社
情報処理装置、テレビジョン受像機、情報処理方法、およびプログラム
3日前
個人
プログラム
1か月前
個人
情報検索システム
11日前
個人
日本語入力支援システム
1か月前
個人
AI旅行最適化プラグイン
1か月前
個人
確率場データ同化演算手法
23日前
キヤノン株式会社
電子機器
10日前
キヤノン株式会社
電子機器
10日前
続きを見る
他の特許を見る