TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025049847
公報種別
公開特許公報(A)
公開日
2025-04-04
出願番号
2023158306
出願日
2023-09-22
発明の名称
文字処理システム、文字処理方法、及び文字処理プログラム
出願人
シャープ株式会社
代理人
個人
,
個人
,
個人
主分類
G06V
30/262 20220101AFI20250327BHJP(計算;計数)
要約
【課題】入力画像の日付けを適切に抽出することが可能な文字処理システム、文字処理方法、及び文字処理プログラムを提供する。
【解決手段】取得処理部113は、文書の画像に含まれる文字列に対して実行される文字認識処理の結果を取得する。算出処理部114は、前記文字認識処理の結果に含まれる複数の日付文字列候補のそれぞれについて、所定の条件に応じた評価値を算出する。特定処理部115は、算出処理部114により算出される前記複数の日付文字列候補のそれぞれの前記評価値に基づいて、所定の日付文字列候補を特定する。出力処理部116は、特定処理部115により特定される前記所定の日付文字列候補を出力する。
【選択図】図1
特許請求の範囲
【請求項1】
文書の画像に含まれる文字列に対して実行される文字認識処理の結果を取得する取得処理部と、
前記文字認識処理の結果に含まれる複数の日付文字列候補のそれぞれについて、所定の条件に応じた評価値を算出する算出処理部と、
前記算出処理部により算出される前記複数の日付文字列候補のそれぞれの前記評価値に基づいて、所定の日付文字列候補を特定する特定処理部と、
前記特定処理部により特定される前記所定の日付文字列候補を出力する出力処理部と、
を備える文字処理システム。
続きを表示(約 1,100 文字)
【請求項2】
前記算出処理部は、前記文字認識処理により取得される複数の文字列から、日付けに関連する文字を含み、かつ所定の文字数で構成される文字列を、前記日付文字列候補として抽出する、
請求項1に記載の文字処理システム。
【請求項3】
前記算出処理部は、前記画像において前記日付文字列候補の位置から所定範囲内に日付けに関連する関連文字が含まれる場合に、前記日付文字列候補に対して所定の前記評価値を加算する、
請求項1に記載の文字処理システム。
【請求項4】
前記算出処理部は、前記画像において前記日付文字列候補の位置から前記所定範囲内に日付けに関連しない非関連文字が含まれる場合に、前記日付文字列候補に対して所定の前記評価値を減算する、
請求項3に記載の文字処理システム。
【請求項5】
前記算出処理部は、前記画像の中心位置から前記日付文字列候補の位置までの距離に応じた前記評価値を前記日付文字列候補に対して加算する、
請求項1に記載の文字処理システム。
【請求項6】
前記特定処理部は、前記複数の日付文字列候補のうち前記評価値が最も高い前記日付文字列候補を特定する、
請求項1に記載の文字処理システム。
【請求項7】
前記文書の種類ごとに、予め前記関連文字及び前記非関連文字が対応付けて登録されている、
請求項4に記載の文字処理システム。
【請求項8】
前記出力処理部は、前記複数の日付文字列候補を前記評価値が高い順に表示させる、
請求項1~7のいずれかに記載の文字処理システム。
【請求項9】
文書の画像に含まれる文字列に対して実行される文字認識処理の結果を取得することと、
前記文字認識処理の結果に含まれる複数の日付文字列候補のそれぞれについて、所定の条件に応じた評価値を算出することと、
前記複数の日付文字列候補のそれぞれの前記評価値に基づいて、所定の日付文字列候補を特定することと、
前記所定の日付文字列候補を出力することと、
を一又は複数のプロセッサーが実行する文字処理方法。
【請求項10】
文書の画像に含まれる文字列に対して実行される文字認識処理の結果を取得することと、
前記文字認識処理の結果に含まれる複数の日付文字列候補のそれぞれについて、所定の条件に応じた評価値を算出することと、
前記複数の日付文字列候補のそれぞれの前記評価値に基づいて、所定の日付文字列候補を特定することと、
前記所定の日付文字列候補を出力することと、
を一又は複数のプロセッサーに実行させるための文字処理プログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、文書などの画像に対して文字認識などの処理を実行する技術に関する。
続きを表示(約 2,000 文字)
【背景技術】
【0002】
従来、文書、帳票等の書類の画像を文字認識して得られたテキストデータから日付け、金額などを抽出する技術が知られている。例えば、テキストデータから「月」、「日」、「/」、「.」などをキーワードとして、日付け、金額を抽出する技術が知られている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
特開2015-118488号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、従来の技術では、例えば、日付け以外の文字列(例えば、メールアドレス、URLなど)に「/」、「.」のキーワードが含まれる場合に、当該文字列を日付けとして抽出してしまう問題が生じる。
【0005】
本開示の目的は、入力画像の日付けを適切に抽出することが可能な文字処理システム、文字処理方法、及び文字処理プログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示の一の態様に係る文字処理システムは、取得処理部と算出処理部と特定処理部と出力処理部とを備える。前記取得処理部は、文書の画像に含まれる文字列に対して実行される文字認識処理の結果を取得する。前記算出処理部は、前記文字認識処理の結果に含まれる複数の日付文字列候補のそれぞれについて、所定の条件に応じた評価値を算出する。前記特定処理部は、前記算出処理部により算出される前記複数の日付文字列候補のそれぞれの前記評価値に基づいて、所定の日付文字列候補を特定する。前記出力処理部は、前記特定処理部により特定される前記所定の日付文字列候補を出力する。
【0007】
本開示の他の態様に係る文字処理方法は、文書の画像に含まれる文字列に対して実行される文字認識処理の結果を取得することと、前記文字認識処理の結果に含まれる複数の日付文字列候補のそれぞれについて、所定の条件に応じた評価値を算出することと、前記複数の日付文字列候補のそれぞれの前記評価値に基づいて、所定の日付文字列候補を特定することと、前記所定の日付文字列候補を出力することと、を一又は複数のプロセッサーが実行する方法である。
【0008】
本開示の他の態様に係る文字処理プログラムは、文書の画像に含まれる文字列に対して実行される文字認識処理の結果を取得することと、前記文字認識処理の結果に含まれる複数の日付文字列候補のそれぞれについて、所定の条件に応じた評価値を算出することと、前記複数の日付文字列候補のそれぞれの前記評価値に基づいて、所定の日付文字列候補を特定することと、前記所定の日付文字列候補を出力することと、を一又は複数のプロセッサーに実行させるためのプログラムである。
【発明の効果】
【0009】
本開示によれば、入力画像の日付けを適切に抽出することが可能な文字処理システム、文字処理方法、及び文字処理プログラムを提供することができる。
【図面の簡単な説明】
【0010】
図1は、本開示の実施形態に係る文字処理装置の構成を示す機能ブロック図である。
図2は、本開示の実施形態に係る文書の一例(請求書)を示す図である。
図3は、本開示の実施形態に係る文字認識処理により抽出される文字列の文字列リストの一例を示す図である。
図4は、本開示の実施形態に係る文書画像において抽出される矩形の一例を示す図である。
図5は、本開示の実施形態に係る文字処理装置において利用される対象文字列候補リストの一例を示す図である。
図6は、本開示の実施形態に係る文字処理装置において利用される日付文字列候補リストの一例を示す図である。
図7は、本開示の実施形態に係る文字処理装置において特定される日付け(数値)の一例を示す図である。
図8は、本開示の実施形態に係る文字処理装置において利用されるキーワード情報の一例を示す図である。
図9は、本開示の実施形態に係る文字処理装置において算出される評価値の一例を示す図である。
図10は、本開示の実施形態に係る文字処理装置において決定される抽出対象の一例を示す図である。
図11は、本開示の実施形態に係る文字処理装置において実行される文字処理の手順の一例を示すフローチャートである。
図12は、本開示の実施形態に係る文字処理装置における評価値の算出方法の他の例を示す図である。
図13は、本開示の実施形態に係る文字処理装置における評価値の算出方法の他の例を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
シャープ株式会社
表示装置
5日前
シャープ株式会社
画像形成装置
10日前
シャープ株式会社
機器および表示装置
5日前
シャープ株式会社
騒音低減装置および掃除機
2日前
シャープ株式会社
騒音低減装置および掃除機
2日前
シャープ株式会社
表示装置およびその制御方法
4日前
シャープ株式会社
加熱調理器、および調理方法
4日前
シャープ株式会社
表示装置およびその制御方法
4日前
シャープ株式会社
梱包材および冷却装置の梱包体
4日前
シャープ株式会社
表示制御装置及び表示制御方法
4日前
シャープ株式会社
表示装置および表示装置の制御方法
4日前
シャープ株式会社
受信装置、放送システム、および、受信方法
3日前
シャープ株式会社
画像処理装置及び書き換え保護の実行制御方法
5日前
シャープ株式会社
フロー型電池セルおよびフロー型金属空気電池
9日前
シャープ株式会社
走行システム、走行方法、及び走行プログラム
10日前
シャープ株式会社
3Dデータ復号装置および3Dデータ符号化装置
4日前
シャープ株式会社
3Dデータ符号化装置および3Dデータ復号装置
2日前
シャープ株式会社
文字処理システム、文字処理方法、及び文字処理プログラム
2日前
シャープ株式会社
画像処理システム、画像処理方法、及び画像処理プログラム
2日前
シャープ株式会社
画像処理システム、画像処理方法、及び画像処理プログラム
2日前
シャープ株式会社
画像処理システム、画像処理方法、及び画像処理プログラム
2日前
シャープ株式会社
情報処理装置、テレビジョン受像機、情報処理方法、およびプログラム
3日前
個人
情報検索システム
11日前
個人
確率場データ同化演算手法
23日前
キヤノン株式会社
電子機器
10日前
キヤノン株式会社
電子機器
10日前
シャープ株式会社
電子機器
24日前
キヤノン株式会社
電子機器
10日前
個人
納骨堂システム
1か月前
個人
技術実行管理システム
25日前
株式会社イノベイト
広告装置
13日前
キヤノン電子株式会社
通信システム
3日前
個人
不動産情報提供システム
20日前
合同会社IPマネジメント
内部不正対策
18日前
個人
ネイルスキルテストシステム
24日前
トヨタ自動車株式会社
管理システム
5日前
続きを見る
他の特許を見る