TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024078158
公報種別公開特許公報(A)
公開日2024-06-10
出願番号2022190552
出願日2022-11-29
発明の名称文字抽出方法
出願人トヨタ自動車株式会社
代理人個人,個人
主分類G06T 7/70 20170101AFI20240603BHJP(計算;計数)
要約【課題】画像のうち、所定の情報の内容を示す文字が記載されている部分を探し出すのに要する時間が長くなることを抑制できること。
【解決手段】文字抽出方法は、画像を複数の区画に区分けすること(S13)、所定の情報を基に、所定の情報の内容を示す文字が記載されている可能性が最も高い区画を、複数の区画の中から選択すること(S17、S19)、及び、選択した区画から所定の情報の内容を示す文字を抽出すること(S21,S23)、をコンピューターに実行させる。
【選択図】図4
特許請求の範囲【請求項1】
画像データで示される画像から所定の情報の内容を示す文字を抽出する文字抽出方法であって、
前記画像を複数の区画に区分けすることと、
前記所定の情報を基に、当該所定の情報の内容を示す文字が記載されている可能性が最も高い前記区画を、前記複数の区画の中から選択することと、
選択した前記区画から前記所定の情報の内容を示す文字を抽出することと、をコンピューターに実行させる
文字抽出方法。
続きを表示(約 810 文字)【請求項2】
前記所定の情報の内容を示す文字が記載されている可能性が最も高い前記区画を、前記複数の区画の中から選択する場合、前記所定の情報を基に、当該所定の情報の内容を示す文字が記載されている可能性の高い順に前記複数の区画に対して順位付けを行い、順位の最も高い前記区画を前記コンピューターに選択させ、
順位の最も高い前記区画から、前記所定の情報の内容を示す文字を抽出できなかった場合に、2番目に順位の高い前記区画を前記複数の区画の中から選択することと、
前記2番目に順位の高い前記区画から前記所定の情報の内容を示す文字を抽出することと、を前記コンピューターに実行させる
請求項1に記載の文字抽出方法。
【請求項3】
前記コンピューターは、機械学習の施された学習済モデルを記憶する記憶装置を備えており、前記学習済モデルは、前記所定の情報及び前記画像データを入力変数とし、前記画像を区分けした前記複数の区画について、当該所定の情報の内容を示す文字が記載されている可能性の大きさを示す値を出力変数として出力するものであり、
前記複数の区画に対して順位付けを行う場合、前記所定の情報及び前記画像データを入力変数として前記学習済モデルに入力した際の当該学習済モデルの出力変数を基に、前記複数の区画に対して順位付けを前記コンピューターに行わせる
請求項2に記載の文字抽出方法。
【請求項4】
前記学習済モデルの入力変数は、前記画像に写っている書類の種類をさらに含んでおり、
前記複数の区画に対して順位付けを行う場合、前記所定の情報、前記画像データ及び前記書類の種類を入力変数として前記学習済モデルに入力した際の当該学習済モデルの出力変数を基に、前記複数の区画に対して順位付けを前記コンピューターに行わせる
請求項3に記載の文字抽出方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、画像から文字を抽出する文字抽出方法に関する。
続きを表示(約 1,400 文字)【背景技術】
【0002】
特許文献1には、光学文字識別の技術を用いてテキストの画像をテキスト形式に変換する方法の一例が開示されている。具体的には、当該方法では、識別対象のピクチャの中からテキスト領域の囲み枠を確定し、当該囲み枠に基づいて、識別対象のピクチャからテキスト領域ピクチャが抽出される。続いて、当該テキスト領域ピクチャの中からテキスト行の囲み枠を確定し、当該囲み枠に基づいて、当該テキスト領域ピクチャからテキスト行ピクチャが抽出される。そして、当該テキスト行ピクチャに対してテキストシーケンス識別を行うことにより、識別結果が得られる。
【0003】
なお、識別結果を得る際には、軽量テキストシーケンス識別モデルが用いられる。当該識別モデルは、機械学習が施された学習済モデルである。
【先行技術文献】
【特許文献】
【0004】
特開2021-197190号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記の方法では、識別対象のピクチャから、所望する情報の内容を示す文字が記載されている部分をテキスト行ピクチャとして探し出すのに時間がかかるおそれがある。
【課題を解決するための手段】
【0006】
上記課題を解決するための文字抽出方法は、画像データで示される画像から所定の情報の内容を示す文字を抽出する方法である。当該文字抽出方法は、前記画像を複数の区画に区分けすることと、前記所定の情報を基に、当該所定の情報の内容を示す文字が記載されている可能性が最も高い前記区画を、前記複数の区画の中から選択することと、選択した前記区画から前記所定の情報の内容を示す文字を抽出することと、をコンピューターに実行させる。
【0007】
上記文字抽出方法では、画像を複数の区画に区分けすると、当該複数の区画の中から、所定の情報に関する文字が記載されている可能性が最も高い区画が選択される。この際、当該区画は、所定の情報に基づいて選択される。そして、当該区画から所定の文字情報の内容を示す文字が抽出される。したがって、上記文字抽出方法によれば、画像のうち、所定の情報の内容を示す文字が記載されている部分を探し出すのに要する時間が長くなることを抑制できる。
【0008】
なお、所定の情報の内容を示す文字が記載されている可能性が最も高い区画を、複数の区画の中から選択する際に、機械学習が施された学習済モデルを用いてもよい。
【図面の簡単な説明】
【0009】
図1は、実施形態の文字抽出方法を実現するための抽出装置の概略を示すブロック図である。
図2は、設計図面の画像を示す模式図である。
図3は、報告書の画像を示す模式図である。
図4は、実施形態の文字抽出方法を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、文字抽出方法の一実施形態を図1~図4に従って説明する。
本実施形態の文字抽出方法は、画像データで示される画像に記載されている文字を、当該画像から抽出する方法である。詳しくは、文字抽出方法は、所定の情報の内容を示す文字を画像から抽出する方法である。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
暗号化記憶媒体
1か月前
個人
管理装置
1か月前
個人
プロジェクター
1か月前
個人
環境情報処理装置
4日前
個人
求人支援システム
21日前
個人
外食予約システム
4日前
キヤノン電子株式会社
周辺機器
1か月前
個人
求人マッチングサーバ
1か月前
個人
海外在住支援システム
4日前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
株式会社ワコム
電子ペン
1か月前
アスエネ株式会社
水管理の方法
1か月前
株式会社ワコム
電子ペン
1か月前
シャープ株式会社
情報出力装置
19日前
株式会社ワコム
電子ペン
7日前
トヨタ自動車株式会社
検査装置
1か月前
株式会社寺岡精工
システム
1か月前
大日本印刷株式会社
作業台
1か月前
東洋電装株式会社
操作装置
7日前
CKD株式会社
遠隔支援システム
1か月前
東洋電装株式会社
操作装置
7日前
東洋電装株式会社
操作装置
7日前
株式会社NGA
画像投稿システム
1か月前
株式会社カロニマ
情報発信システム
11日前
個人
ポイント増量アプリ「太陽光銭サー」
1か月前
トヨタ紡織株式会社
検査装置
28日前
日本信号株式会社
料金精算システム
17日前
BH株式会社
商品販売システム
1か月前
株式会社三富
取引管理システム
1か月前
株式会社小野測器
移動量計測システム
1か月前
株式会社アジラ
異常行動検出システム
28日前
個人
AI営業システム
1か月前
シーアンドアールエム株式会社
広告装置
14日前
続きを見る