特許ウォッチ

公開番号2024078158
公報種別公開特許公報(A)
公開日2024-06-10
出願番号2022190552
出願日2022-11-29
発明の名称文字抽出方法
出願人トヨタ自動車株式会社
代理人個人,個人
主分類G06T 7/70 20170101AFI20240603BHJP(計算;計数)
要約【課題】画像のうち、所定の情報の内容を示す文字が記載されている部分を探し出すのに要する時間が長くなることを抑制できること。
【解決手段】文字抽出方法は、画像を複数の区画に区分けすること(S13)、所定の情報を基に、所定の情報の内容を示す文字が記載されている可能性が最も高い区画を、複数の区画の中から選択すること(S17、S19)、及び、選択した区画から所定の情報の内容を示す文字を抽出すること(S21,S23)、をコンピューターに実行させる。
【選択図】図4
特許請求の範囲【請求項１】
画像データで示される画像から所定の情報の内容を示す文字を抽出する文字抽出方法であって、
前記画像を複数の区画に区分けすることと、
前記所定の情報を基に、当該所定の情報の内容を示す文字が記載されている可能性が最も高い前記区画を、前記複数の区画の中から選択することと、
選択した前記区画から前記所定の情報の内容を示す文字を抽出することと、をコンピューターに実行させる
文字抽出方法。
続きを表示（約 810 文字）【請求項２】
前記所定の情報の内容を示す文字が記載されている可能性が最も高い前記区画を、前記複数の区画の中から選択する場合、前記所定の情報を基に、当該所定の情報の内容を示す文字が記載されている可能性の高い順に前記複数の区画に対して順位付けを行い、順位の最も高い前記区画を前記コンピューターに選択させ、
順位の最も高い前記区画から、前記所定の情報の内容を示す文字を抽出できなかった場合に、２番目に順位の高い前記区画を前記複数の区画の中から選択することと、
前記２番目に順位の高い前記区画から前記所定の情報の内容を示す文字を抽出することと、を前記コンピューターに実行させる
請求項１に記載の文字抽出方法。
【請求項３】
前記コンピューターは、機械学習の施された学習済モデルを記憶する記憶装置を備えており、前記学習済モデルは、前記所定の情報及び前記画像データを入力変数とし、前記画像を区分けした前記複数の区画について、当該所定の情報の内容を示す文字が記載されている可能性の大きさを示す値を出力変数として出力するものであり、
前記複数の区画に対して順位付けを行う場合、前記所定の情報及び前記画像データを入力変数として前記学習済モデルに入力した際の当該学習済モデルの出力変数を基に、前記複数の区画に対して順位付けを前記コンピューターに行わせる
請求項２に記載の文字抽出方法。
【請求項４】
前記学習済モデルの入力変数は、前記画像に写っている書類の種類をさらに含んでおり、
前記複数の区画に対して順位付けを行う場合、前記所定の情報、前記画像データ及び前記書類の種類を入力変数として前記学習済モデルに入力した際の当該学習済モデルの出力変数を基に、前記複数の区画に対して順位付けを前記コンピューターに行わせる
請求項３に記載の文字抽出方法。

発明の詳細な説明【技術分野】
【０００１】
本発明は、画像から文字を抽出する文字抽出方法に関する。
続きを表示（約 1,400 文字）【背景技術】
【０００２】
特許文献１には、光学文字識別の技術を用いてテキストの画像をテキスト形式に変換する方法の一例が開示されている。具体的には、当該方法では、識別対象のピクチャの中からテキスト領域の囲み枠を確定し、当該囲み枠に基づいて、識別対象のピクチャからテキスト領域ピクチャが抽出される。続いて、当該テキスト領域ピクチャの中からテキスト行の囲み枠を確定し、当該囲み枠に基づいて、当該テキスト領域ピクチャからテキスト行ピクチャが抽出される。そして、当該テキスト行ピクチャに対してテキストシーケンス識別を行うことにより、識別結果が得られる。
【０００３】
なお、識別結果を得る際には、軽量テキストシーケンス識別モデルが用いられる。当該識別モデルは、機械学習が施された学習済モデルである。
【先行技術文献】
【特許文献】
【０００４】
特開２０２１－１９７１９０号公報
【発明の概要】
【発明が解決しようとする課題】
【０００５】
上記の方法では、識別対象のピクチャから、所望する情報の内容を示す文字が記載されている部分をテキスト行ピクチャとして探し出すのに時間がかかるおそれがある。
【課題を解決するための手段】
【０００６】
上記課題を解決するための文字抽出方法は、画像データで示される画像から所定の情報の内容を示す文字を抽出する方法である。当該文字抽出方法は、前記画像を複数の区画に区分けすることと、前記所定の情報を基に、当該所定の情報の内容を示す文字が記載されている可能性が最も高い前記区画を、前記複数の区画の中から選択することと、選択した前記区画から前記所定の情報の内容を示す文字を抽出することと、をコンピューターに実行させる。
【０００７】
上記文字抽出方法では、画像を複数の区画に区分けすると、当該複数の区画の中から、所定の情報に関する文字が記載されている可能性が最も高い区画が選択される。この際、当該区画は、所定の情報に基づいて選択される。そして、当該区画から所定の文字情報の内容を示す文字が抽出される。したがって、上記文字抽出方法によれば、画像のうち、所定の情報の内容を示す文字が記載されている部分を探し出すのに要する時間が長くなることを抑制できる。
【０００８】
なお、所定の情報の内容を示す文字が記載されている可能性が最も高い区画を、複数の区画の中から選択する際に、機械学習が施された学習済モデルを用いてもよい。
【図面の簡単な説明】
【０００９】
図１は、実施形態の文字抽出方法を実現するための抽出装置の概略を示すブロック図である。
図２は、設計図面の画像を示す模式図である。
図３は、報告書の画像を示す模式図である。
図４は、実施形態の文字抽出方法を示すフローチャートである。
【発明を実施するための形態】
【００１０】
以下、文字抽出方法の一実施形態を図１～図４に従って説明する。
本実施形態の文字抽出方法は、画像データで示される画像に記載されている文字を、当該画像から抽出する方法である。詳しくは、文字抽出方法は、所定の情報の内容を示す文字を画像から抽出する方法である。
（【００１１】以降は省略されています）

関連特許