TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024113483
公報種別公開特許公報(A)
公開日2024-08-22
出願番号2023018502
出願日2023-02-09
発明の名称表認識方法
出願人トヨタ自動車株式会社
代理人個人
主分類G06V 30/14 20220101AFI20240815BHJP(計算;計数)
要約【課題】表を高精度に認識することができる表認識方法を提供する。
【解決手段】サーバなどのコンピュータである表認識装置が実行する表認識方法であって、ドキュメント画像データ130から、第1方向にそれぞれ配列された複数の文字列を抽出し、複数の文字列の各々に基準点Pを設け、第1方向に直交する第2方向における基準点の座標に基づいて、複数の文字列を複数のグループG#1~G#4に分け、複数のグループのうち、文字列の数が同じであり、第1方向における基準点の座標同士の差分が所定値以下である2以上のグループを表として認識して表データ131を生成する。
【選択図】図3
特許請求の範囲【請求項1】
画像から、第1方向にそれぞれ配列された複数の文字列を抽出し、
前記複数の文字列の各々に基準点を設け、
前記第1方向に直交する第2方向における前記基準点の座標に基づいて、前記複数の文字列を複数のグループに分け、
前記複数のグループのうち、前記文字列の数が同じであり、前記第1方向における前記基準点の座標同士の差分が所定値以下である2以上のグループを表として認識する、
処理を、コンピュータが実行する、
表認識方法。
続きを表示(約 500 文字)【請求項2】
前記基準点を設ける処理は、前記文字列の前記第1方向における一方の端部、他方の端部、及び中央部から前記基準点を選択する、
請求項1に記載の表認識方法。
【請求項3】
前記2以上のグループを表として認識する処理において、前記複数のグループのうち、前記文字列の数が同じであり、前記第1方向における前記基準点の座標が揃っている2以上のグループが存在しない場合、前記基準点を、前記文字列の前記第1方向における前記端部及び前記中央部のうち、未選択の位置に切り替える、
請求項2に記載の表認識方法。
【請求項4】
前記複数の文字列を抽出する処理において、前記画像を入力として、前記画像内の文字を出力する、教師あり学習による機械学習済みの抽出モデルを用いて前記画像から前記複数の文字列を抽出する、
請求項1または2に記載の表認識方法。
【請求項5】
前記複数の文字列を抽出する処理において、前記第1方向の沿った前記画像内の文字間の距離に基づき前記複数の文字列を抽出する、
請求項1または2に記載の表認識方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、表認識方法に関する。
続きを表示(約 1,100 文字)【背景技術】
【0002】
例えば特許文献1には、配列方向の座標が重なる文字群同士を列として登録することにより表を認識する点が記載されている。
【先行技術文献】
【特許文献】
【0003】
特開2001-331763号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、上記の手法によると、例えば表以外の文字群でも配列方向の長さが他の文字群より長ければ、表内の文字群と座標が重なることがあるため、表が誤って認識されるおそれがある。
【0005】
そこで本発明は上記の課題に鑑みてなされたものであり、表を高精度に認識することができる表認識方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の表認識方法は、画像から、第1方向にそれぞれ配列された複数の文字列を抽出し、前記複数の文字列の各々に基準点を設け、前記第1方向に直交する第2方向における前記基準点の座標に基づいて、前記複数の文字列を複数のグループに分け、前記複数のグループのうち、前記文字列の数が同じであり、前記第1方向における前記基準点の座標同士の差分が所定値以下である2以上のグループを表として認識する、処理を、コンピュータが実行する方法である。
【0007】
上記の表認識方法において、前記基準点を設ける処理は、前記文字列の前記第1方向における一方の端部、他方の端部、及び中央部から前記基準点を選択してもよい。
【0008】
上記の表認識方法において、前記2以上のグループを表として認識する処理において、前記複数のグループのうち、前記文字列の数が同じであり、前記第1方向における前記基準点の座標が揃っている2以上のグループが存在しない場合、前記基準点を、前記文字列の前記第1方向における前記端部及び前記中央部のうち、未選択の位置に切り替えてもよい。
【0009】
上記の表認識方法において、前記複数の文字列を抽出する処理において、前記画像を入力として、前記画像内の文字を出力する、教師あり学習による機械学習済みの抽出モデルを用いて前記画像から前記複数の文字列を抽出してもよい。
【0010】
上記の表認識方法において、前記複数の文字列を抽出する処理において、前記第1方向の沿った前記画像内の文字間の距離に基づき前記複数の文字列を抽出してもよい。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
GPSロガー
12日前
個人
デトろぐシステム
11日前
個人
情報処理システム
1か月前
個人
防災情報システム
1か月前
個人
管理装置
4日前
日本精機株式会社
表示装置
25日前
個人
指先受の付いたマウス。
28日前
個人
介護者指名システム
1か月前
個人
都市経営シミュレーション
17日前
個人
管理装置
6日前
個人
特徴検討支援システム
4日前
個人
契約管理サーバ
3日前
有限会社マイコム
制御盤のAI見積
1か月前
個人
生活困窮者相談業務支援システム
2か月前
國立臺灣大學
操作補助システム
18日前
中国電力株式会社
販売支援方法
2か月前
エムケー精工株式会社
洗車場システム
1か月前
個人
支援システム及び支援方法
19日前
キヤノン株式会社
情報処理装置
1か月前
株式会社Haul
採用支援方法
1か月前
株式会社テクロス
情報処理装置
10日前
株式会社奥村組
削孔位置検出方法
3日前
株式会社Asuka
本人認証方法
1か月前
個人
災害情報表示システム
1か月前
個人
すべて大吉となるおみくじ制作装置
24日前
トヨタ自動車株式会社
車両
4日前
株式会社美好屋商店
広告システム
17日前
株式会社にしがき
会員権システム
1か月前
トヨタ自動車株式会社
表認識方法
1か月前
株式会社野村総合研究所
検証装置
10日前
株式会社JVCケンウッド
処理装置
1か月前
トヨタ自動車株式会社
画像処理装置
1か月前
日本信号株式会社
料金精算システム
24日前
株式会社mov
情報処理装置
1か月前
個人
マイナンバーポイントの直販システム
13日前
トヨタ自動車株式会社
記号認識装置
7日前
続きを見る