TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024180278
公報種別公開特許公報(A)
公開日2024-12-26
出願番号2024060237
出願日2024-04-03
発明の名称携帯型の文字認識装置
出願人株式会社デンソーウェーブ
代理人弁理士法人 快友国際特許事務所
主分類G06V 30/146 20220101AFI20241219BHJP(計算;計数)
要約【課題】携帯型の文字認識装置において、文字を撮像した画像を補正する新たな技術を提供する。
【解決手段】文字認識装置は、光源と、前記光源によって照射される光の像を所定の外観を有する指示マーカへ変換する変換素子と、前記指示マーカが投影された文字を撮像するイメージセンサと、前記イメージセンサから特定の画像を取得する取得部であって、前記特定の画像は、前記文字を撮像した特定の文字画像と、前記指示マーカを撮像した特定のマーカ画像と、を含む、前記取得部と、前記特定のマーカ画像の外観が前記所定の外観から変形している度合いを利用して、前記特定の画像から、前記特定の文字画像の外観を補正した補正後の画像を生成する生成部と、前記補正後の画像に対する文字認識の処理を実行する処理実行部と、を備える。
【選択図】図3
特許請求の範囲【請求項1】
携帯型の文字認識装置であって、
光源と、
前記光源によって照射される光の像を所定の外観を有する指示マーカへ変換する変換素子と、
前記指示マーカが投影された文字を撮像するイメージセンサと、
前記イメージセンサから特定の画像を取得する取得部であって、前記特定の画像は、前記文字を撮像した特定の文字画像と、前記指示マーカを撮像した特定のマーカ画像と、を含む、前記取得部と、
前記特定のマーカ画像の外観が前記所定の外観から変形している度合いを利用して、前記特定の画像から、前記特定の文字画像の外観を補正した補正後の画像を生成する生成部と、
前記補正後の画像に対する文字認識の処理を実行する処理実行部と、
を備える、文字認識装置。
続きを表示(約 1,700 文字)【請求項2】
前記所定の外観は、第1直線と、前記第1直線と直交する第2直線と、を含む十字型の形状を含み、
前記生成部は、前記特定のマーカ画像の外観において前記第1直線が前記第2直線によって分割される比率が、前記所定の外観において前記第1直線が前記第2直線によって分割される比率から変化している度合いを利用して、前記補正後の画像を生成する、請求項1に記載の文字認識装置。
【請求項3】
前記所定の外観は、複数個のドッドを直線状に並べて構成された直線を含み、
前記生成部は、前記特定のマーカ画像の外観において前記複数個のドッドが並ぶ間隔が、前記所定の外観において前記複数個のドッドが並ぶ間隔から変化している度合いを利用して、前記補正後の画像を生成する、請求項1に記載の文字認識装置。
【請求項4】
前記所定の外観は、横幅に対する縦幅の比率が特定の比率である平面図形を含み、
前記生成部は、前記特定のマーカ画像の外観における前記横幅に対する前記縦幅の比率が前記特定の比率から変化している度合いを利用して、前記補正後の画像を生成する、請求項1に記載の文字認識装置。
【請求項5】
前記所定の外観は、前記平面図形と、前記平面図形の内側の所定の位置に投影される内側図形と、を含み、
前記生成部は、
前記特定のマーカ画像の外観において前記内側図形が前記所定の位置から移動した方向から前記文字認識装置の姿勢の向きを推定し、
推定した前記姿勢の向きと、前記度合いと、を利用して、前記補正後の画像を生成する、請求項4に記載の文字認識装置。
【請求項6】
前記所定の外観は、第3直線と、前記第3直線から所定の角度で延びる第4直線と、で構成された屈曲図形を含み、
前記生成部は、前記特定のマーカ画像の外観における前記第3直線と前記第4直線の間の角度が前記所定の角度から変化している度合いを利用して、前記補正後の画像を生成する、請求項1に記載の文字認識装置。
【請求項7】
前記文字認識装置は、さらに、
前記特定のマーカ画像が前記所定の外観から欠けた外観を有する場合に、所定の報知動作を実行する報知部を備える、請求項4から6のいずれか一項に記載の文字認識装置。
【請求項8】
前記所定の外観は、複数個のドッドを直線状に等間隔に並べて構成された第5直線を含み、
前記生成部は、前記特定のマーカ画像の外観において前記複数個のドッドが並ぶ間隔が、前記等間隔から、中心よりも端部が広い他の間隔へ変化している場合に、前記補正後の画像を生成し、
前記処理実行部は、
前記特定のマーカ画像の外観において前記複数個のドッドが並ぶ間隔が、前記等間隔から前記他の間隔へ変化している場合に、前記補正後の画像に対する前記文字認識の処理を実行し、
前記特定のマーカ画像の外観において前記複数個のドッドが並ぶ間隔が、前記等間隔である場合に、前記特定の画像に対する前記文字認識の処理を実行する、請求項1に記載の文字認識装置。
【請求項9】
前記所定の外観は、水平方向に延びる前記第5直線と、前記第5直線と直交する第6直線と、を含む十字型の形状を含み、
前記第6直線は、複数個のドッドを直線状に等間隔に並べて構成されており、
前記生成部は、
前記特定のマーカ画像の外観において、前記第6直線のうち、前記第5直線より上側のドッドの間隔に対する、前記第6直線のうち、前記第5直線より下側のドッドの間隔の比率を利用して、前記文字認識装置の姿勢の向きを推定し、
推定した前記姿勢の向きを利用して、前記補正後の画像を生成する、請求項8に記載の文字認識装置。
【請求項10】
前記生成部は、曲面に表示された文字を補正する所定のアルゴリズムを利用して、前記補正後の画像を生成する、請求項8又は9に記載の文字認識装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本明細書で開示する技術は、文字認識の処理を実行する携帯型の文字認識装置に関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
特許文献1の撮像文字認識装置は、撮影時に傾いている文字の傾きを補正する傾き補正を実行し、傾き補正によって補正された文字に対する文字認識を行う。撮像文字認識装置は、例えば、車のナンバープレート認識に利用され、カメラは、斜め前方から一定の傾きを有する位置に設置される。
【先行技術文献】
【特許文献】
【0003】
再表01/026041号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
携帯型の文字認識装置では、ユーザは、文字認識装置を持ち歩き、様々な場所に表示された文字を文字認識装置で撮像する。文字が表示される場所の状況も様々である。本明細書では、携帯型の文字認識装置において、文字を撮像した画像を補正する新たな技術を提供する。
【課題を解決するための手段】
【0005】
本明細書で開示する文字認識装置は、光源と、前記光源によって照射される光の像を所定の外観を有する指示マーカへ変換する変換素子と、前記指示マーカが投影された文字を撮像するイメージセンサと、前記イメージセンサから特定の画像を取得する取得部であって、前記特定の画像は、前記文字を撮像した特定の文字画像と、前記指示マーカを撮像した特定のマーカ画像と、を含む、前記取得部と、前記特定のマーカ画像の外観が前記所定の外観から変形している度合いを利用して、前記特定の画像から、前記特定の文字画像の外観を補正した補正後の画像を生成する生成部と、前記補正後の画像に対する文字認識の処理を実行する処理実行部と、を備える。
【0006】
上記の構成によれば、指示マーカが文字に投影されることにより、ユーザは、文字認識の対象の文字を指定することができる。特定の文字画像は、様々な原因により、本来の文字の外観(即ち正面から撮像した文字の外観)から変形する。例えば、文字認識装置を斜めの姿勢で把持して、高所の文字を撮像する場合である。この場合、指示マーカも文字が表示されている面に対して斜めに投影され、斜めに投影された指示マーカの外観は所定の外観から変形する。文字認識装置の斜めの姿勢と特定のマーカ画像の外観が所定の外観から変形している度合いとの間には所定の相関関係が存在する。特定のマーカ画像の外観が所定の外観から変形している度合いを利用すれば、文字認識装置の斜めの姿勢に起因して変形している特定の文字画像の外観を本来の文字の外観に近づけるように補正することができる。なお、高所の文字を撮像する状況は、一例であり、例えば、低所の文字の撮像、斜めの壁や湾曲した壁等の特殊な表面に表示された文字の撮像等が想定される。
【0007】
前記所定の外観は、第1直線と、前記第1直線と直交する第2直線と、を含む十字型の形状を含み、前記生成部は、前記特定のマーカ画像の外観において前記第1直線が前記第2直線によって分割される比率が、前記所定の外観において前記第1直線が前記第2直線によって分割される比率から変化している度合いを利用して、前記補正後の画像を生成してもよい。
【0008】
例えば、高所の文字を撮像する場合には、文字に投影された指示マーカの外観において、第1直線のうちの第2直線より下側の部分が元の長さから縮み、第1直線のうちの第2直線よりも上側の部分が元の長さよりも延びる。上記の構成によれば、第2直線によって分割される第1直線の比率が変化する度合いを利用して、特定の文字画像の外観を補正することができる。
【0009】
前記所定の外観は、複数個のドッドを直線状に並べて構成された直線を含み、前記生成部は、前記特定のマーカ画像の外観において前記複数個のドッドが並ぶ間隔が、前記所定の外観において前記複数個のドッドが並ぶ間隔から変化している度合いを利用して、前記補正後の画像を生成してもよい。
【0010】
例えば、所定の外観において複数個のドッドが等間隔に並んでいることを想定する。高所の文字を撮像する場合には、文字に投影された指示マーカの外観において、複数個のドッドが並ぶ間隔が下側から上側へ向かうにつれて徐々に広がる。上記の構成によれば、複数個のドッドが並ぶ間隔が変化する度合いを利用して、特定の文字画像の外観を補正することができる。なお、所定の外観において複数個のドッドが並ぶ間隔が予め決まっていればよく、所定の外観において複数個のドッドは等間隔に並んでいなくてもよい。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
物品
24日前
個人
認証システム
1か月前
個人
自動精算システム
17日前
個人
保証金管理システム
1か月前
個人
救急搬送システム
24日前
個人
管理サーバ
3日前
個人
鑑定証明システム
1か月前
個人
人的価値発掘システム
2か月前
個人
業界地図作成システム
2か月前
キヤノン株式会社
印刷装置
17日前
キヤノン電子株式会社
情報処理装置
2か月前
株式会社MRC
集客システム
1か月前
個人
生成AIとの常時接続システム
24日前
個人
技術マッチングシステム
1か月前
個人
VRによる人体各部位の立体化
3日前
トヨタ自動車株式会社
推定装置
10日前
個人
配送システムおよび同包箱
2か月前
株式会社COLORS
表示装置
18日前
キヤノン株式会社
印刷管理装置
1か月前
個人
未来型家系図構築システム
12日前
ミサワホーム株式会社
管理装置
2か月前
株式会社ネットブリッジ
展示販売装置
1か月前
トヨタ自動車株式会社
分析装置
1か月前
ミサワホーム株式会社
システム
2か月前
キヤノン株式会社
情報処理装置
5日前
個人
コンテンツ開示順位判定システム
19日前
キヤノン株式会社
印刷制御装置
1か月前
株式会社SEKT
文字認識装置
13日前
個人
動作のデザイン評価の方法及び装置
2か月前
ミサワホーム株式会社
プログラム
1か月前
個人
文字入力方法、文字入力プログラム
1か月前
トヨタ自動車株式会社
表認識装置
12日前
ローム株式会社
ソース機器
24日前
キヤノン電子株式会社
業務管理システム
17日前
オムロン株式会社
認証中継サーバ
2か月前
富士通株式会社
情報処理プログラム
12日前
続きを見る