TOP特許意匠商標
特許ウォッチ DM通知 Twitter
10個以上の画像は省略されています。
公開番号2023013501
公報種別公開特許公報(A)
公開日2023-01-26
出願番号2021117728
出願日2021-07-16
発明の名称画像処理装置、画像処理方法、及びプログラム
出願人株式会社リコー
代理人個人
主分類G06V 30/14 20220101AFI20230119BHJP(計算;計数)
要約【課題】画像データに含まれる文字画像の正立方向を識別する処理における精度を向上させることにある。
【解決手段】画像データに含まれる文字画像毎に垂直方向、及び水平方向のサイズに上限値を設定して、上限値内の矩形領域に分割する領域分割部70bと、矩形領域内の文字画像を対象に垂直方向の+方向、及び-方向、並びに前記水平方向の+方向、及び-方向に沿ってそれぞれ文字認識処理を行い、4方向の確信度を算出する確信度算出部70dと、確信度算出部70dにより算出された4方向の各確信度のうち最大の確信度を有する方向を正立方向として判定する正立方向判定部70eと、制御部70と、を備え、制御部70は、正立方向判定部70eが正立方向の判定を行う場合には、通常の文字認識処理を行うときよりも、領域分割部70bに設定するサイズの上限値が大きくなるように制御する。
【選択図】図4
特許請求の範囲【請求項1】
画像データに含まれる文字画像の正立方向を識別し、前記正立方向に沿って通常の文字認識処理を行う画像処理装置であって、
前記画像データに含まれる文字画像毎に垂直方向、及び水平方向のサイズに上限値を設定して、前記上限値内の矩形領域に分割する領域分割部と、
前記矩形領域内の文字画像を対象に前記垂直方向の+方向、及び-方向、並びに前記水平方向の+方向、及び-方向に沿ってそれぞれ文字認識処理を行い、前記4方向の確信度を算出する確信度算出部と、
前記確信度算出部により算出された前記4方向の各確信度のうち最大の確信度を有する方向を正立方向として判定する正立方向判定部と、
制御部と、を備え、
前記制御部は、前記正立方向判定部が前記正立方向の判定を行う場合には、前記通常の文字認識処理を行うときよりも、前記領域分割部に設定する前記サイズの上限値が大きくなるように制御することを特徴とする画像処理装置。
続きを表示(約 1,900 文字)【請求項2】
前記制御部は、前記サイズの実際値が前記サイズの上限値を超えない場合に、前記正立方向判定部による判定結果が不定となったときに、前記サイズの上限値がより大きくなるように制御することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記領域分割部により分割された矩形領域のうち、行または列内の矩形領域において、前記サイズの実際値が前記上限値を超える文字画像の数を計数する計数部を備え、
前記制御部は、前記計数部により計数された前記文字画像の数が行または列内で基準値以下である場合に、前記サイズの上限値がより大きくなるように制御することを特徴とする請求項1に記載の画像処理装置。
【請求項4】
前記計数部は、前記領域分割部により分割された矩形領域のうち、行または列内の矩形領域において、前記サイズの実際値が前記上限値を超える文字画像のうち、当該文字画像同士が隣接している隣接数を計数し、
前記制御部は、前記計数部により計数された前記文字画像の隣接数が行または列内で初めて2つ以上になる場合に、前記サイズの上限値がより大きくなるように制御することを特徴とする請求項3に記載の画像処理装置。
【請求項5】
前記制御部は、前記計数部により計数された前記文字画像の数が同一行内または同一列内で過半数ある場合に、前記サイズの上限値がより大きくなるように制御することを特徴とする請求項3に記載の画像処理装置。
【請求項6】
前記制御部は、前記サイズの実際値が前記サイズの上限値を超える文字画像を抽出し、前記抽出した文字画像が隣接する行または列に跨がっている場合に、前記サイズの上限値を引き継ぐように制御することを特徴とする請求項1に記載の画像処理装置。
【請求項7】
前記確信度算出部が、前記矩形領域内の文字画像を対象に前記垂直方向の+方向、及び-方向、並びに前記水平方向の+方向、及び-方向のうち、少なくとも2方向に沿ってそれぞれ文字認識処理を行い、少なくとも前記2方向の確信度を算出し、
前記正立方向判定部が、前記確信度算出部により算出された少なくとも前記2方向の各確信度が所定の閾値よりも大きい確信度を有する方向を正立方向として判定し、
前記制御部は、前記サイズの上限値を大きくなるように制御した場合に、前記確信度の閾値が大きくなるように制御することを特徴とする請求項1乃至6の何れか一項に記載の画像処理装置。
【請求項8】
前記正立方向判定部は、前記確信度算出部により算出された前記4方向の各確信度のうち少なくとも1つが第1閾値を越えた場合に、確信度が最大となる方向に関してのみ確信度を積算し、各方向について積算した確信度を積算回数で除算した値が、前記第1閾値と異なる第2閾値を越えたときに、当該方向を正立方向とすることを特徴とする請求項6に記載の画像処理装置。
【請求項9】
前記制御部は、前記正立方向判定部が前記正立方向の判定を行った場合に、前記通常の文字認識処理を行うときよりも、前記領域分割部に設定する前記サイズの上限値が大きくなるように制御したときに、当該大きくされた上限値に基づいて、前記通常の文字認識処理における文字サイズの上限値を決定するように制御することを特徴とする請求項1乃至7の何れか一項に記載の画像処理装置。
【請求項10】
画像データに含まれる文字画像の正立方向を識別し、前記正立方向に沿って通常の文字認識処理を行う画像処理方法であって、
前記画像データに含まれる文字画像毎に垂直方向、及び水平方向のサイズに上限値を設定して、前記上限値内の矩形領域に分割する領域分割ステップと、
前記矩形領域内の文字画像を対象に前記垂直方向の+方向、及び-方向、並びに前記水平方向の+方向、及び-方向に沿ってそれぞれ文字認識処理を行い、前記4方向の確信度を算出する確信度算出ステップと、
前記確信度算出ステップにより算出された4方向の各確信度のうち最大の確信度を有する方向を正立方向として判定する正立方向判定ステップと、
制御ステップと、を実行し、
前記制御ステップは、前記正立方向判定ステップが前記正立方向の判定を行う場合には、前記通常の文字認識処理を行うときよりも、前記領域分割ステップに設定する前記サイズの上限値が大きくなるように制御することを特徴とする画像処理方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、及びプログラムに関する。
続きを表示(約 3,700 文字)【背景技術】
【0002】
従来、文字認識処理における1つの手法では、画素数が多い高解像度の光電変換手段と画素数が少ない低解像度の光電変換手段とで画像を読み取っている。ここで、読取対象が小さい文字である場合には高解像度の光電変換手段で読み取った画像データを用い、一方、読取対象が大きな文字である場合には低解像度の光電変換手段で読み取った画像データを用いて文字認識を行う。
特許文献1には、多様な文字サイズの文字の文字認識処理を簡単な構成で精度よく行うことを目的として、画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定し、所定サイズよりも大きいと判定された場合には、画像データにおける少なくとも上記文字を含む領域を当該文字のサイズが上記所定サイズ以下になるように縮小処理し、縮小処理された画像データを用いて上記文字の文字認識処理を行うという技術が開示されている。
このように、特許文献1は、文字サイズに着目した文字認識処理であり、縮小処理を伴うことに起因して処理量が多くなっていた。
【0003】
ところで、スキャンして読み取った文字画像に対しては、まず文字画像の正立方向が不明であるため、文字画像の正立方向を識別しておき、その後、識別して得た正立方向に沿って通常の文字認識処理を行う必要があった。
従来、正立方向の判定処理では、例えば、スキャンした原稿に含まれる文字画像(のいくつか)を90度ずつ回転しながらOCR(Optical Character Recognition:光学的文字認識)処理を行い、最も高い認識確信度を得られる方向(読めるであろう方向)を正立方向とする方法があった。
なお、このようなOCR処理を用いる正立方向の判定処理では、スキャンして得た画像に含まれる文字画像全体に対してOCR処理を行うと処理量が多くなるため、文字画像全体から一部を切り出しておき、切り出された一部の画像を対象にして正立方向の判定処理を行うのが一般的である。
しかし、特許文献1にあっては、文字の正立方向(文字が読める向き、あるいは被写体が正立している向き)を識別することを前提とした文字認識処理ではなかった。
すなわち、特許文献1にあっては、縮小処理された画像データを用いて文字認識処理を行っていたため、正立方向の判定処理の精度が低下するといった問題があった。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の一実施形態は、上記に鑑みてなされたもので、その目的は、画像データに含まれる文字画像の正立方向を識別する処理における精度を向上させることにある。
【課題を解決するための手段】
【0005】
上記課題を解決するために、請求項1記載の発明は、画像データに含まれる文字画像の正立方向を識別し、前記正立方向に沿って通常の文字認識処理を行う画像処理装置であって、前記画像データに含まれる文字画像毎に垂直方向、及び水平方向のサイズに上限値を設定して、前記上限値内の矩形領域に分割する領域分割部と、前記矩形領域内の文字画像を対象に前記垂直方向の+方向、及び-方向、並びに前記水平方向の+方向、及び-方向に沿ってそれぞれ文字認識処理を行い、前記4方向の確信度を算出する確信度算出部と、前記確信度算出部により算出された4方向の各確信度のうち最大の確信度を有する方向を正立方向として判定する正立方向判定部と、制御部と、を備え、前記制御部は、前記正立方向判定部が前記正立方向の判定を行う場合には、前記通常の文字認識処理を行うときよりも、前記領域分割部に設定する前記サイズの上限値が大きくなるように制御することを特徴とする。
【発明の効果】
【0006】
本発明によれば、画像データに含まれる文字画像の正立方向を識別する処理における精度を向上させることができる。
【図面の簡単な説明】
【0007】
本発明の一実施形態に係わる画像処理装置を含むシステムの構成を例示する図である。
図1に示す画像形成装置のハードウェア構成の一例を示す図である。
図1に示すパーソナルコンピュータのハードウェア構成図である。
本発明の一実施形態に係わる画像処理装置の機能を表す機能ブロック図である。
本発明の第1実施形態に係わる画像処理装置の処理を表すフローチャートである。
(a)~(e)は本発明の各実施形態に係わる画像処理装置の処理対象となる画像を表す図である。
本発明の第2実施形態に係わる画像処理装置の処理を表すフローチャートである。
本発明の第3実施形態に係わる画像処理装置の処理を表すフローチャートである。
本発明の第4実施形態に係わる画像処理装置の処理を表すフローチャートである。
(a)~(d)は本発明の第5実施形態に係わる画像処理装置の処理を表すフローチャートである。
【発明を実施するための形態】
【0008】
以下、本発明を図面に示した実施の形態により詳細に説明する。
本発明は、画像データに含まれる文字画像の正立方向を識別する処理における精度を向上させるために、以下の構成を有する。
すなわち、本発明の画像処理装置は、画像データに含まれる文字画像の正立方向を識別し、正立方向に沿って通常の文字認識処理を行う画像処理装置であって、画像データに含まれる文字画像毎に垂直方向、及び水平方向のサイズに上限値を設定して、上限値内の矩形領域に分割する領域分割部と、矩形領域内の文字画像を対象に垂直方向の+方向、及び-方向、並びに水平方向の+方向、及び-方向に沿ってそれぞれ文字認識処理を行い、4方向の確信度を算出する確信度算出部と、確信度算出部により算出された4方向の各確信度のうち最大の確信度を有する方向を正立方向として判定する正立方向判定部と、制御部と、を備え、制御部は、正立方向判定部が正立方向の判定を行う場合には、通常の文字認識処理を行うときよりも、領域分割部に設定するサイズの上限値が大きくなるように制御することを特徴とする。
以上の構成を備えることにより、画像データに含まれる文字画像の正立方向を識別する処理における精度を向上させることができる。
上記記載の本発明の特徴について、以下の図面を用いて詳細に解説する。但し、この実施形態に記載される構成要素、種類、組み合わせ、形状、その相対配置などは特定的な記載がない限り、この発明の範囲をそれのみに限定する主旨ではなく単なる説明例に過ぎない。
上記の本発明の特徴に関して、以下、図面を用いて詳細に説明する。
【0009】
<システム構成>
図1は、本発明の一実施形態に係わる画像処理装置を含むシステムの構成を例示する図である。
システム1は、画像形成装置10、2つのパーソナルコンピュータであるPC80、PC90を備え、これらが通信ネットワークNを介して相互にデータの送受信を行う構成となっている。
画像形成装置10は、原稿シートを読み取るスキャナ部31、シート上に画像を形成するプリンタ部32、及び通信機能などを備えるMFP(Multifunction Peripheral)である。スキャナ部31は、ADF(Auto Document Feeder:自動原稿送り装置)が設けられている場合はADFにセットされた原稿シートを読み取る。画像形成装置10は、スキャナ部31、プリンタ部32を用いることで、コピー、プリンタ、スキャナ、ファクシミリの各機能を利用者に提供する。また操作パネル40を介して利用者から指示を受け付け、もしくは通信ネットワークNを介してPC80、PC90から指示を受け付けることで、画像形成装置10はこれら機能を実行する。
【0010】
また、画像形成装置10は、光学文字認識(以下、必要に応じて単に「文字認識」、もしくは「OCR処理」と称する)の技術を用いて、スキャナ部31により読み取られたスキャン画像から、電子データのテキストを抽出する機能、及びそのテキストとスキャン画像をもとに,編集可能な文書(ex.マイクロソフトWord文書)を作成する機能を有している。
なお、PC80、PC90は、画像形成装置10を利用する一般ユーザが用いる端末(コンピュータ)である。
本発明に係わる画像処理装置は、図1に示す画像形成装置10、またはPC80、PC90により構成される。
なお、PC80、PC90は、画像形成装置10を利用する一般ユーザが用いる端末(コンピュータ)である。
(【0011】以降は省略されています)

特許ウォッチbot のツイート
この特許をJ-PlatPatで参照する

関連特許

個人
手乗せマウス。
1か月前
個人
画像処理装置
27日前
個人
防犯システム
29日前
株式会社リコー
周辺装置
1か月前
個人
デジタル認証システム
23日前
個人
デジタル認証システム
20日前
個人
情報端末用タッチペン
1か月前
個人
改善会議システム
14日前
個人
商品取引システム
1か月前
凸版印刷株式会社
メタルカード
3日前
個人
パーソナルコンピューター
10日前
キーコム株式会社
花火プリンター
7日前
個人
オンライン学習支援システム
1か月前
個人
そろばん
1か月前
株式会社東京
情報提供方法
今日
株式会社アジラ
対象追跡装置
27日前
株式会社大野
遺骨合祀システム
10日前
個人
スポーツ用具管理システム
21日前
凸版印刷株式会社
ICモジュール基板
7日前
凸版印刷株式会社
金属製指紋認証カード
3日前
学校法人早稲田大学
触覚提示装置
20日前
東洋電装株式会社
操作装置
1か月前
個人
価値評価システム
9日前
株式会社サタケ
穀物乾燥機の選定システム
20日前
キヤノン株式会社
プリンタドライバ
1か月前
株式会社アクト
投票システム
今日
アイリスオーヤマ株式会社
調理装置
10日前
株式会社日立国際電気
通信システム
10日前
株式会社ノンピ
情報処理装置
7日前
個人
広告装置およびプログラム
15日前
株式会社アスタリスク
読取装置
27日前
中部電力株式会社
情報処理装置
1か月前
株式会社豊田自動織機
制御装置
1か月前
株式会社知財事業研究所
金融システム
1か月前
花王株式会社
香り関連情報の抽出方法
1か月前
個人
商品管理システム及びプログラム
15日前
続きを見る