TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024169402
公報種別公開特許公報(A)
公開日2024-12-05
出願番号2024084085
出願日2024-05-23
発明の名称枠なしテーブルの傾斜補正方法、傾斜補正装置及びプログラム
出願人株式会社リコー
代理人個人,個人
主分類G06T 7/60 20170101AFI20241128BHJP(計算;計数)
要約【課題】本願は枠なしテーブルの傾斜補正方法、傾斜補正装置および記憶媒体を提供する。
【解決手段】本発明の実施例が提供する枠なしテーブルの傾斜補正方法および傾斜補正装置は、テキスト検出により得られた矩形枠の傾斜角と頂点座標に基づき、枠なしテーブルの外枠線を確定する。複数の矩形枠の傾斜角と頂点座標を総合的に考慮するため、本発明の実施例は得られた枠なしテーブルの画像特の徴点の正確性を向上し、後続する画像傾斜補正処理の性能を改善することができる。
【選択図】図1
特許請求の範囲【請求項1】
枠なしテーブルの傾斜補正装置が実行する、枠なしテーブルの傾斜補正方法であって、
テキストを含む枠なしテーブルの第1矩形画像を取得するステップと、
前記第1矩形画像に対してテキスト検出を行い、前記第1矩形画像におけるテキスト部分及び前記テキスト部分に外接する矩形枠を取得するステップと、
前記第1矩形画像の辺毎に、該辺の近傍にあるに少なくとも一つの矩形枠を含む矩形枠集合を生成し、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定し、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定し、前記基準点を通過し、且つ傾斜角が前記目標傾斜角である直線を、前記枠なしテーブルの外枠線として生成するステップであって、前記目標枠辺は、前記矩形枠における前記辺に最も近接する枠辺であり、前記目標頂点は、前記目標枠辺が通過する頂点である、ステップと、
前記枠なしテーブルの4本の外枠線に基づいて、4つの交差点を決定するステップと、
前記4つの交差点及び4つの所定の目標点に基づいて透視変換を行って透視変換行列を取得するステップと、
前記透視変換行列に基づいて前記第1矩形画像に対して補正を行い、補正された第2矩形画像を生成するステップと、を含む
ことを特徴とする枠なしテーブルの傾斜補正方法。
続きを表示(約 3,000 文字)【請求項2】
前記第1矩形画像の辺毎に矩形枠集合を生成するステップは、
前記第1矩形画像における矩形枠が属する行列を特定するステップであって、同一行の矩形枠において、任意の2つの矩形枠の上枠延長線の間隔は第1閾値より小さく、且つ下枠延長線の間隔は第2閾値より小さく、同一列の矩形枠において、任意の2つの矩形枠の左枠延長線の間隔は第3閾値より小さい、ステップと、
前記第1矩形画像の左側辺に対して、最初の列の矩形枠を選択し、第1矩形枠集合を構成し、前記第1矩形画像の右側辺に対して、最後の列の矩形枠を選択し、第2矩形枠集合を構成し、前記第1矩形画像の頂辺に対して、最初の行の矩形枠を選択し、第3矩形枠集合を構成し、前記第1矩形画像の底辺に対して、最後の行の矩形枠を選択し、第4矩形枠集合を構成するステップと、を含む
ことを特徴とする請求項1に記載の枠なしテーブルの傾斜補正方法。
【請求項3】
前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定するステップは、
前記矩形枠集合における各矩形枠の目標枠辺の基準線に対する角度を計算するステップであって、前記基準線は、所定の水平線または垂直線である、ステップと、
各矩形枠の目標枠の基準線に対する角度の第1統計値を前記目標傾斜角として計算するステップであって、前記第1統計値は、前記角度の中央値または平均値である、ステップと、を含む
ことを特徴とする請求項2に記載の枠なしテーブルの傾斜補正方法。
【請求項4】
前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定するステップは、
前記矩形枠集合における各矩形枠の目標頂点の座標を取得するステップと、
取得した目標頂点の座標の第2統計値を前記基準点の座標として計算するステップであって、前記第2統計値は、前記目標頂点の座標の中央値または平均値である、ステップと、を含む、
ことを特徴とする請求項2に記載の枠なしテーブルの傾斜補正方法。
【請求項5】
前記矩形枠集合における各矩形枠の目標頂点の座標を取得するステップは、
前記第1矩形画像の左側辺に対して、第1矩形集合における各矩形枠の左上角頂点及び/または左下角頂点の座標を取得するステップと、
前記第1矩形画像の右側辺に対して、第2矩形集合における各矩形枠の右上角頂点及び/または右下角頂点の座標を取得するステップと、
前記第1矩形画像の頂辺に対して、第3矩形集合における各矩形枠の左上角頂点及び/または右上角頂点の座標を取得するステップと、
前記第1矩形画像の底辺に対して、第4矩形集合における各矩形枠の左下角頂点及び/または右下角頂点の座標を取得するステップと、を含む
ことを特徴とする請求項4に記載の枠なしテーブルの傾斜補正方法。
【請求項6】
テキストを含む枠なしテーブルの第1矩形画像を取得する画像取得モジュールと、
前記第1矩形画像に対してテキスト検出を行い、前記第1矩形画像におけるテキスト部分及び前記テキスト部分に外接する矩形枠を取得するテキスト検出モジュールと、
前記第1矩形画像の辺毎に、該辺の近傍にあるに少なくとも一つの矩形枠を含む矩形枠集合を生成し、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定し、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定し、前記基準点を通過し、且つ傾斜角が前記目標傾斜角である直線を、前記枠なしテーブルの外枠線として生成する外枠線生成モジュールであって、前記目標枠辺は、前記矩形枠における前記辺に最も近接する枠辺であり、前記目標頂点は、前記目標枠辺が通過する頂点である、外枠線生成モジュールと、
前記枠なしテーブルの4本の外枠線に基づいて、4つの交差点を決定する交差点生成モジュールと、
前記4つの交差点及び4つの所定の目標点に基づいて透視変換を行って透視変換行列を取得する行列取得モジュールと、
前記透視変換行列に基づいて前記第1矩形画像に対して補正を行い、補正された第2矩形画像を生成する画像補正モジュールと、を含む
ことを特徴とする枠なしテーブルの傾斜補正装置。
【請求項7】
前記外枠線生成モジュールは、
前記第1矩形画像における矩形枠が属する行列を特定する第1特定モジュールであって、同一行の矩形枠において、任意の2つの矩形枠の上枠延長線の間隔は第1閾値より小さく、且つ下枠延長線の間隔は第2閾値より小さく、同一列の矩形枠において、任意の2つの矩形枠の左枠延長線の間隔は第3閾値より小さい、第1特定モジュールと、
前記第1矩形画像の左側辺に対して、最初の列の矩形枠を選択し、第1矩形枠集合を構成する第1選択モジュールと、
前記第1矩形画像の右側辺に対して、最後の列の矩形枠を選択し、第2矩形枠集合を構成する第2選択モジュールと、
前記第1矩形画像の頂辺に対して、最初の行の矩形枠を選択し、第3矩形枠集合を構成する第3選択モジュールと、
前記第1矩形画像の底辺に対して、最後の行の矩形枠を選択し、第4矩形枠集合を構成する第4選択モジュールと、を含む
ことを特徴とする請求項6の枠なしテーブルの傾斜補正装置。
【請求項8】
前記外枠線生成モジュールは、
前記矩形枠集合における各矩形枠の目標枠辺の基準線に対する角度を計算する第1計算モジュールであって、前記基準線は、所定の水平線または垂直線である、第1計算モジュールと、
各矩形枠の目標枠の基準線に対する角度の第1統計値を前記目標傾斜角として計算する第2計算モジュールであって、前記第1統計値は、前記角度の中央値または平均値である、第2計算モジュールと、を含む
ことを特徴とする請求項7に記載の枠なしテーブルの傾斜補正装置。
【請求項9】
前記外枠線生成モジュールは、
前記矩形枠集合における各矩形枠の目標頂点の座標を取得する第1取得モジュールと、
取得した目標頂点の座標の第2統計値を前記基準点の座標として計算する第3計算モジュールであって、前記第2統計値は、前記目標頂点の座標の中央値または平均値である、第3計算モジュールと、を更に含む、
ことを特徴とする請求項7に記載の枠なしテーブルの傾斜補正装置。
【請求項10】
前記第1取得モジュールは、
前記第1矩形画像の左側辺に対して、第1矩形集合における各矩形枠の左上角頂点及び/または左下角頂点の座標を取得し、
前記第1矩形画像の右側辺に対して、第2矩形集合における各矩形枠の右上角頂点及び/または右下角頂点の座標を取得し、
前記第1矩形画像の頂辺に対して、第3矩形集合における各矩形枠の左上角頂点及び/または右上角頂点の座標を取得し、
前記第1矩形画像の底辺に対して、第4矩形集合における各矩形枠の左下角頂点及び/または右下角頂点の座標を取得する、
ことを特徴とする請求項9に記載の枠なしテーブルの傾斜補正装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は画像処理技術分野に属し、具体的に枠なしテーブルの傾斜補正方法、傾斜補正装置および記憶媒体に関する。
続きを表示(約 2,800 文字)【背景技術】
【0002】
ドキュメント処理では、紙に印刷されたテキストを識別する必要な場合が多い。紙を撮影し、テキストを含む画像を取得した後、OCR(Optical Character Recognition)で画像を認識することにより、テキストを取得するのが一般的である。例えば、テーブルを含む画像の場合、テーブルのセルとセル内のテキストコンテンツを取得するために、画像に対して表の構造解析とテキスト認識が必要である。
【0003】
テキストを含む画像を撮影する時に、ゆがみが発生しやすい。従来、まず透視変換処理により画像の傾きを補正する処理を行う。完全な枠を有するテーブルの画像は、透視変換処理のための特徴点が容易に得られる。実際の応用において、一部のテーブルは枠のないテーブルの画像である。即ち、テーブル中の縦線と横線が省略される。枠なしテーブルの画像に対して、透視変換処理のための特徴点を取得しにくく、または、取得される特徴点の正確さが低く、後続する画像傾斜補正及びテーブル識別に不利である。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の少なくとも一つの実施例は枠なしテーブルの傾斜補正方法、傾斜補正装置および記憶媒体を提供し、取得される枠なしテーブル画像の特徴点の正確性を向上させ、画像の傾斜補正処理の性能を改善することができる。
【課題を解決するための手段】
【0005】
上記技術問題を解決するために、本発明の実施例は、テキストを含む枠なしテーブルの第1矩形画像を取得するステップと、前記第1矩形画像に対してテキスト検出を行い、前記第1矩形画像におけるテキスト部分及び前記テキスト部分に外接する矩形枠を取得するステップと、前記第1矩形画像の辺毎に、該辺の近傍にあるに少なくとも一つの矩形枠を含む矩形枠集合を生成し、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定し、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定し、前記基準点を通過し、且つ傾斜角が前記目標傾斜角である直線を、前記枠なしテーブルの外枠線として生成するステップであって、前記目標枠辺は、前記矩形枠における前記辺に最も近接する枠辺であり、前記目標頂点は、前記目標枠辺が通過する頂点である、ステップと、前記枠なしテーブルの4本の外枠線に基づいて、4つの交差点を決定するステップと、前記4つの交差点及び4つの所定の目標点に基づいて透視変換を行って透視変換行列を取得するステップと、前記透視変換行列に基づいて前記第1矩形画像に対して補正を行い、補正された第2矩形画像を生成するステップと、を含む枠なしテーブルの傾斜補正方法を提供する。
【0006】
好ましくは、前記第1矩形画像の辺毎に矩形枠集合を生成するステップは、前記第1矩形画像における矩形枠が属する行列を特定するステップであって、同一行の矩形枠において、任意の2つの矩形枠の上枠延長線の間隔は第1閾値より小さく、且つ下枠延長線の間隔は第2閾値より小さく、同一列の矩形枠において、任意の2つの矩形枠の左枠延長線の間隔は第3閾値より小さい、ステップと、前記第1矩形画像の左側辺に対して、最初の列の矩形枠を選択し、第1矩形枠集合を構成し、前記第1矩形画像の右側辺に対して、最後の列の矩形枠を選択し、第2矩形枠集合を構成し、前記第1矩形画像の頂辺に対して、最初の行の矩形枠を選択し、第3矩形枠集合を構成し、前記第1矩形画像の底辺に対して、最後の行の矩形枠を選択し、第4矩形枠集合を構成するステップと、を含む。
【0007】
また、好ましくは、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定するステップは、前記矩形枠集合における各矩形枠の目標枠辺の基準線に対する角度を計算するステップであって、前記基準線は、所定の水平線または垂直線である、ステップと、各矩形枠の目標枠の基準線に対する角度の第1統計値を前記目標傾斜角として計算するステップであって、前記第1統計値は、前記角度の中央値または平均値である、ステップと、を含む。
【0008】
また、好ましくは、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定するステップは、前記矩形枠集合における各矩形枠の目標頂点の座標を取得するステップと、取得した目標頂点の座標の第2統計値を前記基準点の座標として計算するステップであって、前記第2統計値は、前記目標頂点の座標の中央値または平均値である、ステップと、を含む。
【0009】
また、好ましくは、前記矩形枠集合における各矩形枠の目標頂点の座標を取得するステップは、前記第1矩形画像の左側辺に対して、第1矩形集合における各矩形枠の左上角頂点及び/または左下角頂点の座標を取得するステップと、前記第1矩形画像の右側辺に対して、第2矩形集合における各矩形枠の右上角頂点及び/または右下角頂点の座標を取得するステップと、前記第1矩形画像の頂辺に対して、第3矩形集合における各矩形枠の左上角頂点及び/または右上角頂点の座標を取得するステップと、前記第1矩形画像の底辺に対して、第4矩形集合における各矩形枠の左下角頂点及び/または右下角頂点の座標を取得するステップと、を含む。
【0010】
また、本発明の実施例は、テキストを含む枠なしテーブルの第1矩形画像を取得する画像取得モジュールと、前記第1矩形画像に対してテキスト検出を行い、前記第1矩形画像におけるテキスト部分及び前記テキスト部分に外接する矩形枠を取得するテキスト検出モジュールと、前記第1矩形画像の辺毎に、該辺の近傍にあるに少なくとも一つの矩形枠を含む矩形枠集合を生成し、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定し、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定し、前記基準点を通過し、且つ傾斜角が前記目標傾斜角である直線を、前記枠なしテーブルの外枠線として生成する外枠線生成モジュールであって、前記目標枠辺は、前記矩形枠における前記辺に最も近接する枠辺であり、前記目標頂点は、前記目標枠辺が通過する頂点である、外枠線生成モジュールと、前記枠なしテーブルの4本の外枠線に基づいて、4つの交差点を決定する交差点生成モジュールと、前記4つの交差点及び4つの所定の目標点に基づいて透視変換を行って透視変換行列を取得する行列取得モジュールと、前記透視変換行列に基づいて前記第1矩形画像に対して補正を行い、補正された第2矩形画像を生成する画像補正モジュールと、を含む枠なしテーブルの傾斜補正装置を提供する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
情報処理装置
16日前
個人
記入設定プラグイン
8日前
個人
不動産売買システム
今日
株式会社BONNOU
管理装置
13日前
株式会社東芝
電子機器
1日前
ホシデン株式会社
タッチ入力装置
今日
株式会社ワコム
電子消去具
今日
株式会社ライト
情報処理装置
13日前
住友重機械工業株式会社
力覚伝達装置
15日前
株式会社WellGo
個人情報利用方法
16日前
株式会社半導体エネルギー研究所
検索支援方法
13日前
株式会社半導体エネルギー研究所
会計システム
6日前
株式会社WellGo
個人情報秘匿方法
16日前
個人
システム、データおよびプログラム
9日前
トヨタ自動車株式会社
データ収集システム
14日前
株式会社WellGo
ストレージサービス
16日前
株式会社ベイビッグ
管理システム及び管理方法
16日前
旭精工株式会社
料金支払システムおよび料金支払方法
14日前
株式会社共同経営
農企業用の経営診断システム
8日前
ルネサスエレクトロニクス株式会社
半導体装置
6日前
日本電気株式会社
処理装置
1日前
株式会社デンソー
データ処理装置
7日前
株式会社JCA
飲食店情報紹介システム
13日前
株式会社デンソーウェーブ
情報読取装置
6日前
オムロン株式会社
操作装置
16日前
個人
自動調理装置、自動調理プログラム
16日前
日本電気株式会社
回路装置及び制御方法
9日前
株式会社デンソー
電子制御装置
13日前
テイ・エス テック株式会社
車両システム
13日前
トヨタ自動車株式会社
情報処理装置
7日前
株式会社ノーリツ
中継装置
9日前
株式会社デンソーウェーブ
作業管理システム
今日
NECプラットフォームズ株式会社
放熱装置
13日前
富士通株式会社
画像変換機器と方法
16日前
トヨタ自動車株式会社
制御装置
6日前
株式会社アイシン
情報提供システム
1日前
続きを見る