TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024169402
公報種別公開特許公報(A)
公開日2024-12-05
出願番号2024084085
出願日2024-05-23
発明の名称枠なしテーブルの傾斜補正方法、傾斜補正装置及びプログラム
出願人株式会社リコー
代理人個人,個人
主分類G06T 7/60 20170101AFI20241128BHJP(計算;計数)
要約【課題】本願は枠なしテーブルの傾斜補正方法、傾斜補正装置および記憶媒体を提供する。
【解決手段】本発明の実施例が提供する枠なしテーブルの傾斜補正方法および傾斜補正装置は、テキスト検出により得られた矩形枠の傾斜角と頂点座標に基づき、枠なしテーブルの外枠線を確定する。複数の矩形枠の傾斜角と頂点座標を総合的に考慮するため、本発明の実施例は得られた枠なしテーブルの画像特の徴点の正確性を向上し、後続する画像傾斜補正処理の性能を改善することができる。
【選択図】図1
特許請求の範囲【請求項1】
枠なしテーブルの傾斜補正装置が実行する、枠なしテーブルの傾斜補正方法であって、
テキストを含む枠なしテーブルの第1矩形画像を取得するステップと、
前記第1矩形画像に対してテキスト検出を行い、前記第1矩形画像におけるテキスト部分及び前記テキスト部分に外接する矩形枠を取得するステップと、
前記第1矩形画像の辺毎に、該辺の近傍にあるに少なくとも一つの矩形枠を含む矩形枠集合を生成し、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定し、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定し、前記基準点を通過し、且つ傾斜角が前記目標傾斜角である直線を、前記枠なしテーブルの外枠線として生成するステップであって、前記目標枠辺は、前記矩形枠における前記辺に最も近接する枠辺であり、前記目標頂点は、前記目標枠辺が通過する頂点である、ステップと、
前記枠なしテーブルの4本の外枠線に基づいて、4つの交差点を決定するステップと、
前記4つの交差点及び4つの所定の目標点に基づいて透視変換を行って透視変換行列を取得するステップと、
前記透視変換行列に基づいて前記第1矩形画像に対して補正を行い、補正された第2矩形画像を生成するステップと、を含む
ことを特徴とする枠なしテーブルの傾斜補正方法。
続きを表示(約 3,000 文字)【請求項2】
前記第1矩形画像の辺毎に矩形枠集合を生成するステップは、
前記第1矩形画像における矩形枠が属する行列を特定するステップであって、同一行の矩形枠において、任意の2つの矩形枠の上枠延長線の間隔は第1閾値より小さく、且つ下枠延長線の間隔は第2閾値より小さく、同一列の矩形枠において、任意の2つの矩形枠の左枠延長線の間隔は第3閾値より小さい、ステップと、
前記第1矩形画像の左側辺に対して、最初の列の矩形枠を選択し、第1矩形枠集合を構成し、前記第1矩形画像の右側辺に対して、最後の列の矩形枠を選択し、第2矩形枠集合を構成し、前記第1矩形画像の頂辺に対して、最初の行の矩形枠を選択し、第3矩形枠集合を構成し、前記第1矩形画像の底辺に対して、最後の行の矩形枠を選択し、第4矩形枠集合を構成するステップと、を含む
ことを特徴とする請求項1に記載の枠なしテーブルの傾斜補正方法。
【請求項3】
前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定するステップは、
前記矩形枠集合における各矩形枠の目標枠辺の基準線に対する角度を計算するステップであって、前記基準線は、所定の水平線または垂直線である、ステップと、
各矩形枠の目標枠の基準線に対する角度の第1統計値を前記目標傾斜角として計算するステップであって、前記第1統計値は、前記角度の中央値または平均値である、ステップと、を含む
ことを特徴とする請求項2に記載の枠なしテーブルの傾斜補正方法。
【請求項4】
前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定するステップは、
前記矩形枠集合における各矩形枠の目標頂点の座標を取得するステップと、
取得した目標頂点の座標の第2統計値を前記基準点の座標として計算するステップであって、前記第2統計値は、前記目標頂点の座標の中央値または平均値である、ステップと、を含む、
ことを特徴とする請求項2に記載の枠なしテーブルの傾斜補正方法。
【請求項5】
前記矩形枠集合における各矩形枠の目標頂点の座標を取得するステップは、
前記第1矩形画像の左側辺に対して、第1矩形集合における各矩形枠の左上角頂点及び/または左下角頂点の座標を取得するステップと、
前記第1矩形画像の右側辺に対して、第2矩形集合における各矩形枠の右上角頂点及び/または右下角頂点の座標を取得するステップと、
前記第1矩形画像の頂辺に対して、第3矩形集合における各矩形枠の左上角頂点及び/または右上角頂点の座標を取得するステップと、
前記第1矩形画像の底辺に対して、第4矩形集合における各矩形枠の左下角頂点及び/または右下角頂点の座標を取得するステップと、を含む
ことを特徴とする請求項4に記載の枠なしテーブルの傾斜補正方法。
【請求項6】
テキストを含む枠なしテーブルの第1矩形画像を取得する画像取得モジュールと、
前記第1矩形画像に対してテキスト検出を行い、前記第1矩形画像におけるテキスト部分及び前記テキスト部分に外接する矩形枠を取得するテキスト検出モジュールと、
前記第1矩形画像の辺毎に、該辺の近傍にあるに少なくとも一つの矩形枠を含む矩形枠集合を生成し、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定し、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定し、前記基準点を通過し、且つ傾斜角が前記目標傾斜角である直線を、前記枠なしテーブルの外枠線として生成する外枠線生成モジュールであって、前記目標枠辺は、前記矩形枠における前記辺に最も近接する枠辺であり、前記目標頂点は、前記目標枠辺が通過する頂点である、外枠線生成モジュールと、
前記枠なしテーブルの4本の外枠線に基づいて、4つの交差点を決定する交差点生成モジュールと、
前記4つの交差点及び4つの所定の目標点に基づいて透視変換を行って透視変換行列を取得する行列取得モジュールと、
前記透視変換行列に基づいて前記第1矩形画像に対して補正を行い、補正された第2矩形画像を生成する画像補正モジュールと、を含む
ことを特徴とする枠なしテーブルの傾斜補正装置。
【請求項7】
前記外枠線生成モジュールは、
前記第1矩形画像における矩形枠が属する行列を特定する第1特定モジュールであって、同一行の矩形枠において、任意の2つの矩形枠の上枠延長線の間隔は第1閾値より小さく、且つ下枠延長線の間隔は第2閾値より小さく、同一列の矩形枠において、任意の2つの矩形枠の左枠延長線の間隔は第3閾値より小さい、第1特定モジュールと、
前記第1矩形画像の左側辺に対して、最初の列の矩形枠を選択し、第1矩形枠集合を構成する第1選択モジュールと、
前記第1矩形画像の右側辺に対して、最後の列の矩形枠を選択し、第2矩形枠集合を構成する第2選択モジュールと、
前記第1矩形画像の頂辺に対して、最初の行の矩形枠を選択し、第3矩形枠集合を構成する第3選択モジュールと、
前記第1矩形画像の底辺に対して、最後の行の矩形枠を選択し、第4矩形枠集合を構成する第4選択モジュールと、を含む
ことを特徴とする請求項6の枠なしテーブルの傾斜補正装置。
【請求項8】
前記外枠線生成モジュールは、
前記矩形枠集合における各矩形枠の目標枠辺の基準線に対する角度を計算する第1計算モジュールであって、前記基準線は、所定の水平線または垂直線である、第1計算モジュールと、
各矩形枠の目標枠の基準線に対する角度の第1統計値を前記目標傾斜角として計算する第2計算モジュールであって、前記第1統計値は、前記角度の中央値または平均値である、第2計算モジュールと、を含む
ことを特徴とする請求項7に記載の枠なしテーブルの傾斜補正装置。
【請求項9】
前記外枠線生成モジュールは、
前記矩形枠集合における各矩形枠の目標頂点の座標を取得する第1取得モジュールと、
取得した目標頂点の座標の第2統計値を前記基準点の座標として計算する第3計算モジュールであって、前記第2統計値は、前記目標頂点の座標の中央値または平均値である、第3計算モジュールと、を更に含む、
ことを特徴とする請求項7に記載の枠なしテーブルの傾斜補正装置。
【請求項10】
前記第1取得モジュールは、
前記第1矩形画像の左側辺に対して、第1矩形集合における各矩形枠の左上角頂点及び/または左下角頂点の座標を取得し、
前記第1矩形画像の右側辺に対して、第2矩形集合における各矩形枠の右上角頂点及び/または右下角頂点の座標を取得し、
前記第1矩形画像の頂辺に対して、第3矩形集合における各矩形枠の左上角頂点及び/または右上角頂点の座標を取得し、
前記第1矩形画像の底辺に対して、第4矩形集合における各矩形枠の左下角頂点及び/または右下角頂点の座標を取得する、
ことを特徴とする請求項9に記載の枠なしテーブルの傾斜補正装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は画像処理技術分野に属し、具体的に枠なしテーブルの傾斜補正方法、傾斜補正装置および記憶媒体に関する。
続きを表示(約 2,800 文字)【背景技術】
【0002】
ドキュメント処理では、紙に印刷されたテキストを識別する必要な場合が多い。紙を撮影し、テキストを含む画像を取得した後、OCR(Optical Character Recognition)で画像を認識することにより、テキストを取得するのが一般的である。例えば、テーブルを含む画像の場合、テーブルのセルとセル内のテキストコンテンツを取得するために、画像に対して表の構造解析とテキスト認識が必要である。
【0003】
テキストを含む画像を撮影する時に、ゆがみが発生しやすい。従来、まず透視変換処理により画像の傾きを補正する処理を行う。完全な枠を有するテーブルの画像は、透視変換処理のための特徴点が容易に得られる。実際の応用において、一部のテーブルは枠のないテーブルの画像である。即ち、テーブル中の縦線と横線が省略される。枠なしテーブルの画像に対して、透視変換処理のための特徴点を取得しにくく、または、取得される特徴点の正確さが低く、後続する画像傾斜補正及びテーブル識別に不利である。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の少なくとも一つの実施例は枠なしテーブルの傾斜補正方法、傾斜補正装置および記憶媒体を提供し、取得される枠なしテーブル画像の特徴点の正確性を向上させ、画像の傾斜補正処理の性能を改善することができる。
【課題を解決するための手段】
【0005】
上記技術問題を解決するために、本発明の実施例は、テキストを含む枠なしテーブルの第1矩形画像を取得するステップと、前記第1矩形画像に対してテキスト検出を行い、前記第1矩形画像におけるテキスト部分及び前記テキスト部分に外接する矩形枠を取得するステップと、前記第1矩形画像の辺毎に、該辺の近傍にあるに少なくとも一つの矩形枠を含む矩形枠集合を生成し、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定し、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定し、前記基準点を通過し、且つ傾斜角が前記目標傾斜角である直線を、前記枠なしテーブルの外枠線として生成するステップであって、前記目標枠辺は、前記矩形枠における前記辺に最も近接する枠辺であり、前記目標頂点は、前記目標枠辺が通過する頂点である、ステップと、前記枠なしテーブルの4本の外枠線に基づいて、4つの交差点を決定するステップと、前記4つの交差点及び4つの所定の目標点に基づいて透視変換を行って透視変換行列を取得するステップと、前記透視変換行列に基づいて前記第1矩形画像に対して補正を行い、補正された第2矩形画像を生成するステップと、を含む枠なしテーブルの傾斜補正方法を提供する。
【0006】
好ましくは、前記第1矩形画像の辺毎に矩形枠集合を生成するステップは、前記第1矩形画像における矩形枠が属する行列を特定するステップであって、同一行の矩形枠において、任意の2つの矩形枠の上枠延長線の間隔は第1閾値より小さく、且つ下枠延長線の間隔は第2閾値より小さく、同一列の矩形枠において、任意の2つの矩形枠の左枠延長線の間隔は第3閾値より小さい、ステップと、前記第1矩形画像の左側辺に対して、最初の列の矩形枠を選択し、第1矩形枠集合を構成し、前記第1矩形画像の右側辺に対して、最後の列の矩形枠を選択し、第2矩形枠集合を構成し、前記第1矩形画像の頂辺に対して、最初の行の矩形枠を選択し、第3矩形枠集合を構成し、前記第1矩形画像の底辺に対して、最後の行の矩形枠を選択し、第4矩形枠集合を構成するステップと、を含む。
【0007】
また、好ましくは、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定するステップは、前記矩形枠集合における各矩形枠の目標枠辺の基準線に対する角度を計算するステップであって、前記基準線は、所定の水平線または垂直線である、ステップと、各矩形枠の目標枠の基準線に対する角度の第1統計値を前記目標傾斜角として計算するステップであって、前記第1統計値は、前記角度の中央値または平均値である、ステップと、を含む。
【0008】
また、好ましくは、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定するステップは、前記矩形枠集合における各矩形枠の目標頂点の座標を取得するステップと、取得した目標頂点の座標の第2統計値を前記基準点の座標として計算するステップであって、前記第2統計値は、前記目標頂点の座標の中央値または平均値である、ステップと、を含む。
【0009】
また、好ましくは、前記矩形枠集合における各矩形枠の目標頂点の座標を取得するステップは、前記第1矩形画像の左側辺に対して、第1矩形集合における各矩形枠の左上角頂点及び/または左下角頂点の座標を取得するステップと、前記第1矩形画像の右側辺に対して、第2矩形集合における各矩形枠の右上角頂点及び/または右下角頂点の座標を取得するステップと、前記第1矩形画像の頂辺に対して、第3矩形集合における各矩形枠の左上角頂点及び/または右上角頂点の座標を取得するステップと、前記第1矩形画像の底辺に対して、第4矩形集合における各矩形枠の左下角頂点及び/または右下角頂点の座標を取得するステップと、を含む。
【0010】
また、本発明の実施例は、テキストを含む枠なしテーブルの第1矩形画像を取得する画像取得モジュールと、前記第1矩形画像に対してテキスト検出を行い、前記第1矩形画像におけるテキスト部分及び前記テキスト部分に外接する矩形枠を取得するテキスト検出モジュールと、前記第1矩形画像の辺毎に、該辺の近傍にあるに少なくとも一つの矩形枠を含む矩形枠集合を生成し、前記矩形枠集合における矩形枠の目標枠辺の傾斜角に基づいて目標傾斜角を決定し、前記矩形枠集合における矩形枠の目標頂点に基づいて基準点を決定し、前記基準点を通過し、且つ傾斜角が前記目標傾斜角である直線を、前記枠なしテーブルの外枠線として生成する外枠線生成モジュールであって、前記目標枠辺は、前記矩形枠における前記辺に最も近接する枠辺であり、前記目標頂点は、前記目標枠辺が通過する頂点である、外枠線生成モジュールと、前記枠なしテーブルの4本の外枠線に基づいて、4つの交差点を決定する交差点生成モジュールと、前記4つの交差点及び4つの所定の目標点に基づいて透視変換を行って透視変換行列を取得する行列取得モジュールと、前記透視変換行列に基づいて前記第1矩形画像に対して補正を行い、補正された第2矩形画像を生成する画像補正モジュールと、を含む枠なしテーブルの傾斜補正装置を提供する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

株式会社リコー
圧着綴じ装置
5日前
株式会社リコー
画像形成装置、画像形成方法
8日前
株式会社リコー
開閉検知センサ及びシステム
2日前
株式会社リコー
撮像装置、送信方法、プログラム
1日前
株式会社リコー
後処理装置及び画像形成システム
5日前
株式会社リコー
液体吐出ヘッド及び液体吐出装置
5日前
株式会社リコー
検査装置、検査方法、プログラム
5日前
株式会社リコー
後処理装置および画像形成システム
5日前
株式会社リコー
後処理装置および画像形成システム
5日前
株式会社リコー
媒体処理装置及び画像形成システム
5日前
株式会社リコー
画像形成装置、表示方法、プログラム
5日前
株式会社リコー
会議システム、参加方法、プログラム
5日前
株式会社リコー
樹脂成形部品、画像形成装置及び判断方法
1日前
株式会社リコー
樹脂成型品、及び、樹脂成型品の劣化判定方法
8日前
株式会社リコー
樹脂成型品、及び、樹脂成型品の劣化判定方法
8日前
株式会社リコー
樹脂成型品、及び、樹脂成型品の劣化判定方法
1日前
株式会社リコー
画像処理装置、画像処理方法およびプログラム
5日前
株式会社リコー
樹脂金属複合体及び樹脂金属複合体の製造方法
8日前
株式会社リコー
情報処理装置、方法、プログラムおよび制御装置
5日前
株式会社リコー
移動体システム、情報処理装置及び情報処理方法
1日前
株式会社リコー
立体造形物の製造方法、造形装置及び造形システム
1日前
株式会社リコー
画像形成システム、情報処理方法、およびプログラム
8日前
株式会社リコー
樹脂粒子、トナー、現像剤、及びトナー収容ユニット
8日前
株式会社リコー
加圧機構、プロセスカートリッジ、及び、画像形成装置
1日前
株式会社リコー
媒体処理装置、媒体処理システム、及び、媒体処理方法
1日前
株式会社リコー
排出量算出システム、排出量算出方法およびプログラム
5日前
株式会社リコー
撮像装置
5日前
株式会社リコー
会議システム、リアクションマーク表示方法、プログラム
1日前
株式会社リコー
情報処理装置、情報処理プログラム、及び情報処理システム
5日前
株式会社リコー
筆記デバイス、筆記システム、筆記処理方法及びプログラム
8日前
株式会社リコー
印刷システム、印刷制御装置、印刷制御方法、印刷制御プログラム
5日前
株式会社リコー
情報処理システム、加工方法、プログラム、書類作成支援システム
5日前
株式会社リコー
情報提供装置、情報処理システム、情報提供方法、及びプログラム
1日前
株式会社リコー
小型電動車両、リチウムイオン二次電池、及び交換式電池システム
1日前
株式会社リコー
情報提供装置、情報処理システム、情報提供方法、及びプログラム
1日前
株式会社リコー
レーザ照射方法、レーザ照射装置、レーザマーキング装置及び造形装置
5日前
続きを見る