TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024121084
公報種別
公開特許公報(A)
公開日
2024-09-06
出願番号
2023027980
出願日
2023-02-27
発明の名称
情報処理装置、情報処理方法、及びプログラム
出願人
キヤノン株式会社
代理人
弁理士法人谷・阿部特許事務所
主分類
G06F
40/279 20200101AFI20240830BHJP(計算;計数)
要約
【課題】画像内の文字領域に対する文字認識処理に失敗して誤った文字列が認識結果として得られた場合でも、個人情報文字列の検出漏れを低減できる情報処理装置等を提供する。
【解決手段】情報処理装置の一実施形態である印刷ログ監視サーバ102は、画像解析部302及び個人情報検出部303を備える。画像解析部302は、文書の画像内の文字領域に対し文字認識処理を行い、個人情報検出部303は、文字認識処理の結果から少なくともキーバリュー抽出を含む複数の異なる処理方法で個人情報と見込まれる文字列を検出する。これにより、文字認識に失敗した場合に起こり得る個人情報文字列の検出漏れを防ぐ。また、印刷ログ監視サーバ102は、個人情報検出部303による検出結果に基づき、画像の個人情報スコアを算出し、画像が個人情報を含むか否かを判定する。
【選択図】図3
特許請求の範囲
【請求項1】
文書の画像内の文字領域に対し文字認識処理を行う画像解析手段と、
前記画像解析手段による前記文字認識処理の結果から少なくともキーバリュー抽出を含む複数の異なる処理方法の併用によって個人情報と見込まれる文字列を検出する検出手段と、
を備えることを特徴とする情報処理装置。
続きを表示(約 1,000 文字)
【請求項2】
前記検出手段による検出結果に基づき、前記画像について、前記個人情報の度合いを評価する値であるスコアを算出する算出手段と、
前記算出手段により算出した前記スコアに基づき前記画像が前記個人情報を含むか否かを判定する判定手段と、
を更に備えることを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記検出手段により検出した前記文字列に対して、個人情報の種別を表す属性の候補である属性候補を付与する属性付与手段を更に備え、
前記算出手段は、前記属性候補それぞれに対して予め定められた重みを用いて、前記画像の前記スコアを算出することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
1つの前記文字列に対して複数の属性候補が付与された場合、前記算出手段は、前記複数の属性候補のうち前記スコアが高くなる方の属性候補を、前記文字列に対する属性として採用し、前記スコアを算出することを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記判定手段による判定結果として、前記検出手段により検出された前記文字列を前記属性とともに表示する表示手段を更に備えることを特徴とする請求項3または請求項4に記載の情報処理装置。
【請求項6】
前記表示手段は、更に、前記検出手段により検出された前記文字列を前記画像内に示すことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記表示手段は、前記検出手段により検出された前記文字列を前記属性とともに表示する際に、前記スコアの算出に用いられなかった属性候補がある場合は、前記スコアの算出に用いられなかった前記属性候補がある旨を表示することを特徴とする請求項5に記載の情報処理装置。
【請求項8】
前記判定手段による判定結果を予め登録された通知先に通知する通知手段を更に備えることを特徴とする請求項2に記載の情報処理装置。
【請求項9】
前記画像は、文書の画像を表すための印刷画像データであることを特徴とする請求項1に記載の情報処理装置。
【請求項10】
当該情報処理装置は、クライアント端末、プリンタ、及び印刷ログ監視サーバがネットワークを介して通信接続されたシステムにおける印刷ログ監視サーバであることを特徴とする請求項1に記載の情報処理装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、文書内に記載された個人情報を検出する技術に関する。
続きを表示(約 1,800 文字)
【背景技術】
【0002】
情報セキュリティに対する社会的関心の高まりに伴い、印刷対象の文書内に氏名や住所のような個人情報が記載されているか否かを自動で判断する技術が求められている。特許文献1には、コピー等の移動をしようとする文書データ内から個人名や住所、マイナンバー等の個人情報文字列を検出し、検出結果をもとに、個人情報スコアという評価値を算出し、その値によって文書の移動を抑止するか判断するシステムが開示されている。
【0003】
特許文献1に記載されたシステムでは、文書内に含まれる個人情報をキーワードマッチング及び/またはパターンマッチングの手法で検出している。キーワードマッチングは、個人名や地名が予め保持している辞書に登録されているかを検出する手法である。パターンマッチングは、文書内に含まれる文字列のパターンが特定の文字パターンと一致するかを検出する手法である。また、検出した個人情報に予め決められた個人情報スコアを付与することで文書の個人情報スコアを算出している。また、表形式の構成となっている情報について、項目名に特定の文言が記載されている場合は、個人情報スコアを加算することも行っている。
【先行技術文献】
【特許文献】
【0004】
特開2017ー162138号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
個人情報文字列を検出する対象がこれから印刷する文書データである場合、当該文書データの印刷指示データを画像データに変換した後、OCR(Optical Character Recognition)による文字認識処理を実施する必要がある。この場合に特許文献1の方法では、文字認識処理に失敗してしまうと、キーワードマッチング及びパターンマッチングの手法がうまく機能せず、本来検出すべき個人情報を表す文字列を検出できないという課題がある。この課題は、文書を印刷する場面に限らず、例えばコピーやスキャンを行う際にも同様に生じる。
【0006】
本開示は、上述した課題を解決するため、画像内の文字認識処理に失敗して誤った文字列が認識結果として得られた場合でも、個人情報を表す文字列の検出漏れを低減できる情報処理装置等を提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示に係る情報処理装置は、文書の画像内の文字領域に対し文字認識処理を行う画像解析手段と、前記画像解析手段による前記文字認識処理の結果から少なくともキーバリュー抽出を含む複数の異なる処理方法の併用によって個人情報と見込まれる文字列を検出する検出手段と、を備えることを特徴とする。
【発明の効果】
【0008】
本開示により、画像内の文字領域に対する文字認識処理に失敗して誤った文字列が認識結果として得られた場合でも、個人情報を表す文字列の検出漏れを低減できる。
【図面の簡単な説明】
【0009】
個人情報検出システムの全体構成を示す図である。
印刷ログ監視サーバのハードウェア構成とデータ構成の例を示すブロック図である。
印刷ログ監視サーバの機能構成の一例を示す図である。
印刷ログ監視サーバが実行する処理全体を示すフローチャートである。
図4のS404における判定処理(1)の詳細を示すフローチャートである。
第1の実施形態において処理対象とする印刷画像データの一例を示す図である。
図6の印刷画像データについての個人情報検出データの例を示す図である。
印刷ログ確認画面の例を示す図である。
第2の実施形態において処理対象とする印刷画像データの一例を示す図である。
第2の実施形態における判定処理(2)の詳細を示すフローチャートである。
図9の印刷画像データについての個人情報検出データの一例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の各実施形態によって特許請求の範囲に係る発明は限定されず、また各実施形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
物品
1か月前
個人
認証システム
1か月前
個人
自動精算システム
今日
個人
自動精算システム
1か月前
個人
RFタグ読取装置
9日前
個人
売買システム
6日前
個人
保証金管理システム
1か月前
個人
救急搬送システム
1か月前
個人
管理サーバ
20日前
個人
鑑定証明システム
1か月前
日本精機株式会社
車両用表示装置
8日前
日本精機株式会社
車両用表示装置
8日前
キヤノン株式会社
印刷装置
1か月前
株式会社MRC
集客システム
1か月前
個人
技術マッチングシステム
2か月前
個人
生成AIとの常時接続システム
1か月前
個人
VRによる人体各部位の立体化
20日前
井関農機株式会社
ロボット作業車両
今日
トヨタ自動車株式会社
分析装置
1か月前
キヤノン株式会社
印刷管理装置
1か月前
株式会社ネットブリッジ
展示販売装置
1か月前
キヤノン株式会社
情報処理装置
22日前
個人
コンテンツ開示順位判定システム
1か月前
キヤノン株式会社
印刷制御装置
2か月前
株式会社SEKT
文字認識装置
1か月前
個人
未来型家系図構築システム
29日前
株式会社COLORS
表示装置
1か月前
トヨタ自動車株式会社
推定装置
27日前
トヨタ自動車株式会社
表認識装置
29日前
ローム株式会社
ソース機器
1か月前
キヤノン電子株式会社
業務管理システム
1か月前
ミサワホーム株式会社
プログラム
1か月前
個人
文字入力方法、文字入力プログラム
2か月前
トヨタ自動車株式会社
作業評価装置
27日前
個人
販売支援システム
今日
日本精機株式会社
コミュニケーション端末
1か月前
続きを見る
他の特許を見る