TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024084393
公報種別公開特許公報(A)
公開日2024-06-25
出願番号2022198643
出願日2022-12-13
発明の名称情報処理装置、情報処理装置の制御方法、及びプログラム
出願人キヤノン株式会社
代理人弁理士法人谷・阿部特許事務所
主分類G06F 16/35 20190101AFI20240618BHJP(計算;計数)
要約【課題】複数の階層を有する固有表現をグループ化してUI画面上に容易に表示する。
【解決手段】情報処理装置は、文書データを固有表現抽出モデルに入力することにより、固有表現を抽出する抽出手段と、前記抽出手段によって抽出された固有表現をUI画面に表示する表示制御手段と、を備え、前記表示制御手段は、前記抽出手段によって抽出された複数の固有表現が互いに上位概念と下位概念との関係にある場合、当該複数の固有表現を1つのグループで表示する。
【選択図】図2
特許請求の範囲【請求項1】
文書データを固有表現抽出モデルに入力することにより、固有表現を抽出する抽出手段と、
前記抽出手段によって抽出された固有表現をUI画面に表示する表示制御手段と、
を備え、
前記表示制御手段は、前記抽出手段によって抽出された複数の固有表現が互いに上位概念と下位概念の関係にある場合、当該複数の固有表現を1つのグループで表示する、
ことを特徴とする情報処理装置。
続きを表示(約 1,600 文字)【請求項2】
前記1つのグループを構成する前記複数の固有表現のうち前記上位概念を表す固有表現を第1レベル、前記下位概念を表す固有表現を第2レベルに決定する決定手段と、
をさらに備え、
前記表示制御手段は、決定された前記第1レベル及び前記第2レベルに分けて前記複数の固有表現を表示する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記表示制御手段は、前記第2レベルに決定された前記複数の固有表現の中で互いに上位概念レベルと下位概念レベルがある場合、より上位概念レベルの固有表現ほど前記第1レベルに決定された固有表現に近い位置に表示する、ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記第1レベル及び前記第2レベルの各概念レベルの表示に対するユーザー指示に基づき、前記抽出手段によって抽出された複数の固有表現を、前記第1レベル及び前記第2レベルの各概念レベルの表示可否を示す表示可否情報と紐づけて保存する保存手段と、
をさらに備える、ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記表示制御手段は、前記抽出手段によって抽出された複数の固有表現が前記保存手段に保存されている複数の固有表現と類似している場合、当該類似する複数の固有表現に紐づいている前記表示可否情報を参照して、前記抽出手段によって抽出された複数の固有表現を1つのグループで表示する、
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記表示制御手段は、
前記抽出手段によって抽出された前記第1レベルと前記保存手段に保存されている前記第1レベルとの類似度が第1閾値以上である前記保存手段に保存されている前記第1レベルが存在する場合には、当該保存手段に保存されている前記第1レベルの表示可否情報を参照して、前記抽出手段によって抽出された前記第1レベルを表示し、
前記抽出手段によって抽出された前記第2レベルのそれぞれの概念レベルにおいて、当該第2レベルの概念レベルと、前記第1レベルにおける類似度が第1閾値以上である前記保存手段に保存されている前記第2レベルのそれぞれの概念レベルとの類似度を算出し、
前記抽出手段によって抽出された前記第2レベルの表示対象となる概念レベルの類似度において、類似度が最大であり、かつ、第2閾値以上である前記保存手段に保存されている前記第2レベルの概念レベルが存在する場合には、当該保存手段に保存されている前記第2レベルの概念レベルの表示可否情報を参照して、前記抽出手段によって抽出された前記第2レベルの表示対象となる概念レベルを表示する、
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記類似度は、前記抽出手段によって抽出された前記複数の固有表現の各レベルの特徴量ベクトルと前記保存手段に保存されている前記複数の固有表現の各レベルの特徴量ベクトルとの間のコサイン類似度を用いて算出される、
ことを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記特徴量ベクトルは、固有表現のトークンごとの特徴量ベクトルの平均である、ことを特徴とする請求項7に記載の情報処理装置。
【請求項9】
前記文書データは、文書を文字認識処理することにより生成される、ことを特徴とする請求項1に記載の情報処理装置。
【請求項10】
文書データを固有表現抽出モデルに入力することにより、固有表現を抽出するステップと、
抽出された複数の固有表現が互いに上位概念と下位概念との関係にある場合、当該複数の固有表現を1つのグループでUI画面に表示するステップと、
を備える、
ことを特徴とする情報処理装置の制御方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、階層構造を有する固有表現抽出に関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
文書画像内の文字を読み取って電子ファイルに変換し、適切なファイル名を自動付与する技術がある。自動付与されるファイル名を構成する要素には、ファイル作成日時等に加えて、文書内の組織名、人名、文書番号、及び文書発行日などがあり、これらは自然言語処理分野の応用技術である固有表現抽出技術により抽出することができる。
【0003】
抽出する要素には、組織名など階層構造を有する要素がある。階層構造を有する要素の場合、ユーザーが使用する状況に応じて、抽出する階層が異なってくる。そこで特許文献1では、以下に示す方法が開示されている。すなわち、固有表現が階層構造を有し、かつ、詳細なカテゴリ分類がなされている場合に、複数の特徴量抽出手段と複数の固有表現抽出手段とを用いて固有表現抽出を実行する際に、下位階層まで詳細な種別付けを行う。これにより、ユーザーからの入力に従って、階層全体の固有表現を抽出するか、又は特定の階層の固有表現を抽出するかを選択することが可能となる。
【先行技術文献】
【特許文献】
【0004】
特開2013-246795号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に係る技術では、複数の階層を有する固有表現がグループ化されておらず、複数の階層を有する固有表現をUI画面上に表示するには、ユーザーが処理の度にどの階層の固有表現を抽出するかを詳細に設定していた。
【0006】
本開示は、上記課題に鑑みてなされたものであり、複数の階層を有する固有表現をグループ化してUI画面上に容易に表示することを目的とする。
【課題を解決するための手段】
【0007】
本開示に係る情報処理装置は、文書データを固有表現抽出モデルに入力することにより、固有表現を抽出する抽出手段と、前記抽出手段によって抽出された固有表現をUI画面に表示する表示制御手段と、を備え、前記表示制御手段は、前記抽出手段によって抽出された複数の固有表現が互いに上位概念と下位概念との関係にある場合、当該複数の固有表現を1つのグループで表示する、ことを特徴とする。
【発明の効果】
【0008】
本開示の技術によれば、複数の階層を有する固有表現をグループ化してUI画面上に容易に表示することが可能になる。
【図面の簡単な説明】
【0009】
情報処理装置のハードウェア構成を示すブロック図。
情報処理装置の機能構成の主要部分を示すブロック図。
情報処理装置の機能構成の全体を示すブロック図。
全体の処理の流れを示すフローチャート。
固有表現抽出手段が実行する固有表現抽出処理を示すフローチャート。
グループ化手段が実行する固有表現グループ化処理を示すフローチャート。
グループ化手段による固有表現グループ化の結果の具体例を示す模式図。
初期出力判定手段が実行する出力可否判定処理を示すフローチャート。
初期出力判定手段が実行する出力修正処理を示すフローチャート。
初期出力判定手段が実行する出力可否判定処理結果の具体例を示す模式図。
表示手段が表示する固有表現抽出結果の具体例を示す図。
表示手段が表示する固有表現抽出結果の具体例を示す図。
保存するファイルの階層構造の具体例を示す模式図。
【発明を実施するための形態】
【0010】
以下、本開示の実施形態について、添付図面を参照して説明する。尚、以下の実施形態は本開示を限定するものではなく、また実施形態で説明されている特徴の組み合わせの全てが本開示の解決手段に必須のものとは限らない。また、フローチャートにおける各工程(ステップ)については「S」で始まる符号を用いて示す。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

キヤノン株式会社
基板
9日前
キヤノン株式会社
トナー
22日前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
2日前
キヤノン株式会社
トナー
19日前
キヤノン株式会社
記録装置
18日前
キヤノン株式会社
撮像装置
11日前
キヤノン株式会社
光学機器
16日前
キヤノン株式会社
電子機器
2日前
キヤノン株式会社
撮像装置
2日前
キヤノン株式会社
電子機器
2日前
キヤノン株式会社
撮像装置
2日前
キヤノン株式会社
記録装置
2日前
キヤノン株式会社
記録装置
18日前
キヤノン株式会社
通信装置
1か月前
キヤノン株式会社
記録装置
9日前
キヤノン株式会社
電子機器
3日前
キヤノン株式会社
撮像装置
3日前
キヤノン株式会社
撮像装置
29日前
キヤノン株式会社
清掃装置
4日前
キヤノン株式会社
記録装置
19日前
キヤノン株式会社
レンズ鏡筒
1か月前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
22日前
キヤノン株式会社
画像形成装置
22日前
キヤノン株式会社
画像形成装置
3日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
3日前
キヤノン株式会社
画像形成装置
5日前
キヤノン株式会社
画像形成装置
5日前
キヤノン株式会社
画像形成装置
9日前
キヤノン株式会社
組成識別装置
2日前
キヤノン株式会社
画像形成装置
24日前
キヤノン株式会社
光電変換装置
18日前
キヤノン株式会社
有機発光素子
4日前
続きを見る