TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025148721
公報種別
公開特許公報(A)
公開日
2025-10-08
出願番号
2024048981
出願日
2024-03-26
発明の名称
文書分析方法、文書分析プログラム、及び文書分析装置
出願人
AGC株式会社
代理人
弁理士法人太陽国際特許事務所
主分類
G06F
16/35 20250101AFI20251001BHJP(計算;計数)
要約
【課題】本開示は、所定の文書群の中の注目すべき内容をユーザに把握させることを目的とする。
【解決手段】文書分析方法は、少なくとも1つの共通の観点に基づく文章が記載された文書群を、前記共通の観点でクラスタリングし、生成された複数のクラスタの各々から文章内のキーワードを少なくとも1つ抽出し、ユーザによるテキストの入力を受付け、前記テキストに関連する文書に制限した場合に、クラスタ内の文書数が減少した特定のクラスタを示す情報を出力する、処理をコンピュータが実行する。
【選択図】図1
特許請求の範囲
【請求項1】
少なくとも1つの共通の観点に基づく文章が記載された文書群を、前記共通の観点でクラスタリングし、
生成された複数のクラスタの各々から文章内のキーワードを少なくとも1つ抽出し、
ユーザによるテキストの入力を受付け、
前記テキストに関連する文書に制限した場合に、クラスタ内の文書数が減少した特定のクラスタを示す情報を出力する、
処理をコンピュータが実行する文書分析方法。
続きを表示(約 1,200 文字)
【請求項2】
少なくとも2つの共通の観点に基づく文章が記載された文書群を、前記共通の観点の各々でクラスタリングし、
一の観点の各クラスタと、他の観点の各クラスタとの関連度を導出し、
ユーザによるテキストの入力に基づいて、前記関連度が低下した特定のクラスタペアを示す情報を出力する、
処理をコンピュータが実行する文書分析方法。
【請求項3】
前記文章内の単語の自己相互情報量に基づいて、生成された複数のクラスタの各々から文章内のキーワードを抽出する、
処理をコンピュータが実行する請求項1又は請求項2に記載の文書分析方法。
【請求項4】
前記テキストに関連する文書に制限する観点を選択する前記ユーザの入力を受付ける、
処理をコンピュータが実行する請求項2に記載の文書分析方法。
【請求項5】
前記関連度の変化として正規化自己相互情報量の変化を導出し、前記正規化自己相互情報量が低下した前記特定のクラスタペアを示す情報を出力する、
処理をコンピュータが実行する請求項2に記載の文書分析方法。
【請求項6】
前記ユーザによる前記テキストの入力後に前記文書数が所定値以上となる所定のクラスタを抽出し、
前記所定のクラスタに対応する前記キーワードの中から、前記テキストとの共起頻度が所定条件を満たす特定のキーワードを出力する、
処理をコンピュータが実行する請求項1に記載の文書分析方法。
【請求項7】
前記ユーザによる前記テキストの入力後に前記関連度が所定値以上となる所定のクラスタペアを抽出し、
前記所定のクラスタペアに対応するキーワードの中から、前記テキストとの前記関連度が所定条件を満たす特定のキーワードを出力する、
処理をコンピュータが実行する請求項2に記載の文書分析方法。
【請求項8】
クラスタリングアルゴリズムによって、前記文書群を前記共通の観点でクラスタリングする、
処理をコンピュータが実行する請求項1又は請求項2に記載の文書分析方法。
【請求項9】
前記文書群は、特許文書群である、
請求項1又は請求項2に記載の文書分析方法。
【請求項10】
少なくとも1つの共通の観点に基づく文章が記載された文書群を、前記共通の観点でクラスタリングし、
生成された複数のクラスタの各々から文章内のキーワードを少なくとも1つ抽出し、
ユーザによるテキストの入力を受付け、
前記テキストに関連する文書に制限した場合に、クラスタ内の文書数が減少した特定のクラスタを示す情報を出力する、
処理をコンピュータに実行させる文書分析プログラム。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、文書分析方法、文書分析プログラム、及び文書分析装置に関する。
続きを表示(約 1,500 文字)
【背景技術】
【0002】
特許文献1には、シソーラスを用いない高精度なテキストマイニングを実現する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
特許7064871号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、従来は、新規なアイデアを発掘するための発掘会を行うにあたり、事前準備として、公開されている複数の文書を発掘会へ参加するユーザが読み込んで知識を蓄えておく必要があり、当該ユーザの利便性を向上させる点で改善の余地がある。
【0005】
そこで、本開示は、所定の文書群の中の注目すべき内容をユーザが把握できる文書分析方法、文書分析プログラム、及び文書分析装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
第1態様の文書分析方法は、少なくとも1つの共通の観点に基づく文章が記載された文書群を、前記共通の観点でクラスタリングし、生成された複数のクラスタの各々から文章内のキーワードを少なくとも1つ抽出し、ユーザによるテキストの入力を受付け、前記テキストに関連する文書に制限した場合に、クラスタ内の文書数が減少した特定のクラスタを示す情報を出力する、処理をコンピュータが実行する。これにより、当該文書分析方法によれば、ユーザにより入力されたテキストと共起しにくい特定のクラスタを示す情報を出力することで、文書群の中の注目すべき内容をユーザが把握できる。
【0007】
第2態様の文書分析方法は、少なくとも2つの共通の観点に基づく文章が記載された文書群を、前記共通の観点の各々でクラスタリングし、一の観点の各クラスタと、他の観点の各クラスタとの関連度を導出し、ユーザによるテキストの入力に基づいて、前記関連度が低下した特定のクラスタペアを示す情報を出力する、処理をコンピュータが実行する。これにより、当該文書分析方法によれば、ユーザによるテキストの入力に基づき関連度が低下した特定のクラスタペアを示す情報を出力することで、文書群の中の注目すべき内容をユーザが把握できる。
【0008】
第3態様の文書分析方法は、第1態様又は第2態様において、前記文章内の単語の自己相互情報量に基づいて、生成された複数のクラスタの各々から文章内のキーワードを抽出する、処理をコンピュータが実行する。これにより、当該文書分析方法によれば、相対的な基準で各クラスタと単語との関連度を評価することで、絶対的な出現頻度が少ない特定の単語にも着目できる。
【0009】
第4態様の文書分析方法は、第2態様において、前記テキストに関連する文書に制限する観点を選択する前記ユーザの入力を受け付ける、処理をコンピュータが実行する。これにより、当該文書分析方法によれば、ユーザが所望する観点に応じて、分析対象とする文書群を制御できる。
【0010】
第5態様の文書分析方法は、第2態様又は第4態様において、前記関連度の変化として正規化自己相互情報量の変化を導出し、前記正規化自己相互情報量が低下した前記特定のクラスタペアを示す情報を出力する、処理をコンピュータが実行する。これにより、当該文書分析方法によれば、ユーザによるテキストの入力に基づき正規化自己相互情報量が低下した特定のクラスタペアを示す情報を出力することで、文書群の中の注目すべき内容をユーザが把握できる。また、当該文書分析装置によれば、正規化自己相互情報量の変化を用いることで、絶対的な文書数が少ない特定のクラスタペアにも着目できる。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
詐欺保険
23日前
個人
縁伊達ポイン
23日前
個人
RFタグシート
10日前
個人
QRコードの彩色
27日前
個人
地球保全システム
1か月前
個人
ペルソナ認証方式
7日前
個人
情報処理装置
2日前
個人
自動調理装置
9日前
個人
残土処理システム
29日前
個人
農作物用途分配システム
22日前
個人
インターネットの利用構造
6日前
個人
タッチパネル操作指代替具
16日前
個人
知的財産出願支援システム
1か月前
個人
携帯端末障害問合せシステム
15日前
個人
スケジュール調整プログラム
15日前
株式会社キーエンス
受発注システム
1か月前
個人
エリアガイドナビAIシステム
7日前
株式会社キーエンス
受発注システム
1か月前
株式会社キーエンス
受発注システム
1か月前
個人
食品レシピ生成システム
1か月前
キヤノン株式会社
印刷システム
15日前
株式会社ワコム
電子ペン
1日前
株式会社ワコム
電子ペン
1日前
キヤノン株式会社
表示システム
1か月前
個人
帳票自動生成型SaaSシステム
1か月前
トヨタ自動車株式会社
通知装置
13日前
エッグス株式会社
情報処理装置
16日前
個人
音声・通知・再配達UX制御構造
1か月前
株式会社ケアコム
項目選択装置
2日前
株式会社ケアコム
項目選択装置
2日前
キヤノン株式会社
情報処理装置
今日
大同特殊鋼株式会社
棒材計数方法
28日前
太陽誘電株式会社
表示装置
13日前
株式会社カネカ
製造工場の管理システム
1か月前
トヨタ自動車株式会社
車両
14日前
個人
マーケティング活動支援装置
1か月前
続きを見る
他の特許を見る