TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025124474
公報種別
公開特許公報(A)
公開日
2025-08-26
出願番号
2024020556
出願日
2024-02-14
発明の名称
情報抽出システム及び情報抽出方法
出願人
株式会社日立製作所
代理人
弁理士法人サンネクスト国際特許事務所
主分類
G06F
40/279 20200101AFI20250819BHJP(計算;計数)
要約
【課題】情報抽出システムは、分析対象データから適切なサマリを生成すること。
【解決手段】分析対象データから、当該分析対象データによって説明される説明対象事項に関する複数の情報を説明情報として抽出する抽出部と、前記説明情報を記憶する記憶部と、前記抽出された説明情報を結合して構造化する結合部と、前記結合された単位を説明するサマリセンテンスを、結合元の前記説明情報から生成する生成部と、を有することを特徴とする。
【選択図】図1
特許請求の範囲
【請求項1】
分析対象データから、当該分析対象データによって説明される説明対象事項に関する複数の情報を説明情報として抽出する抽出部と、
前記説明情報を記憶する記憶部と、
前記抽出された説明情報を結合して構造化する結合部と、
前記結合された単位を説明するサマリセンテンスを、結合元の前記説明情報から生成する生成部と、
を有することを特徴とする情報抽出システム。
続きを表示(約 1,000 文字)
【請求項2】
請求項1に記載の情報抽出システムであって、
前記抽出部は、前記分析対象データであるドキュメントを第1の大規模言語処理に適したサイズのチャンクに分割し、各チャンクに前記第1の大規模言語処理を行うことで前記説明対象事項に関するセンテンスを前記説明情報として抽出し、
前記結合部は、複数の説明情報について各々の特徴量を算出し、前記特徴量に基づいて前記複数の説明情報をクラスタリングしてツリー構造に結合し、
前記生成部は、前記ツリー構造における所定のノードから先に所在する説明情報の内容を第2の大規模言語処理によってまとめて前記サマリセンテンスを生成することを特徴とする情報抽出システム。
【請求項3】
請求項2に記載の情報抽出システムであって、
前記生成部は、前記ツリー構造の階層情報を表示し、前記ノード又は階層の指定を受け付けて、対応するサマリセンテンスを出力することを特徴とする情報抽出システム。
【請求項4】
請求項1に記載の情報抽出システムであって、
前記記憶部は、前記分析対象データの種別に応じた説明対象事項セットを記憶し、
前記抽出部は、前記説明対象事項セットから選択した説明対象事項について前記説明情報の抽出を行うことを特徴とする情報抽出システム。
【請求項5】
請求項1に記載の情報抽出システムであって、
前記抽出部は、複数の分析対象データについて前記説明情報を抽出し、
前記記憶部は、複数の分析対象データについて前記説明情報を記憶し、
前記結合部は、分析対象データごとに前記構造化を行う
ことを特徴とする情報抽出システム。
【請求項6】
コンピュータが、分析対象データから、当該分析対象データによって説明される説明対象事項に関する複数の情報を説明情報として抽出する抽出ステップと、
前記コンピュータが、前記説明情報を記憶部に格納する格納ステップと、
前記コンピュータが、前記抽出された説明情報を結合して構造化する結合ステップと、
前記コンピュータが、前記結合された単位を説明するサマリセンテンスを、結合元の前記説明情報から生成する生成ステップと、
を含むことを特徴とする情報抽出方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、情報抽出システム及び情報抽出方法に関する。
続きを表示(約 2,200 文字)
【背景技術】
【0002】
従来、文章をデータ処理する技術がある。特開2023-158992号公報(特許文献1)には、「入力テキストに対する応答テキストを生成する応答生成部105と、応答生成部で生成された応答テキストを修正する応答修正部107と、応答修正部で修正された応答テキスト群内の応答テキストに対して応答テキストの表現がユーザにとって適切かどうかを判定する応答表現適切性評価部109と、応答修正部で修正された応答テキスト群内の応答テキストに対して応答テキストの内容が、ユーザの過去にやりとりの内容に対して妥当な内容であるかどうかを判定する応答内容妥当性評価部111と、応答表現適切性評価部による評価と応答内容妥当性評価部による評価に基づき、修正された応答テキスト群から出力すべき応答テキストを決定する選択部113を有する。」という記載がある。
【先行技術文献】
【特許文献】
【0003】
特開2023-158992号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来技術では、大規模言語モデル(LLM:Large Language Models)を用いて、入力テキストに対する妥当な応答テキストを生成している。
このような大規模言語モデルを用いたデータ処理(大規模言語処理)は、応答テキストの生成に限らず、文書のサマリの生成にも活用できる。多数の文書や、文章量の多い文書から適切なサマリを生成できれば、文書の活用に大きく寄与する。
しかしながら、大規模言語モデルでの文書のサマリを生成する場合、抽出したい情報が文章内に散らばって記載されている、複数の内容について言及している、などの理由により、適切なサマリを生成できない場合がある。例えば、業界動向予測と事業の予算見積の双方を説明する事業計画文書からサマリを生成した場合に、予算見積についてのサマリが生成され、業界動向予測についての内容が欠落することがある。この場合、当該文書における業界動向予測の内容を必要としているユーザによっては不適切なサマリとなる。また、操作方法と修理方法を記載したマニュアルからサマリを生成し、修理方法が欠落すると、修理方法を知りたいユーザによって不適切なサマリとなる。
このような問題は、文書からサマリを生成する場合に限らず、音声データや動画データ等、任意の分析対象データからサマリを生成する場合に生ずる。
そこで、本発明では、分析対象データから適切なサマリを生成することを目的とする。
【課題を解決するための手段】
【0005】
上記目的を達成するために、代表的な本発明の情報抽出システムの一つは、分析対象データから、当該分析対象データによって説明される説明対象事項に関する複数の情報を説明情報として抽出する抽出部と、前記説明情報を記憶する記憶部と、前記抽出された説明情報を結合して構造化する結合部と、前記結合された単位を説明するサマリセンテンスを、結合元の前記説明情報から生成する生成部と、を有することを特徴とする。
また、代表的な本発明の情報抽出方法の一つは、コンピュータが、分析対象データから、当該分析対象データによって説明される説明対象事項に関する複数の情報を説明情報として抽出する抽出ステップと、前記コンピュータが、前記説明情報を記憶部に格納する格納ステップと、前記コンピュータが、前記抽出された説明情報を結合して構造化する結合ステップと、前記コンピュータが、前記結合された単位を説明するサマリセンテンスを、結合元の前記説明情報から生成する生成ステップと、を含むことを特徴とする。
【発明の効果】
【0006】
本発明によれば、分析対象データから適切なサマリを生成できる。上記した以外の課題、構成及び効果は以下の実施の形態の説明により明らかにされる。
【図面の簡単な説明】
【0007】
実施例1の情報抽出システムの構成図
データの具体例(その1)
データの具体例(その2)
計算機の処理手順を示すフローチャート
関心事抽出の処理手順を示すフローチャート
情報結合の処理手順を示すフローチャート
サマリ生成の処理手順を示すフローチャート
蒸留による情報結合を採用する場合の計算機の処理手順を示すフローチャート
蒸留による情報結合の処理手順を示すフローチャート
階層構造の表示と選択の具体例
【発明を実施するための形態】
【0008】
以下、実施例を図面を用いて説明する。
【実施例】
【0009】
図1は、実施例1の情報抽出システムの構成図である。図1に示した計算機100は、CPU(Central Processing Unit)101、メモリ102、ストレージ103、入力装置104、出力装置105及び通信装置106を有するコンピュータである。
【0010】
入力装置104は、例えばキーボードやポインティングデバイスである。
出力装置105は、例えば液晶ディスプレイである。
通信装置106は、外部の装置と通信する通信インタフェースである。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
株式会社日立製作所
バッチシステム分析装置及びバッチシステム分析方法
今日
株式会社日立製作所
行動分析装置、行動分析方法及び案内情報提供システム
3日前
株式会社日立製作所
回転電機の駆動装置、駆動方法および鉄道車両
3日前
個人
詐欺保険
13日前
個人
縁伊達ポイン
13日前
個人
RFタグシート
今日
個人
地球保全システム
26日前
個人
QRコードの彩色
17日前
個人
為替ポイント伊達夢貯
1か月前
個人
冷凍食品輸出支援構造
1か月前
個人
表変換編集支援システム
1か月前
個人
農作物用途分配システム
12日前
個人
残土処理システム
19日前
個人
知的財産出願支援システム
20日前
個人
タッチパネル操作指代替具
6日前
個人
知財出願支援AIシステム
1か月前
個人
スケジュール調整プログラム
5日前
個人
携帯端末障害問合せシステム
5日前
個人
パスワード管理支援システム
1か月前
個人
行動時間管理システム
1か月前
個人
AIによる情報の売買の仲介
1か月前
個人
システム及びプログラム
1か月前
株式会社キーエンス
受発注システム
25日前
個人
AIキャラクター制御システム
1か月前
株式会社キーエンス
受発注システム
25日前
日本精機株式会社
施工管理システム
1か月前
個人
食品レシピ生成システム
25日前
株式会社キーエンス
受発注システム
25日前
個人
海外支援型農作物活用システム
1か月前
サクサ株式会社
中継装置
1か月前
個人
SaaS型勤務調整支援システム
1か月前
個人
社会還元・施設向け供給支援構造
1か月前
キヤノン株式会社
表示システム
25日前
個人
人格進化型対話応答制御システム
1か月前
個人
音声対話型帳票生成支援システム
1か月前
個人
未来型家系図構築システム
1か月前
続きを見る
他の特許を見る