TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2024178844
公報種別
公開特許公報(A)
公開日
2024-12-25
出願番号
2023097303
出願日
2023-06-13
発明の名称
文書の要約を生成するシステムおよび方法
出願人
株式会社日立製作所
代理人
弁理士法人サンネクスト国際特許事務所
主分類
G06F
40/279 20200101AFI20241218BHJP(計算;計数)
要約
【課題】文書の要約を、ユーザの観点に沿って、高精度に行うことが可能な技術を提供する。
【解決手段】文書要約生成システムは、文書の要約を生成するシステムであって、少なくともプロセッサと記憶デバイスとを備えるコンピュータが、ユーザが当該文書の要約に含めたい箇所を表すユーザの観点を把握するユーザ観点把握処理と、当該文書からユーザの観点が含まれる文を重要文として抽出するための抽出モデルを構築する抽出要約モデル学習処理と、構築された抽出モデルを用いて、当該文書から重要文を抽出する要約学習データ生成処理と、抽出された重要文を教師データとして用いて、当該文書の要約を生成するために用いる要約言語モデルを再学習させる要約言語モデル教師あり学習処理とを実行する。
【選択図】図3
特許請求の範囲
【請求項1】
文書の要約を生成する文書要約生成システムであって、
少なくともプロセッサと記憶デバイスとを備えるコンピュータが、
ユーザが当該文書の要約に含めたい箇所を表すユーザの観点を把握するユーザ観点把握処理と、
当該文書から前記ユーザの観点が含まれる文を重要文として抽出するための抽出モデルを構築する抽出要約モデル学習処理と、
前記構築された抽出モデルを用いて、当該文書から重要文を抽出する要約学習データ生成処理と、
前記抽出された重要文を教師データとして用いて、当該文書の要約を生成するために用いる要約言語モデルを再学習させる要約言語モデル教師あり学習処理と
を実行する、
文書要約生成システム。
続きを表示(約 720 文字)
【請求項2】
前記ユーザの観点は、当該ユーザから当該文書における重要箇所を指定する入力操作を受け付けることによって把握される、請求項1に記載の文書要約生成システム。
【請求項3】
前記抽出された重要文を画面上に表示して、当該重要文への修正操作を当該ユーザから受け付ける、請求項1に記載の文書要約生成システム。
【請求項4】
前記ユーザの観点に基づいて報酬関数を設計し、当該報酬関数を用いて前記再学習させた要約言語モデルに対して強化学習を施す要約言語モデル強化学習処理をさらに実行する、請求項1に記載の文書要約生成システム。
【請求項5】
前記文書を表すデータは、当該ユーザが所有する文書データと、当該ユーザのドメインデータとの少なくともいずれか一つである、請求項1に記載の文書要約生成システム。
【請求項6】
前記ユーザの観点は、当該文書に含まれる5W1Hの少なくともいずれか一つを表す単語を含む、請求項1に記載の文書要約生成システム。
【請求項7】
文書の要約を生成する文書要約生成方法であって、
少なくともプロセッサと記憶デバイスとを備えるコンピュータが、
ユーザが当該文書の要約に含めたい箇所を表すユーザの観点を把握し、
当該文書から前記ユーザの観点が含まれる文を重要文として抽出するための抽出モデルを構築し、
前記構築された抽出モデルを用いて、当該文書から重要文を抽出し、
前記抽出された重要文を教師データとして用いて、当該文書の要約を生成するために用いる要約言語モデルを再学習させる
文書要約生成方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、文書の要約を生成するための技術に関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
今日、自然言語処理技術は、社会のさまざまな場面で活用されている。とりわけ、昨今では、生産性の向上や時間効率化等に資する重要な技術として、注目度が増している。そうした、主に生産性の向上や時間効率化等を目的とした自然言語処理技術の活用法の具体例として、各種報道機関が日々インターネットを介して配信するニュース記事や、コールセンターにおける顧客との対話ログ等といった大量の文章データから有用な情報を抽出するために、その内容を要約してユーザに提示する機能を有する各種システム(以下、「文書要約システム」と総称する)が挙げられる。
【0003】
この文書要約システムの開発は、近年、とくに興隆が目覚ましく、現在では、大規模な言語モデルを用いることによって文章全体の意味を捉え、尤もらしい要約文を生成することができる、抽象型の文書要約システムが登場し、さらなる進展を遂げている(例えば特許文献1~2)。
【先行技術文献】
【特許文献】
【0004】
米国特許出願公開第2021/0192126号明細書
特開2021-131769号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
一般に、文書要約システムが行う要約学習は、翻訳学習と比較してデータセットが大規模でないことが多く、ドメイン過学習が起きやすい、という性質を有する。ドメイン過学習が起きると、要約学習時のドメインと、ユーザの文書データのドメインとが不一致となり、要約精度が低下する、という問題が生じる。この問題について、従来の文書要約システムは、要約言語モデルを学習する際、例えばニュース記事等の既存の要約学習データを用いて一般的な要約機能を学習した後で、当該システムにデプロイ(配備)するため、デプロイ前にあらかじめユーザの文書データのドメインを把握し、学習させておくことが難しかった。
【0006】
また、例えば、文書要約システムのユーザが企業等の業務担当者である場合に、当該ユーザが「自社のビジネスに関連した箇所を中心に文書を要約したい」と考えるように、文書要約システムのユーザは、通常、文書を要約する際に特に重視する観点(以下、「ユーザの観点」と称する)を有していることが多い。そして、このユーザの観点は、ユーザごとに異なっていることが通常であるため、各ユーザの観点に沿うように要約内容を調整するためには、ユーザごとに異なる観点を全て事前に把握したうえで、要約言語モデルを学習させる必要がある。しかしながら、ユーザの観点を事前に全て把握した上で、要約言語モデルを学習させることは困難であるため、従来の文書要約システムは、ユーザの観点に沿うように要約内容を調整することが難しかった。
【0007】
本発明は、上記の課題に鑑みてなされたものであり、文書の要約を、ユーザの観点に沿って、高精度に行うことが可能な技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明による文書要約生成システムは、文書の要約を生成するシステムであって、少なくともプロセッサと記憶デバイスとを備えるコンピュータが、ユーザが当該文書の要約に含めたい箇所を表すユーザの観点を把握するユーザ観点把握処理と、当該文書からユーザの観点が含まれる文を重要文として抽出するための抽出モデルを構築する抽出要約モデル学習処理と、構築された抽出モデルを用いて、当該文書から重要文を抽出する要約学習データ生成処理と、抽出された重要文を教師データとして用いて、当該文書の要約を生成するために用いる要約言語モデルを再学習させる要約言語モデル教師あり学習処理とを実行する。
【0009】
その他、本願が開示する課題、およびその解決方法は、発明を実施するための形態の欄、および図面により明らかにされる。
【発明の効果】
【0010】
本発明によれば、文書の要約を、ユーザの観点に沿って、高精度に行うことができる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社日立製作所
情報システム
26日前
株式会社日立製作所
蒸気発生装置
25日前
株式会社日立製作所
電力変換装置
11日前
株式会社日立製作所
ガス分離装置
26日前
株式会社日立製作所
流体置換装置
19日前
株式会社日立製作所
輸送システム
25日前
株式会社日立製作所
異常検知装置
19日前
株式会社日立製作所
搬送量算出方法
18日前
株式会社日立製作所
品質管理システム
11日前
株式会社日立製作所
情報処理システム
26日前
株式会社日立製作所
中継要否決定装置
11日前
株式会社日立製作所
生体検知システム
18日前
株式会社日立製作所
ピッキングシステム
25日前
株式会社日立製作所
移動体制御システム
25日前
株式会社日立製作所
エネルギー管理装置
18日前
株式会社日立製作所
情報処理装置及び方法
13日前
株式会社日立製作所
宇宙太陽光発電システム
20日前
株式会社日立製作所
学習装置、及び学習方法
11日前
株式会社日立製作所
制御装置および制御方法
1か月前
株式会社日立製作所
調速機及びエレベーター
26日前
株式会社日立製作所
診断装置および診断方法
13日前
株式会社日立製作所
軌条車両用空気調和装置
11日前
株式会社日立製作所
決定システム及び決定方法
11日前
株式会社日立製作所
軌条車両およびその製造方法
25日前
株式会社日立製作所
情報処理装置、及び推定方法
18日前
株式会社日立製作所
試料ホルダー及び電子顕微鏡
25日前
株式会社日立製作所
燃料集合体及び原子炉の炉心
25日前
株式会社日立製作所
乗客コンベア及び冠水防止装置
25日前
株式会社日立製作所
行動分析装置及び行動分析方法
18日前
株式会社日立製作所
電子配置方法及び電子配置装置
25日前
株式会社日立製作所
検査支援装置及び検査支援方法
13日前
株式会社日立製作所
設計支援装置及び設計支援方法
11日前
株式会社日立製作所
ガス分離システムとその制御方法
26日前
株式会社日立製作所
文書分類装置並びに文書分類方法
25日前
株式会社日立製作所
作業支援装置および作業支援方法
11日前
株式会社日立製作所
配列生成装置および配列生成方法
26日前
続きを見る
他の特許を見る