TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024151986
公報種別
公開特許公報(A)
公開日
2024-10-25
出願番号
2023065854
出願日
2023-04-13
発明の名称
情報処理装置、情報処理システム、情報処理方法及びプログラム
出願人
株式会社リコー
代理人
個人
,
個人
主分類
G06F
40/279 20200101AFI20241018BHJP(計算;計数)
要約
【課題】要約の精度をより向上させること。
【解決手段】情報処理装置は、設定情報に基づき、要約対象のテキストを1以上の分割範囲に分割する複数の分割パターンを生成する分割パターン生成部と、前記分割パターンごとに、当該分割パターンに係るそれぞれの前記分割範囲について要約文を生成する要約部と、前記分割パターンごとに、当該分割パターンに関して生成された要約文の集合に基づいて所定の評価を行い、評価結果に基づいていずれかの分割パターンを選択する選択部と、選択された前記分割パターンに係る要約文の集合を出力する出力部と、を有する。
【選択図】図4
特許請求の範囲
【請求項1】
設定情報に基づき、要約対象のテキストを1以上の分割範囲に分割する複数の分割パターンを生成する分割パターン生成部と、
前記分割パターンごとに、当該分割パターンに係るそれぞれの前記分割範囲について要約文を生成する要約部と、
前記分割パターンごとに、当該分割パターンに関して生成された要約文の集合に基づいて所定の評価を行い、評価結果に基づいていずれかの分割パターンを選択する選択部と、
選択された前記分割パターンに係る要約文の集合を出力する出力部と、
を有することを特徴とする情報処理装置。
続きを表示(約 1,100 文字)
【請求項2】
前記要約部は、テキストと当該テキストに対する正解要約文とを含む学習データに基づいて学習されたモデルを用いて要約文を生成する、
ことを特徴とする請求項1記載の情報処理装置。
【請求項3】
前記要約部は、抽象型要約によって要約文を生成し、
前記選択部は、前記分割パターンに係る前記分割範囲ごとに、当該分割範囲について生成された要約文と、当該分割範囲から抽出された文字列との比較に基づいて評価を行う、
ことを特徴とする請求項1又は2記載の情報処理装置。
【請求項4】
前記要約部は、前記選択された分割パターンに関して生成された第1の要約文の集合を1以上に分割する分割範囲ごとに第2の要約文を生成し、
前記出力部は、前記第1の要約文に対応させて前記第2の要約文を出力する、
ことを特徴とする請求項1記載の情報処理装置。
【請求項5】
前記分割パターン生成部は、前記要約対象のテキストを、前記設定情報に基づく分割数の分割範囲に分割する複数の前記分割パターンを生成する、
ことを特徴とする請求項1記載の情報処理装置。
【請求項6】
前記要約部は、分野ごとに学習された複数の前記モデルのうち、前記要約対象のテキストに係る分野に対応する前記モデルを用いて要約文を生成する、
ことを特徴とする請求項2記載の情報処理装置。
【請求項7】
前記要約部は、文書のフォーマットごとに学習された複数の前記モデルのうち、前記要約対象のテキストに係るフォーマットに対応する前記モデルを用いて要約文を生成する、
ことを特徴とする請求項2記載の情報処理装置。
【請求項8】
前記要約部は、文体ごとに学習された複数の前記モデルのうち、前記要約対象のテキストに係る文体に対応する前記モデルを用いて要約文を生成する、
ことを特徴とする請求項2記載の情報処理装置。
【請求項9】
前記選択部は、前記評価結果が最高である前記分割パターンを選択する、又は前記評価結果と閾値との比較に基づいて前記分割パターンを選択する、
ことを特徴とする請求項1記載の情報処理装置。
【請求項10】
前記選択部は、前記評価結果に基づいて2以上の前記分割パターンを選択し、
前記出力部は、前記2以上の分割パターンによって分割される範囲ごとの要約文の集合を出力する、
ことを特徴とする請求項1記載の情報処理装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、情報処理装置、情報処理システム、情報処理方法及びプログラムに関する。
続きを表示(約 2,200 文字)
【背景技術】
【0002】
企業等をはじめとする各種組織における会議や、個人または団体等の主催による会合など、さまざまな場面において記録・作成される議事録や社内文書などを確認する際、全文を読まなくても概要を把握するために、要約文が必要とされることも多い。また、議事録や社内文書に限らず日々生成される多くの文書の要約文を生成するために自動で要約文を生成する技術が求められている。斯かる技術では、精度の高い要約文を生成することが求められる。
【0003】
例えば、特許文献1には、テキスト文章の自動要約の精度をより向上させることを可能とするために、要約に係る学習モデルの機械学習に用いる学習データを生成する学習データ生成方法が開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
一般に、要約は複数の文を含む原文を入力し、原文より少ない文(例えば、一文)にまとめる処理である。原文の量が多ければ多いほど、要約の精度が低下する可能性が高くなる。そこで、原文を複数の範囲に分割して、範囲ごとに要約文を生成することが行われる。
【0005】
原文を複数の範囲に分割する場合、分割の仕方(分割数や分割位置)が適切でないと期待したほど要約の精度が得られない可能性が有る。例えば、原文が複数のトピック(章)を含む場合に、単純に文の数で原文を分割すると、トピックの区切りと要約の範囲の区切りとの乖離が大きくなり、各トピックの重要な内容が要約結果に反映されない可能性が有る。
【0006】
具体的な一例を示すと、例えば原文がトピックA、B、Cをこの順番で含むとする。トピックA、B、Cは、順番に、5文、20文、5文から構成されるとする。この原文を、10文ずつに3分割して、3つの要約文を生成したとする。この場合、1番目の範囲に対する要約文は、トピックAの全文と、トピックBの最初の5文との要約を示す。2番目の範囲に対する要約文は、トピックBの6分目から15文目までの要約を示す。3番目の範囲に対する要約は、トピックBの最後の5文と、トピックCの全文との要約を示す。1番目又は3番目の範囲に対する要約文では、トピックBの最初又は最後の5文の影響により、トピックA又はCの内容が希釈化されてしまう可能性がある。2番目の範囲に対する要約文では、トピックBの最初及び最後の5文が欠けることで、トピックBの重要な内容が欠落する可能性がある。
【0007】
本発明は、上記の点に鑑みてなされたものであって、要約の精度をより向上させることを目的とする。
【課題を解決するための手段】
【0008】
そこで上記課題を解決するため、情報処理装置は、設定情報に基づき、要約対象のテキストを1以上の分割範囲に分割する複数の分割パターンを生成する分割パターン生成部と、前記分割パターンごとに、当該分割パターンに係るそれぞれの前記分割範囲について要約文を生成する要約部と、前記分割パターンごとに、当該分割パターンに関して生成された要約文の集合に基づいて所定の評価を行い、評価結果に基づいていずれかの分割パターンを選択する選択部と、選択された前記分割パターンに係る要約文の集合を出力する出力部と、を有する。
【発明の効果】
【0009】
要約の精度をより向上させることができる。
【図面の簡単な説明】
【0010】
第1の実施の形態における要約文生成装置10のハードウェア構成例を示す図である。
第1の実施の形態における要約文生成装置10の学習時の機能構成例を示す図である。
第1の実施の形態における要約モデルm1の学習処理の処理手順の一例を説明するためのフローチャートである。
第1の実施の形態における要約文生成装置10の推論時の機能構成例を示す図である。
第1の実施の形態における要約処理の処理手順の一例を説明するためのフローチャートである。
対象テキストの一例を示す図である。
対象テキストを構成する文の系列を示す図である。
第1の実施の形態における設定画面の一例を示す図である。
分割パターンの選択を説明するための図である。
要約結果の出力情報の第1の例を示す図である。
要約結果の出力情報の第2の例を示す図である。
再帰的な要約を説明するための図である。
第2の実施の形態における設定画面の一例を示す図である。
文書のフォーマットの一例を示す図である。
第3の実施の形態における情報処理システムの構成例を示す図である。
第3の実施の形態における検索結果画面の一例を示す図である。
第4の実施の形態における情報処理システムの構成例を示す図である。
第4の実施の形態における議事録生成装置40の機能構成例を示す図である。
第4の実施の形態における遠隔会議画面の表示例を示す図である。
第4の実施の形態における議事録検索画面の表示例を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社リコー
画像読取装置
6日前
株式会社リコー
画像形成装置
13日前
株式会社リコー
シート収納装置
19日前
株式会社リコー
画像形成システム
12日前
株式会社リコー
検査方法及び塗装装置
12日前
株式会社リコー
搬送装置及び画像形成装置
13日前
株式会社リコー
定着装置及び画像形成装置
26日前
株式会社リコー
光照射装置及び画像形成装置
26日前
株式会社リコー
媒体搬送装置及び画像形成装置
6日前
株式会社リコー
粉体収容容器及び画像形成装置
13日前
株式会社リコー
シート搬送装置及び画像形成装置
26日前
株式会社リコー
液体吐出装置および液体吐出方法
26日前
株式会社リコー
液滴吐出装置及び画像形成システム
7日前
株式会社リコー
画像形成装置及び画像形成システム
26日前
株式会社リコー
加熱装置、定着装置、画像形成装置
6日前
株式会社リコー
基板ユニット、及び、画像形成装置
5日前
株式会社リコー
波形発生特定方法およびプログラム
5日前
株式会社リコー
画像形成装置、及び、画像形成方法
20日前
株式会社リコー
波形発生特定方法およびプログラム
5日前
株式会社リコー
機器、プログラム、データ保存方法
13日前
株式会社リコー
加熱装置、定着装置、画像形成装置
7日前
株式会社リコー
加熱装置、定着装置及び画像形成装置
26日前
株式会社リコー
記録媒体搬送装置、及び、画像形成装置
7日前
株式会社リコー
支持ユニット、転写装置及び画像形成装置
今日
株式会社リコー
機器、ソフトウェア検証方法、プログラム
今日
株式会社リコー
要約システム、要約方法、及びプログラム
26日前
株式会社リコー
ラミネート処理装置、及び、画像形成システム
26日前
株式会社リコー
駆動伝達装置、シート搬送装置及び画像形成装置
6日前
株式会社リコー
画像形成装置、画像形成方法、およびプログラム
6日前
株式会社リコー
樹脂粒子分散液の製造方法、トナー粒子の製造方法
13日前
株式会社リコー
情報処理システム、情報処理方法およびプログラム
26日前
株式会社リコー
画像形成装置、故障検知方法及び故障検知プログラム
13日前
株式会社リコー
シート処理装置、画像形成装置及び画像形成システム
6日前
株式会社リコー
カム装置、引出ユニット、転写装置および画像形成装置
12日前
株式会社リコー
生体信号解析装置、波形発生特定方法およびプログラム
5日前
株式会社リコー
情報処理装置、画像形成装置、情報処理方法、プログラム
6日前
続きを見る
他の特許を見る