TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025121515
公報種別公開特許公報(A)
公開日2025-08-20
出願番号2024016946
出願日2024-02-07
発明の名称修辞構造解析装置、修辞構造解析方法及びプログラム
出願人NTT株式会社,国立大学法人東京科学大学
代理人弁理士法人ITOH,個人,個人,個人
主分類G06F 40/35 20200101AFI20250813BHJP(計算;計数)
要約【課題】修辞構造解析の性能を向上させること。
【解決手段】修辞構造解析装置は、入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力するように構成されている問い合わせ部と、前記LLMからの出力に基づいて修辞構造木を構築するように構成されている修辞構造木構築部と、を有する。
【選択図】図4
特許請求の範囲【請求項1】
入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力するように構成されている問い合わせ部と、
前記LLMからの出力に基づいて修辞構造木を構築するように構成されている修辞構造木構築部と、
を有することを特徴とする修辞構造解析装置。
続きを表示(約 990 文字)【請求項2】
前記問い合わせ部は、前記文書を形成するテキストユニットの系列の前記テキストユニットに対応する要素又は前記テキストユニットに基づく木構造に対応する要素を修辞構造解析のために格納するデータ構造に対する操作を問い合わせるための第1のプロンプト、前記データ構造において前記操作の対象とされる要素の核性を問い合わせるための第2のプロンプト、又は前記データ構造において前記核性に係る要素の談話関係を問い合わせるための第3のプロンプトを生成するように構成されており、
前記修辞構造木構築部は、前記第1のプロンプトを入力したLLMからの出力に応じた操作を前記データ構造に対して実行し、前記第2のプロンプトを入力したLLMから出力される核性と、前記第3のプロンプトを入力したLLMから出力される談話関係を前記修辞構造木へ与えるように構成されている、
ことを特徴とする請求項1記載の修辞構造解析装置。
【請求項3】
前記データ構造は、シフト還元法によって修辞構造解析するためのキュー及びスタックであり、
前記問い合わせ部は、前記キュー及びスタックに基づいて前記第1のプロンプトを生成し、当該第1のプロンプトを入力したLLMから出力される操作が還元を示す場合に、当該還元が実行される直前の前記スタックに基づいて前記第2のプロンプトを生成し、当該第2のプロンプトを入力したLLMから出力される核性と、当該還元が実行される直前の前記スタックに基づいて前記第3のプロンプトを生成するように構成されている、
ことを特徴とする請求項2記載の修辞構造解析装置。
【請求項4】
入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力する問い合わせ手順と、
前記LLMからの出力に基づいて修辞構造木を構築する修辞構造木構築手順と、
をコンピュータが実行することを特徴とする修辞構造解析方法。
【請求項5】
入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力する問い合わせ手順と、
前記LLMからの出力に基づいて修辞構造木を構築する修辞構造木構築手順と、
をコンピュータに実行させることを特徴とするプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、修辞構造解析装置、修辞構造解析方法及びプログラムに関する。
続きを表示(約 2,400 文字)【背景技術】
【0002】
[修辞構造木]
修辞構造解析では、文書をEDU(Elementary Discourse Unit)と呼ばれる文よりも小さい、節に相当するテキストユニットの系列データとみなし、これらを終端ノードがあらわし、EDUが形成するスパンの関係を非終端ノードがあらわす再帰構造を持った修辞構造木として表現する(図1参照)。図1においてEDUであるe1~e6(RST Discourse Treebank,WSJ 1100より)の内容は以下の通りである。
e1:[Westinghouse Electric Corp. said]
e2:[it will buy Shaw-Walker Co.]
e3:[Terms weren't disclosed.]
e4:[Shaw-Walker,]
e5:[based in Muskegon, Mich.,]
e6:[makes metal files and desks, and seating and office systems furniture.]
なお、本来、木は多分木として表されるが等価な完全2文木として表現可能である。図1において、終端ノードはEDU(e)であり、非終端ノードはそれが支配する左右のスパンの核性、つまり核(N)であるか衛星(S)であるかを表す。N-Sであれば、左のスパンがN、右のスパンがSとなる。S-Nであれば、右のスパンがN、左のスパンがSとなる。N-S、S-Nの場合にはSからNへの談話関係ラベルが与えられ、N-Nの場合には2つのスパンの間の並列関係をあらわす等価な談話関係ラベルが与えられる。図1の例では、e1はe2の衛星であり、それらの間の談話関係ラベルはAttributionである。また、e3は、e1とe2からなるスパンの衛星であり、それらの間の談話関係ラベルはElaborationである。
【0003】
[修辞構造解析]
文書、つまりEDUの系列が与えられた際に修辞木構造を推定する技術は、現在ではニューラルネットワークを用いて実現される。エンコーダのみの事前学習済み言語モデルを用いてスパンのベクトルを得たのち、(1)木構造推定(スパンの結合もしくは分割の決定)、(2)核性推定(N-S、S-N、N-Nのいずれかを選択)、(3)関係ラベル推定をニューラルネットワークにより実現する。
【0004】
つまり、テキストスパン(EDU系列)をベクトルへと変換する特徴抽出部と、特徴抽出部が出力したベクトルを受け取り、木構造推定、核性推定、談話関係ラベル推定を行う分類部からなる(図2参照)。図2において、FFN
act
が木構造推定、FFN
nuc
が核性推定、FFN
rel
が談話関係ラベルを担う。
【0005】
図2はシフト還元法による修辞構造解析法を示している。シフト還元法では、スタックとキューを用いて、以下のシフト、還元操作(アクション)を繰り返して木を構築する。
シフト:与えられたEDU系列を格納したキューの先頭のEDUをスタックに積む。
還元:スタックの上2つの要素(単一EDUあるいは木)を結合し、(2つの要素を兄弟とする)木を作りスタックの上に積む。
【0006】
なお、還元時に核性、談話関係ラベルも推定する。
【先行技術文献】
【非特許文献】
【0007】
Naoki Kobayashi and Tsutomu Hirao and Hidetaka Kamigaito and Manabu Okumura and Masaaki Nagata、"A Simple and Strong Baseline for End-to-End Neural RST-style Discourse Parsing"、Findings of the Association for Computational Linguistics: EMNLP 2022, pages 6754 - 6766 December
【発明の概要】
【発明が解決しようとする課題】
【0008】
現在の事前学習済み言語モデルの開発は、エンコーダのみのものからデコーダのみのものへと焦点が移っており、大規模化が加速している。多くのエンコーダのみの事前学習済み言語モデルのパラメータ数は数百万程度であることに対し、デコーダのみの事前学習済み大規模言語モデル(以下、「LLM」という。)のパラメータ数は数十億を超えることが多く、数百億を超えるものもある。一般的に、事前学習モデルを用いて自然言語処理のタスクを解く場合、パラメータ数が多い方が良い性能を期待できる。しかし、エンコーダのみの事前学習済み言語モデルとLLMは仕組みに大きな違いがあり、既存の修辞構造解析技術における特徴抽出部の事前学習済み言語モデルをLLMに置き換えるだけでは十分な性能を得ることができない。
【0009】
本発明は、上記の点に鑑みてなされたものであって、修辞構造解析の性能を向上させることを目的とする。
【課題を解決するための手段】
【0010】
そこで上記課題を解決するため、修辞構造解析装置は、入力された文書を修辞構造解析するためのプロンプトを生成し、前記プロンプトをLLMに入力するように構成されている問い合わせ部と、前記LLMからの出力に基づいて修辞構造木を構築するように構成されている修辞構造木構築部と、を有する。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

NTT株式会社
試験装置および試験方法
1か月前
NTT株式会社
分類装置、および分類方法
1か月前
NTT株式会社
量子計算装置、及び制御装置
19日前
NTT株式会社
光増幅器及び光増幅器監視方法
19日前
NTT株式会社
音声抽出装置及び音声抽出方法
4日前
NTT株式会社
足場を構築する施工方法及び治具
1か月前
NTT株式会社
無線通信方法及び無線通信システム
13日前
NTT株式会社
推論装置、推論方法、及びプログラム
17日前
NTT株式会社
単一光子生成装置、及び単一光子生成方法
3日前
NTT株式会社
生成システム、生成装置、および生成方法
7日前
NTT株式会社
情報処理装置、情報処理方法及びプログラム
14日前
NTT株式会社
置局設計装置、置局設計方法及びプログラム
25日前
NTT株式会社
周期検出装置、周期検出方法及びプログラム
3日前
NTT株式会社
情報処理装置、情報処理方法及びプログラム
7日前
NTT株式会社
配送計画装置、配送計画方法、及びプログラム
25日前
NTT株式会社
量子計算装置、量子計算方法、及びプログラム
1か月前
NTT株式会社
移動ロボット、移動量推定方法、及びプログラム
27日前
NTT株式会社
通信制御システム、通信制御方法及びプログラム
25日前
NTT株式会社
画像処理装置、画像処理方法及び画像処理プログラム
17日前
NTT株式会社
修辞構造解析装置、修辞構造解析方法及びプログラム
12日前
NTT株式会社
情報処理装置、情報処理方法および情報処理プログラム
12日前
富士通株式会社
データ転送制御装置および情報処理装置
18日前
富士通株式会社
データ転送制御装置および情報処理装置
18日前
NTT株式会社
簡易な方法で光ファイバをセンサ化するシステム及び方法
20日前
NTT株式会社
電気刺激装置、電気刺激システム、電気刺激方法及びプログラム
14日前
NTT株式会社
基地局及び端末
6日前
NTT株式会社
基地局及び端末
1か月前
NTT株式会社
伝送システム、送信装置、受信装置、伝送方法およびプログラム
25日前
NTT株式会社
音響信号出力装置
6日前
NTT株式会社
送信局及び受信局
19日前
NTT株式会社
通信ネットワークシステム、通信方法、通信端末およびプログラム
25日前
NTT株式会社
音響信号出力装置
1か月前
NTT株式会社
運動耐容能推定方法、運動耐容能推定装置及びコンピュータプログラム
28日前
NTT株式会社
光伝送システムの異常個所絞り込み装置、および、異常個所絞り込み方法
今日
NTT株式会社
装置、方法及びプログラム
10日前
NTT株式会社
光伝送システムにおける伝送品質劣化判定装置、および、伝送品質劣化判定方法
今日
続きを見る