TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024123924
公報種別
公開特許公報(A)
公開日
2024-09-12
出願番号
2023031747
出願日
2023-03-02
発明の名称
修辞構造解析学習装置、システム、パラメタ最適化方法、及びプログラム
出願人
日本電信電話株式会社
,
国立大学法人東京工業大学
代理人
弁理士法人ITOH
,
個人
,
個人
,
個人
主分類
G06F
40/216 20200101AFI20240905BHJP(計算;計数)
要約
【課題】事前学習時のパラメタ最適化にバイアスをかけることなく、正解データとしての生テキストデータを大量に用意する必要がない修辞構造解析学習装置、パラメタ最適化方法及びプログラムを提供する。
【解決手段】修辞構造解析学習装置及び修辞構造推定装置によって構築されているシステムにおいて、修辞構造解析のパラメタを最適化する修辞構造解析学習装置は、文章である正解データとしての訓練データに対して翻訳後に逆翻訳を行うことで疑似訓練データを生成するデータ拡張部と、前記疑似訓練データを用いて、ランダムに初期化したパラメタを最適化することで所定のパラメタを生成する事前学習部と、前記所定のパラメタを初期値とし、前記訓練データを用いて、前記所定のパラメタを最適化することで最終的なパラメタを生成する追加学習部と、を有する。
【選択図】図3
特許請求の範囲
【請求項1】
修辞構造解析のパラメタを最適化する修辞構造解析学習装置であって、
文章である正解データとしての訓練データに対して翻訳後に逆翻訳を行うことで疑似訓練データを生成するデータ拡張部と、
前記疑似訓練データを用いて、ランダムに初期化したパラメタを最適化することで所定のパラメタを生成する事前学習部と、
前記所定のパラメタを初期値とし、前記訓練データを用いて、前記所定のパラメタを最適化することで最終的なパラメタを生成する追加学習部と、
を有する修辞構造解析学習装置。
続きを表示(約 1,000 文字)
【請求項2】
前記データ拡張部は、
第1の言語で示された文章から所定の割合の文である選択文を選択する文選択部と、
前記選択文を前記第1の言語とは異なる第2の言語に機械翻訳する機械翻訳部と、
前記第2の言語に翻訳された前記選択文を前記第1の言語に逆翻訳する逆機械翻訳部と、
前記逆翻訳された前記選択文及び前記文選択部によって選択されなかった文である非選択文を合わせて、前記疑似訓練データを生成する疑似訓練データ生成部と、
を有する請求項1に記載の修辞構造解析学習装置。
【請求項3】
請求項1又は2に記載の修辞構造解析学習装置と、
各パラメタに基づいて木構造を推定して得た部分木と正解データで示される木構造の部分木との一致率を示す評価スコアを算出する修辞構造推定装置と、
を有するシステム。
【請求項4】
修辞構造解析の学習を行う修辞構造解析学習装置が実行する修辞構造解析のパラメタを最適化するパラメタ最適化方法であって、
修辞構造解析学習装置は、
文章である正解データとしての訓練データに対して翻訳後に逆翻訳を行うことで疑似訓練データを生成するデータ拡張処理と、
前記疑似訓練データを用いて、ランダムに初期化したパラメタを最適化することで所定のパラメタを生成する事前学習処理と、
前記所定のパラメタを初期値とし、前記訓練データを用いて、前記所定のパラメタを最適化することで最終的なパラメタを生成する追加学習処理と、
を実行するパラメタ最適化方法。
【請求項5】
前記データ拡張処理は、
第1の言語で示された文章から所定の割合の文である選択文を選択する文選択処理と、
前記選択文を前記第1の言語とは異なる第2の言語に機械翻訳する機械翻訳処理と、
前記第2の言語に翻訳された前記選択文を前記第1の言語に逆翻訳する逆機械翻訳処理と、
前記逆翻訳された前記選択文及び前記文選択処理によって選択されなかった文である非選択文を合わせて、前記疑似訓練データを生成する疑似訓練データ生成処理と、
を含む請求項4に記載のパラメタ最適化方法。
【請求項6】
コンピュータに、請求項4又は5に記載の方法を実行させるプログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示内容は、計算機を用いて言語を処理する自然言語処理分野に属し、特に、文書の構造を自動的に推定する修辞構造解析のパラメタ最適化における擬似訓練データの活用に属する。
続きを表示(約 1,600 文字)
【背景技術】
【0002】
修辞構造解析では、文書をElementary Discourse Unit(EDU)と呼ばれる文よりも小さい、節に相当するテキストユニットの系列データとみなす。そして、これらを、終端ノード及びEDUの連なりで形成する木(スパンの関係を非終端ノードがあらわす再帰構造を持った木)として表現する(図7参照)。図7において、終端ノードはEDU(e)である。非終端ノードは、それが支配するスパンの核性(従属関係)、つまり核(N:Nucleus)であるか衛星(S:Satellite)であるかを表す。核(N)はより中心的な情報を表すテキスト領域であり、衛星(S)は核を補足するテキスト領域である。
【0003】
2つの非終端ノードをつなぐエッジには関係ラベルが与えられる。2つの非終端ノードがS、Nの組みである場合、S側のエッジには、Elaborationなどの関係ラベル(全18種)が付与され、N側のエッジには、デフォルトラベルであるspanが与えられる。なお、spanはN側に与えられるデフォルトラベルなので、関係ラベルとしてはとらえられない。また、2つの非終端ノードが、NとNの組みである場合、双方のエッジに対してSame-Unitなどの関係ラベルが与えられる。
【0004】
文書、つまりEDUの系列が与えられた際に修辞木構造を推定する技術は、現在ではニューラルネットワークを用いて実現される。例えば、事前学習済み言語モデルを用いてスパンのベクトルを得たのち、(1)木構造推定(スパンの結合もしくは分割の決定)、(2)核性推定(N-S、S-N、又はN-N のいずれかを選択)、(3)関係ラベル推定(18種の関係のうちいずれかを選択)をニューラルネットワークにより実現する。
【0005】
なお、現状の多くの修辞構造解析はトップダウン、つまり、スパンを分割することで木を推定する。たとえば、非特許文献1について、以降、トップダウン解析器を前提として説明を進めるが、ボトプアップ解析においても本開示内容は問題なく適用できる。
【0006】
続いて、図8に一般的なトップダウン解析器の概要を示す。まず、文書をトークンtの系列としてとらえる。連続したEDUで構成されるスパンのベクトルuは、左端のEDUの左端のトークンの埋め込みベクトルと右端のEDUの右端のトークンの埋め込みベクトルの平均とする。図8中のi番目のEDUからj番目のEDUにより構成されるスパンのベクトルはi番目のEDUの左端のトークンの埋め込みベクトルw
b(i)
とk番目のEDUの左端のトークンの埋め込みベクトルw
e(k)
の平均とする。そして、トップダウン解析器が、ベクトルuを順伝播型ニューラルネットワークに入力することでベクトルhを得て、バイアフィン層に入力することで、木構造の推定、核性及び関係ラベルの推定を行う。
【0007】
この場合、i番目のEDUからj番目のEDUで構成されるスパンを
【0008】
TIFF
2024123924000002.tif
26
169
番目のEDUで分割するスコアは以下の(式1)で定義される。
【0009】
TIFF
2024123924000003.tif
37
169
ここで、Wはパラメタ行列、vはパラメタベクトルである。hはそれぞれ以下の(式2)及び(式3)で定義される。
【0010】
TIFF
2024123924000004.tif
27
169
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
対話装置
27日前
個人
情報処理装置
27日前
個人
情報処理装置
23日前
個人
検査システム
1日前
個人
記入設定プラグイン
15日前
キヤノン電子株式会社
携帯装置
今日
個人
不動産売買システム
7日前
個人
情報入力装置
27日前
株式会社サタケ
籾摺・調製設備
今日
個人
物価スライド機能付生命保険
27日前
個人
マイホーム非電子入札システム
27日前
株式会社BONNOU
管理装置
20日前
キヤノン株式会社
情報処理装置
今日
サクサ株式会社
中継装置
今日
キヤノン株式会社
情報処理装置
今日
キヤノン電子株式会社
名刺管理システム
1日前
東洋電装株式会社
操作装置
今日
個人
決済手数料0%のクレジットカード
1か月前
株式会社ワコム
電子消去具
7日前
サクサ株式会社
カードの制動構造
29日前
ホシデン株式会社
タッチ入力装置
7日前
東洋電装株式会社
操作装置
今日
アスエネ株式会社
排水量管理方法
今日
株式会社東芝
電子機器
8日前
株式会社JVCケンウッド
管理装置
1日前
個人
パターン抽出方法及び通信多重化方法
6日前
トヨタ自動車株式会社
情報処理装置
1か月前
村田機械株式会社
割当補助システム
1か月前
株式会社ライト
情報処理装置
20日前
株式会社CBE-A
情報処理システム
6日前
大王製紙株式会社
RFIDタグ
6日前
住友重機械工業株式会社
力覚伝達装置
22日前
アスエネ株式会社
廃棄物排出量管理方法
今日
個人
システム、データおよびプログラム
16日前
株式会社寺岡精工
顔認証システム
1日前
株式会社mov
情報処理システム
27日前
続きを見る
他の特許を見る