TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024117996
公報種別公開特許公報(A)
公開日2024-08-30
出願番号2023024133
出願日2023-02-20
発明の名称応答文生成装置、応答変換学習装置、データベース作成装置、応答文生成方法およびプログラム
出願人日本電信電話株式会社,国立大学法人東北大学
代理人個人,個人,個人
主分類G06F 40/56 20200101AFI20240823BHJP(計算;計数)
要約【課題】入力された発話文と予め用意された用例文との意味的差分を精緻にとらえた応答文を生成する。
【解決手段】応答選択部10は、用例応答データベースD1の中から、入力発話文xに基づいて所定の条件を満たす用例文x’を決定し、決定した用例文x’とこれに対応する応答文y’とを選択する。エンコーダ21は、入力発話文x、選択された用例文x’、及び選択された応答文y’を、入力発話意味ベクトル^x、用例意味ベクトル^x’、及び応答意味ベクトル^y’へと変換する。意味差分ベクトル生成部は、入力発話意味ベクトル^xと用例意味ベクトル^x’との差分から意味差分ベクトル^wを生成する。デコーダ23は、意味差分ベクトル^wと応答意味ベクトル^y’とを加算して、入力発話文xと選択された用例文x’との意味の違いが反映された応答ベクトル^vへと変換し、応答ベクトル^vから変換後応答文vを生成する。
【選択図】図1
特許請求の範囲【請求項1】
一組が用例文とこの用例文に対応する応答文とからなる複数の組を有した用例応答データベースの中から、入力されたユーザの発話である入力発話文に基づいて所定の条件を満たす用例文を決定し、決定した前記用例文とこれに対応する前記応答文とを選択する応答選択部と、
前記入力発話文、選択された前記用例文、及び選択された前記応答文を、各文の意味ベクトルである、入力発話意味ベクトル、用例意味ベクトル、及び応答意味ベクトルへと変換するエンコーダと、
前記入力発話意味ベクトルと前記用例意味ベクトルとの差分から意味差分ベクトルを生成する意味差分ベクトル生成部と、
前記意味差分ベクトルと前記応答意味ベクトルとを加算して、前記入力発話文と選択された前記用例文との意味の違いが反映された応答ベクトルへと変換し、前記応答ベクトルから前記入力発話文に対する応答文である変換後応答文を生成する、デコーダと、
を有する応答文生成装置。
続きを表示(約 2,900 文字)【請求項2】
一組が用例文とこの用例文に対応する応答文とからなる複数の組を有した用例応答データベースと、一組が発話文とこの発話文に対応する応答文とからなる複数の組を有し、夫々の組が前記用例応答データベースのいずれかの組と所定の類似度を満たした疑似用例応答データベースと、を用いた応答変換学習装置であって、
前記用例応答データベースから入力された一組の用例文及び応答文と、この一組と前記所定の類似度を満たして前記疑似用例応答データベースから入力された発話文である入力発話文とを、各文の意味ベクトルである、用例意味ベクトル、応答意味ベクトル、及び入力発話意味ベクトルへと変換する、第1パラメータを使用するエンコーダと、
前記入力発話意味ベクトルと前記用例意味ベクトルとの差分から意味差分ベクトルを生成する意味差分ベクトル生成部と、
前記意味差分ベクトルと前記応答意味ベクトルとを加算して、前記入力発話文と入力された前記用例文との意味の違いが反映された応答ベクトルへと変換し、前記応答ベクトルから前記入力発話文に対する応答文である変換後応答文を生成する、第2パラメータを使用する学習用デコーダと、
前記変換後応答文と、前記入力発話文と対応する応答文との誤差が所定の条件に満たない場合は、前記第2パラメータを更新し、前記誤差が所定の条件を満たす場合は、直前に使用している前記第2パラメータを学習済パラメータとして出力する、パラメータ更新部と、
を有する応答変換学習装置。
【請求項3】
M,N(M>N)はそれぞれ自然数とし、(S


,S


)は学習用対話コーパスにおけるi(i=1,2,…M)番目の発話文と応答文とし、(T


,T


)は前記用例応答データベースにおけるj(j=1,2,…N)番目の用例文と応答文とし、sim(x,y)はベクトルxとベクトルyとの類似度とし、θ
sim
は予め定めた閾値とした場合、
前記疑似用例応答データベースは、次式
TIFF
2024117996000008.tif
9
40
TIFF
2024117996000009.tif
9
40
の双方の式の条件を具備した発話文と応答文とが前記学習用対話コーパスから抽出して作成されている、請求項2に記載の応答変換学習装置。
【請求項4】
一組が用例文とこの用例文に対応する応答文とからなる複数の組を有した用例応答データベースと、一組が発話文とこの発話文に対応する応答文とからなり、前記用例応答データベースが有する組数よりも多くの組数を有する学習用対話コーパスとを使用するものであって、
M,N(M>N)はそれぞれ自然数とし、(S


,S


)は前記学習用対話コーパスにおけるi(i=1,2,…M)番目の発話文と応答文とし、(T


,T


)は前記用例応答データベースにおけるj(j=1,2,…N)番目の用例文と応答文とし、sim(x,y)はベクトルxとベクトルyの類似度とし、θ
sim
は閾値とした場合、
前記用例応答データベースから入力された用例文と前記学習用対話コーパスから入力された発話文との第1類似度sim(S


,T


)と、前記用例応答データベースから入力された応答と前記学習用対話コーパスから入力された応答文との第2類似度sim(S


,T


)とを算出する類似度計算部と、
算出された前記第1類似度及び第2類似度が、次式
TIFF
2024117996000010.tif
9
40
TIFF
2024117996000011.tif
9
40
の双方の式の条件を具備する前記発話文と前記応答文との組を前記学習用対話コーパスから抽出してデータベースを生成する、データベース生成部と、
を有する、
データベース作成装置。
【請求項5】
一組が用例文と該用例文に対応する応答文とからなる用例応答ペアを複数有する用例応答データベースを用いる応答文生成装置であって、
ユーザの発話である入力発話文が入力された場合に、前記用例応答データベースの中から、前記入力発話文に基づいて所定の条件を満たす用例応答ペアを選択する応答選択部と、
入力された前記入力発話文、選択された前記用例応答ペアを用いて、前記入力発話文に対する応答文である変換後応答文を所定のパラメータに基づいて生成する応答変換部と、
一組が発話文と該発話文に対応する応答文からなる発話応答ペアを複数有する学習用対話コーパスから、前記用例応答データベースに含まれる用例応答ペアとの類似度が所定の条件を満たす前記発話応答ペアを抽出する類似度計算部と、
抽出された前記発話応答ペアに含まれる発話文を前記入力された入力発話文とし、前記類似度計算部による抽出の際に用いた前記用例応答データベースの用例応答ペアを選択された前記用例応答ペアとして、前記応答変換部に変換後応答文を生成させ、該変換後応答文と前記発話文に対応する応答文との誤差に基づいて前記パラメータを更新するパラメータ更新部と、
を有する応答文生成装置。
【請求項6】
応答選択部、エンコーダ、意味差分ベクトル生成部、及びデコーダを有した応答文生成装置が行う応答文生成方法であって、
前記応答選択部が、一組が用例文とこの用例文に対応する応答文とからなる複数の組を有した用例応答データベースの中から、入力されたユーザの発話である入力発話文に基づいて所定の条件を満たす用例文を決定し、決定した前記用例文とこれに対応する前記応答文とを選択し、
前記エンコーダが、前記入力発話文、選択された前記用例文、及び選択された前記応答文を、各文の意味ベクトルである、入力発話意味ベクトル、用例意味ベクトル、及び応答意味ベクトルへと変換し、
前記意味差分ベクトル生成部が、前記入力発話意味ベクトルと前記用例意味ベクトルとの差分から意味差分ベクトルを生成し、
前記デコーダが、前記意味差分ベクトルと前記応答意味ベクトルとを加算して、前記入力発話文と選択された前記用例文との意味の違いが反映された応答ベクトルへと変換し、前記応答ベクトルから前記入力発話に対する応答文である変換後応答文を生成する、
応答文生成方法。
【請求項7】
請求項1または請求項5に記載の応答文生成装置をコンピュータに機能させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、自然言語処理、及び自動応答技術に関するものであり、特に、想定されるユーザの入力(用例文)とそれに対応する応答文との組を複数格納した用例応答データベースに基づいて対話を行う用例応答ベースの対話システムにおける応答文生成に関する。
続きを表示(約 2,900 文字)【背景技術】
【0002】
用例応答ベースの対話システムは単純かつ頑健であるため広く普及している。従来の用例応答ベースの対話技術としては、ニューラルネットワークのエンコーダ・デコーダモデルに基づく応答変換器を大規模な言語コーパス(汎用的な言語データ)を用いて自己符号化器として学習することにより、用例文として想定していない発話文に対しても柔軟に対応して応答文を生成するものがあった(例えば非特許文献1参照)。
【先行技術文献】
【非特許文献】
【0003】
矢作凌大,能勢隆,伊藤彰則,用例ベース対話システムのための文ベクトルを用いた柔軟な応答生成手法の検討,音響学秋季研究発表会講演論文集, pp.809-812, 2021
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、非特許文献1の技術は、汎用的な言語データから学習された自己符号化器であり、入力された発話文と予め用意された用例文との意味的差分を精緻にとらえた応答文を生成することができないという課題があった。
【0005】
そこで、本開示は、上記課題を解決するためになされたものであり、入力された発話文と予め用意された用例文との意味的差分を精緻にとらえた応答文を生成する技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本開示の一態様の応答文生成装置は、応答選択部と、エンコーダと、意味差分ベクトル生成部と、デコーダとを有する。応答選択部は、一組が用例文とこの用例文に対応する応答文とからなる複数の組を有した用例応答データベースの中から、入力されたユーザの発話である入力発話文に基づいて所定の条件を満たす用例文を決定し、決定した用例文とこれに対応する応答文とを選択する。エンコーダは、入力発話文、選択された用例文、及び選択された応答文を、各文の意味ベクトルである、入力発話意味ベクトル、用例意味ベクトル、及び応答意味ベクトルへと変換する。意味差分ベクトル生成部は、入力発話意味ベクトルと用例意味ベクトルとの差分から意味差分ベクトルを生成する。デコーダは、意味差分ベクトルと応答意味ベクトルとを加算して、入力発話文と選択された用例文との意味の違いが反映された応答ベクトルへと変換し、応答ベクトルから入力発話文に対する応答文である変換後応答文を生成する。
【発明の効果】
【0007】
本開示によれば、応答文生成装置1の応答変換部20は、学習用対話コーパスから用例応答データベースに類似した発話文と応答文との組を抽出した疑似用例応答データベースを作成し、この疑似用例応答データベースを用いてニューラルネットワークのパラメータを更新する学習(ファインチューニング)が行われている。したがって、入力された発話文と予め用意された用例文との意味的差分を精緻にとらえた応答文を生成することができる。
【図面の簡単な説明】
【0008】
図1は本開示の実施形態に係る応答文生成装置の機能構成例を示した図である。
図2は本開示の実施形態に係る応答文生成方法の処理フロー例を示した図である。
図3は本開示の実施形態に係る応答変換学習装置の機能構成例を示した図である。
図4は本開示の実施形態に係る応答変換学習方法の処理フロー例を示した図である。
図5は本開示の実施形態に係るデータベース作成装置の機能構成例を示した図である。
図6は本開示の実施形態に係るデータベース作成方法の処理フロー例を示した図である。
図7は本開示の実施形態に係る自己符号化学習装置の機能構成例を示した図である。
図8は本開示の実施形態に係る自己符号化学習方法の処理フロー例を示した図である。
図9は本開示の実施形態の変形例に係る応答文生成装置の機能構成例において、ユーザの発話である入力発話文xが入力された場合を示した図である。
図10は本開示の実施形態の変形例に係る応答文生成装置における応答文生成方法の処理フロー例を示した図である。
図11は本開示の実施形態の変形例に係る応答文生成装置の機能構成例において、学習用対話コーパスD3から発話文S


と、発話文S


に対応する応答文S


とが入力された場合を示した図である。
図12は本開示の実施形態の変形例に係る応答変換部20aの学習方法の処理フロー例を示した図である。
図13はコンピュータの機能構成を例示する図である。
【発明を実施するための形態】
【0009】
<文字表記>
文中で下付き文字と一緒に使用する記号「
e
」(上付き文字e)、及び「

」(上付き文字r)は、本来直後の下付文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該下付文字の直後に記載する。数式中においてはこれらの記号は本来の位置、すなわち下付文字の真上に記述している。例えば、「S


」は数式中では次式で表される。
TIFF
2024117996000002.tif
9
5
文中で使用する記号「^」(上付きハット)は、本来直後の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直前に記載する。数式中においてはこれらの記号は本来の位置、すなわち文字の真上に記述している。例えば、「^v」は数式中では次式で表される。
TIFF
2024117996000003.tif
9
5
以下、図を用いて本開示の実施形態について詳細に説明する。また、以下、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【0010】
[応答文生成装置]
本開示の実施形態に係る応答文生成装置1は、図1に示すように、応答選択部10と、応答変換部20とを有する。応答変換部20はニューラルネットワークであり、エンコーダ21と、意味差分ベクトル生成部22と、デコーダ23とを有する。応答文生成装置1は、用例応答データベースD1と学習済パラメータデータベースP2とを使用するが、これらは、応答文生成装置1内に設けてもよいし、応答文生成装置1からアクセスできるのであれば、少なくとも1つを応答文生成装置1とは別に設けてもよい。応答文生成装置1は、入力された入力発話文xから、入力発話文xに対応する応答文である変換後応答文vを生成して出力する装置である。応答文生成装置1が、図2に示した処理フローを実施することにより本実施形態の応答文生成方法を行う。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
GPSロガー
4日前
個人
防災情報システム
1か月前
個人
デトろぐシステム
3日前
個人
情報処理システム
24日前
日本精機株式会社
表示装置
17日前
個人
指先受の付いたマウス。
20日前
個人
介護者指名システム
1か月前
個人
家計支援システム2
2か月前
個人
都市経営シミュレーション
9日前
コクヨ株式会社
収納ケース
2か月前
有限会社マイコム
制御盤のAI見積
1か月前
個人
支援システム及び支援方法
11日前
キヤノン株式会社
情報処理装置
1か月前
國立臺灣大學
操作補助システム
10日前
個人
生活困窮者相談業務支援システム
1か月前
エムケー精工株式会社
洗車場システム
1か月前
株式会社テクロス
情報処理装置
2日前
株式会社Haul
採用支援方法
1か月前
個人
施解錠制御システム
1か月前
中国電力株式会社
販売支援方法
1か月前
個人
すべて大吉となるおみくじ制作装置
16日前
株式会社野村総合研究所
検証装置
2日前
株式会社美好屋商店
広告システム
9日前
株式会社にしがき
会員権システム
1か月前
個人
災害情報表示システム
1か月前
株式会社Asuka
本人認証方法
1か月前
株式会社アジラ
行動推定システム
2か月前
トヨタ自動車株式会社
表認識方法
1か月前
株式会社JVCケンウッド
処理装置
1か月前
個人
人流データ取得システム
1か月前
株式会社mov
情報処理装置
1か月前
トヨタ自動車株式会社
図面表示装置
2か月前
日本信号株式会社
料金精算システム
16日前
トヨタ自動車株式会社
画像処理装置
1か月前
個人
マイナンバーポイントの直販システム
5日前
トヨタ自動車株式会社
画像処理装置
1か月前
続きを見る