TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024070313
公報種別公開特許公報(A)
公開日2024-05-23
出願番号2022180708
出願日2022-11-11
発明の名称対話システム、発話生成方法、およびプログラム
出願人日本電信電話株式会社,トヨタ自動車株式会社
代理人個人,個人,個人
主分類G10L 15/22 20060101AFI20240516BHJP(楽器;音響)
要約【課題】視認可能な対象が時々刻々と入れ替わっていく状況においても、ユーザとの雑談対話を好適に行うための発話を生成する。
【解決手段】対話システム300は、移動体と共に移動しているユーザによる発話であるユーザ発話に対する発話であるシステム発話を生成する対話システムであって、ユーザ発話を取得するユーザ発話取得部310と、移動体から撮影した画像である周囲画像を取得する周囲画像取得部320と、ユーザと対話システムによる対話の直前の文脈に基づく発話である文脈発話候補を生成する文脈発話候補生成部340と、ユーザと対話システムによる対話の直前の文脈に基づかずに周囲画像の内容に基づく発話である印象発話候補を生成する印象発話候補生成部350と、予め定めた規則に従って、文脈発話候補と印象発話候補の何れかをシステム発話として選択するシステム発話決定部360と、を有する。
【選択図】図1
特許請求の範囲【請求項1】
移動体と共に移動しているユーザによる発話であるユーザ発話に対する発話であるシステム発話を生成する対話システムであって、
前記ユーザ発話を取得するユーザ発話取得部と、
前記移動体から撮影した画像である周囲画像を取得する周囲画像取得部と、
前記ユーザと前記対話システムによる対話の直前の文脈に基づく発話である文脈発話候補を生成する文脈発話候補生成部と、
前記ユーザと前記対話システムによる対話の直前の文脈に基づかずに前記周囲画像の内容に基づく発話である印象発話候補を生成する印象発話候補生成部と、
予め定めた規則に従って、前記文脈発話候補と前記印象発話候補の何れかを前記システム発話として選択するシステム発話決定部と、
を有する対話システム。
続きを表示(約 2,700 文字)【請求項2】
請求項1に記載の対話システムであって、
前記印象発話候補生成部は、所定の時間間隔の各前記周囲画像に基づいて前記印象発話候補を生成し、
前記文脈発話候補生成部は、前記ユーザ発話取得部で前記ユーザ発話が取得されたのを契機に前記文脈発話候補を生成する、
対話システム。
【請求項3】
請求項1に記載の対話システムであって、
前記システム発話決定部は、
前記対話システムが1つ前のシステム発話を出力してから所定時間T1以内に前記ユーザ発話が行われた場合には、前記文脈発話候補を前記システム発話として選択し、
前記の場合以外である場合には、前記印象発話候補を前記システム発話として選択する、
対話システム。
【請求項4】
請求項1に記載の対話システムであって、
前記印象発話候補生成部は、前記印象発話候補の話題としての強さを表す指標値である話題強度の推定も行い、
前記システム発話決定部は、前記話題強度が所定の閾値より大きいか以上である場合には前記印象発話候補をシステム発話として選択し、前記の場合以外である場合には前記文脈発話候補をシステム発話として選択する、
対話システム。
【請求項5】
請求項1に記載の対話システムであって、
前記文脈発話候補生成部は、前記文脈発話候補の対話の継続性の指標値である話題継続度の推定も行い、
前記印象発話候補生成部は、前記印象発話候補の話題としての強さを表す指標値である話題強度の推定も行い、
前記システム発話決定部は、前記話題継続度が大きいほど前記文脈発話候補が前記システム発話として選択される優先度が高く、かつ、前記話題強度が大きいほど前記印象発話候補が前記システム発話として選択される優先度が高い、という選択基準に従って、前記文脈発話候補と前記印象発話候補の何れかを前記システム発話として選択する、
対話システム。
【請求項6】
請求項1に記載の対話システムであって、
前記文脈発話候補生成部は、前記文脈発話候補の対話の継続性の指標値である話題継続度の推定も行い、
前記印象発話候補生成部は、前記印象発話候補の話題としての強さを表す指標値である話題強度の推定も行い、
前記システム発話決定部は、
前記話題継続度が小さいほど値が大きくかつ前記話題強度が大きいほど値が大きい第1指標値が所定の第1閾値より大きい場合には、前記印象発話候補を前記システム発話として選択し、前記第1指標値が前記第1閾値より小さい場合には、前記文脈発話候補を前記システム発話として選択する、
または、
前記話題継続度が大きいほど値が大きくかつ前記話題強度が小さいほど値が大きい第2指標値が所定の第2閾値より大きい場合には、前記文脈発話候補を前記システム発話として選択し、前記第2指標値が前記第2閾値より小さい場合には、前記印象発話候補を前記システム発話として選択する、
対話システム。
【請求項7】
請求項1に記載の対話システムであって、
前記文脈発話候補生成部は、前記文脈発話候補の対話の継続性の指標値である話題継続度の推定も行い、
前記印象発話候補生成部は、前記印象発話候補の話題としての強さを表す指標値である話題強度の推定も行い、
前記システム発話決定部は、
前記話題継続度が小さいほど値が大きくかつ前記話題強度が大きいほど値が大きい第1指標値が大きいほど前記印象発話候補が前記システム発話として選択される確率が高く、前記第1指標値が小さいほど前記文脈発話候補が前記システム発話として選択される確率が高い、重み付きランダムサンプリングによって、前記文脈発話候補と前記印象発話候補の何れかを前記システム発話として選択する、
または、
前記話題継続度が大きいほど値が大きくかつ前記話題強度が小さいほど値が大きい第2指標値が大きいほど前記文脈発話候補が前記システム発話として選択される確率が高く、前記第2指標値が小さいほど前記印象発話候補が前記システム発話として選択される確率が高い、重み付きランダムサンプリングによって、前記文脈発話候補と前記印象発話候補の何れかを前記システム発話として選択する、
対話システム。
【請求項8】
請求項1、4、5、6、7のいずれかに記載の対話システムであって、
前記印象発話候補生成部は、話題強度推定部をさらに有し、
前記話題強度推定部には、複数個の候補連続画像と、前記候補連続画像それぞれに対応する複数個の発話テキストと、が予め記憶されており、
前記話題強度推定部は、
予め記憶された複数個の前記候補連続画像のうちの、前記周囲画像を含む連続画像である周囲連続画像と類似する候補連続画像を特定し、
特定した前記候補連続画像に対応して予め記憶された複数個の前記発話テキストのうちの、前記印象発話候補との類似度が所定の閾値より大きいか以上である発話テキストの個数、
または、
特定した前記候補連続画像に対応して予め記憶された複数個の前記発話テキストのうちの、前記印象発話候補との類似度が所定の閾値より大きいか以上である発話テキストの頻度に前記類似度が大きいほど大きな重み値を与えて加算した重み付け和、
を前記印象発話候補の話題強度として取得する、
対話システム。
【請求項9】
請求項1に記載の対話システムであって、
前記システム発話決定部は、
前記印象発話候補を選択した場合であって、前記印象発話候補が基づく前記周囲画像が取得された時刻と現在の時刻との差分が所定の閾値より大きいか以上である場合には、時間が経過したことを表す修飾表現を前記印象発話候補に付したものを前記システム発話とする、
対話システム。
【請求項10】
請求項1に記載の対話システムであって、
前記文脈発話候補生成部は、前記ユーザ発話と前記周囲画像に基づいて、または、前記周囲画像には基づかずに前記ユーザ発話に基づいて、前記文脈発話候補を生成し、
前記印象発話候補生成部は、前記ユーザ発話には基づかずに前記周囲画像に基づいて、前記印象発話候補を生成する、
対話システム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、例えば自動車などで移動している人と対話する対話システムによる発話を生成する技術に関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
特許文献1には、高齢者と好適なコミュニケーションをする雑談対話システムが記載されている。特許文献1の雑談対話システムは、高齢者であるユーザの周囲をカメラで撮影して得た画像に対して物体検知を行うことで、ユーザの周囲にある物体が何であるのかを特定して、特定した物体の情報に基づいて発話をする。
【先行技術文献】
【特許文献】
【0003】
特開2008-158697号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の対話システムでは、例えばユーザとロボットが同じ自動車に乗って移動しながら雑談対話をすることを想定したものではない。例えば、複数の人が同じ自動車に乗って移動しながら雑談対話をする場合であれば、当該複数の人が共に視認可能な物や人など(以下、「対象」という。)が時々刻々と入れ替わっていき、時々刻々と入れ替わっていく視認可能な対象に応じた発話を当該複数の人が行うことで、雑談対話が進んでいく。しかしながら、特許文献1の対話システムでは、このように視認可能な対象が時々刻々と入れ替わっていく状況でロボットが雑談対話における発話をすることは想定されていない。
【0005】
本発明は、例えばユーザが自動車などで移動していることなどにより、視認可能な対象が時々刻々と入れ替わっていく状況においても、ユーザとの雑談対話を好適に行うための発話を生成する技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
この発明の一態様による対話システムは、移動体と共に移動しているユーザによる発話であるユーザ発話に対する発話であるシステム発話を生成する対話システムであって、ユーザ発話を取得するユーザ発話取得部と、移動体から撮影した画像である周囲画像を取得する周囲画像取得部と、ユーザと対話システムによる対話の直前の文脈に基づく発話である文脈発話候補を生成する文脈発話候補生成部と、ユーザと対話システムによる対話の直前の文脈に基づかずに周囲画像の内容に基づく発話である印象発話候補を生成する印象発話候補生成部と、予め定めた規則に従って、文脈発話候補と印象発話候補の何れかをシステム発話として選択するシステム発話決定部と、を有する。
【発明の効果】
【0007】
本発明によれば、視認可能な対象が時々刻々と入れ替わっていく状況においても、ユーザとの雑談対話を好適に行うための発話を生成することができる。
【図面の簡単な説明】
【0008】
図1は、対話システムの機能構成を例示したブロック図である。
図2は、対話システムが周囲画像を取得する処理を示す流れ図である。
図3は、対話システムが行う発話生成方法の処理を示す流れ図である。
図4は、印象発話候補生成部の機能構成を例示したブロック図である。
図5は、印象発話候補生成部が行う処理を示す流れ図である。
図6は、文脈発話候補生成部の機能構成を例示したブロック図である。
図7は、文脈発話候補生成部が行う処理を示す流れ図である。
図8は、対話システム及び発話生成装置を実現するコンピュータの機能構成の一例を示す図である。
【発明を実施するための形態】
【0009】
<第1実施形態>
第1実施形態では、対話システムが発話する直前までの対話の文脈に基づく発話候補と、対話システムが発話する直前までの対話の文脈に基づかずに周囲の風景に基づく発話候補と、の2種類の発話候補の何れかを発話することで、例えばユーザが自動車などで移動していることなどにより、視認可能な対象が時々刻々と入れ替わっていく状況において、ユーザとの雑談対話を好適に行う対話システム及び当該対話システムの発話生成方法について説明する。
【0010】
[対話システム及び対話方法]
第1実施形態の対話システム300は、例えば図1に示すように、ユーザ発話取得部310、周囲画像取得部320、周囲画像記憶部330、文脈発話候補生成部340、印象発話候補生成部350、システム発話決定部360、システム発話出力部370を含む。ただし、後述するように、図1に破線で示したユーザ発話取得部310、周囲画像取得部320、システム発話出力部370が対話システム300に含まれるのは必須ではない。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
三味線の部品
19日前
株式会社大貴
吸音材の施工方法
18日前
株式会社エフノート
電子打楽器
17日前
株式会社エフノート
電子ドラム
17日前
株式会社小泉製作所
ベル装置
21日前
エイドス セラピューティクス,インコーポレイティド
AG10の製剤
3日前
エイドス セラピューティクス,インコーポレイティド
AG10を使用するTTRアミロイドーシスの治療方法
21日前
株式会社総合車両製作所
吸音パネル
17日前
ヤマハ株式会社
楽器用ナット
21日前
ヤマハ株式会社
プログラム
14日前
株式会社レゾナック
吸音材及び車両部材
今日
トヨタ自動車株式会社
情報処理装置
4日前
株式会社第一興商
カラオケ端末
24日前
株式会社イノアックコーポレーション
防音材及び車両構造
14日前
日本放送協会
音場評価装置、音場評価システム、及びプログラム
今日
株式会社第一興商
カラオケ装置、カラオケシステム
14日前
株式会社レゾナック
吸音構造体及び吸音構造体の製造方法
4日前
ローランド株式会社
鍵盤装置および駆動装置の冷却方法
24日前
沖電気工業株式会社
音声処理装置、音声処理プログラム及び音声処理方法
18日前
株式会社竹中工務店
情報処理装置及び情報処理プログラム
11日前
学校法人立命館
叫び声検知システム、音声分類方法、及び、音声分類モデルの生成方法
18日前
キヤノン株式会社
情報処理装置、情報処理方法、及びプログラム
28日前
三菱重工業株式会社
音声認識装置、音声認識方法及びプログラム
5日前
トヨタ自動車株式会社
情報処理装置、情報処理方法、及び、プログラム
4日前
日本放送協会
音声認識モデルに用いる学習データを作成する学習データ作成装置及びプログラム
21日前
株式会社アドバンスト・メディア
情報処理装置、情報処理システム、情報処理方法及びプログラム
4日前
日本電信電話株式会社
対話システム、発話生成方法、およびプログラム
1か月前
LINEヤフー株式会社
信号処理装置、信号処理方法、および信号処理プログラム
今日
株式会社デンソーテン
評価装置、評価方法、音響システムおよび評価用信号生成方法
26日前
株式会社日立ビルシステム
昇降機の保守作業結果入力システム及び昇降機の保守作業結果入力方法
11日前
岐阜プラスチック工業株式会社
吸音構造体及びその製造方法
13日前
カシオ計算機株式会社
信号処理装置、方法、及びプログラム、電子楽器
13日前
ヤマハ株式会社
鍵盤装置及び操作装置
24日前
ヤマハ株式会社
鍵盤装置及び操作装置
24日前
エーアイエムアイ インコーポレイテッド
音楽コンテンツの生成
1か月前
日立GEニュークリア・エナジー株式会社
作業支援システム、作業支援装置、および、作業支援方法
14日前
続きを見る