TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025086163
公報種別
公開特許公報(A)
公開日
2025-06-06
出願番号
2023200043
出願日
2023-11-27
発明の名称
学習装置、文分割装置、学習方法、文分割方法、及びプログラム
出願人
日本電信電話株式会社
,
国立大学法人東海国立大学機構
代理人
弁理士法人ITOH
,
個人
,
個人
,
個人
主分類
G06F
40/289 20200101AFI20250530BHJP(計算;計数)
要約
【課題】split and rephraseの性能を向上させること。
【解決手段】本開示の一態様による学習装置は、入力文と、前記入力文と意味的に等価な複数の文で構成される第1の正解分割文との組で表される訓練データの集合を入力する入力部と、前記訓練データに含まれる第1の正解分割文に含まれる文を並び替えた第2の正解分割文を作成する作成部と、エンコーダ・デコーダモデルにより、前記入力文を複数の文に分割した分割文を作成する文分割部と、前記分割文と、前記第2の正解分割文とを用いて、前記エンコーダ・デコーダモデルのパラメータを学習する学習部と、を有する。
【選択図】図1
特許請求の範囲
【請求項1】
入力文と、前記入力文と意味的に等価な複数の文で構成される第1の正解分割文との組で表される訓練データの集合を入力する入力部と、
前記訓練データに含まれる第1の正解分割文に含まれる文を並び替えた第2の正解分割文を作成する作成部と、
エンコーダ・デコーダモデルにより、前記入力文を複数の文に分割した分割文を作成する文分割部と、
前記分割文と、前記第2の正解分割文とを用いて、前記エンコーダ・デコーダモデルのパラメータを学習する学習部と、
を有する学習装置。
続きを表示(約 970 文字)
【請求項2】
前記エンコーダ・デコーダモデルに含まれるデコーダの隠れ状態を用いて、再現器により、前記入力文を再現した再現文を作成する再現部を有し、
前記学習部は、
前記入力文と、前記再現文とを用いて、前記再現器のパラメータを更に学習する、請求項1に記載の学習装置。
【請求項3】
前記作成部は、
前記入力文と前記第2の正解分割文との間の単語系列としての類似度が、前記入力文と前記第1の正解分割文との間の単語系列としての類似度よりも低下するように、前記第2の正解分割文を作成する、請求項1又は2に記載の学習装置。
【請求項4】
分割対象の入力文を入力する入力部と、
入力文と前記入力文と意味的に等価な複数の文で構成される第1の正解分割文を並び替えた第2の正解分割文との組を訓練データとして用いて学習されたエンコーダ・デコーダモデルにより、前記分割対象の入力文を複数の文に分割した分割文を作成する文分割部と、
を有する文分割装置。
【請求項5】
入力文と、前記入力文と意味的に等価な複数の文で構成される第1の正解分割文との組で表される訓練データの集合を入力する入力手順と、
前記訓練データに含まれる第1の正解分割文に含まれる文を並び替えた第2の正解分割文を作成する作成手順と、
エンコーダ・デコーダモデルにより、前記入力文を複数の文に分割した分割文を作成する文分割手順と、
前記分割文と、前記第2の正解分割文とを用いて、前記エンコーダ・デコーダモデルのパラメータを学習する学習手順と、
をコンピュータが実行する学習方法。
【請求項6】
分割対象の入力文を入力する入力手順と、
入力文と前記入力文と意味的に等価な複数の文で構成される第1の正解分割文を並び替えた第2の正解分割文との組を訓練データとして用いて学習されたエンコーダ・デコーダモデルにより、前記分割対象の入力文を複数の文に分割した分割文を作成する文分割手順と、
をコンピュータが実行する文分割方法。
【請求項7】
コンピュータを、請求項1に記載の学習装置、又は、請求項4に記載の文分割装置、として機能させるプログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、学習装置、文分割装置、学習方法、文分割方法、及びプログラムに関する。
続きを表示(約 1,300 文字)
【背景技術】
【0002】
或る1文をそれと意味的に等価になるように複数の文に分割する技術はsplit and rephraseと呼ばれる(非特許文献1)。このような技術は、ニューラルネットワークによるエンコーダ・デコーダモデルにより実現される。
【先行技術文献】
【非特許文献】
【0003】
Shashi Narayan, Claire Gardent, Shay B. Cohen, and Anastasia Shimorina, Split and rephrase. In Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing, pages 606-616,
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、意味的に等価な複数の文に分割できる文が入力文として与えられたとしも、split and rephraseの従来手法では、その入力文が分割されないことがあった。人間が入力文を分割できるにも関わらず、その文を分割できないのはsplit and rephraseの主旨に反し問題である。
【0005】
本開示は、上記の点に鑑みてなされたもので、split and rephraseの性能を向上させることを目的とする。
【課題を解決するための手段】
【0006】
本開示の一態様による学習装置は、入力文と、前記入力文と意味的に等価な複数の文で構成される第1の正解分割文との組で表される訓練データの集合を入力する入力部と、前記訓練データに含まれる第1の正解分割文に含まれる文を並び替えた第2の正解分割文を作成する作成部と、エンコーダ・デコーダモデルにより、前記入力文を複数の文に分割した分割文を作成する文分割部と、前記分割文と、前記第2の正解分割文とを用いて、前記エンコーダ・デコーダモデルのパラメータを学習する学習部と、を有する。
【発明の効果】
【0007】
split and rephraseの性能を向上させることができる。
【図面の簡単な説明】
【0008】
提案手法の一例を説明するための図である。
本実施形態に係る文分割装置のハードウェア構成の一例を示す図である。
学習時における文分割装置の機能構成の一例を示す図である。
本実施形態に係る学習処理の一例を示すフローチャートである。
推論時における文分割装置の機能構成の一例を示す図である。
本実施形態に係る文分割処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、本発明の一実施形態について説明する。
【0010】
<split and rephraseの従来手法及びその課題>
split and rephraseとは、或る1文をそれと意味的に等価になるように複数の文に分割する技術のことである(非特許文献1)。
(【0011】以降は省略されています)
特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する
関連特許
個人
政治のAI化
19日前
個人
物品給付年金
24日前
個人
プラグインホームページ
10日前
キヤノン株式会社
通信装置
25日前
個人
全アルゴリズム対応型プログラム
20日前
キヤノン株式会社
画像処理装置
17日前
シャープ株式会社
電子機器
19日前
大同特殊鋼株式会社
輝線検出方法
19日前
パテントフレア株式会社
交差型バーコード
12日前
ミサワホーム株式会社
情報処理装置
24日前
トヨタ自動車株式会社
情報処理装置
2日前
ミサワホーム株式会社
宅配ロッカー
16日前
株式会社アジラ
データ転送システム
19日前
村田機械株式会社
割当補助システム
2日前
トヨタ自動車株式会社
欠け検査装置
19日前
応研株式会社
業務支援システム
10日前
株式会社ユピテル
電子機器及びプログラム等
27日前
オベック実業株式会社
端末用スタンド
20日前
トヨタ自動車株式会社
管理装置
16日前
Sansan株式会社
組織図生成装置
5日前
株式会社カプコン
データおよびシステム
18日前
個人
株管理システム
13日前
シャープ株式会社
通信装置
9日前
ミサワホーム株式会社
荷物搬送システム
16日前
株式会社大林組
施工管理システム
12日前
西日本電信電話株式会社
評価装置
11日前
西日本電信電話株式会社
分析装置
11日前
トヨタ自動車株式会社
情報処理装置
23日前
トヨタ自動車株式会社
部品表照合システム
18日前
トヨタ自動車株式会社
リスク評価システム
2日前
株式会社デンソーウェーブ
携帯端末
17日前
トヨタ自動車株式会社
更新システム
19日前
トヨタ自動車株式会社
作業解析装置
19日前
株式会社半導体エネルギー研究所
文書読解支援方法
18日前
株式会社日立製作所
設計支援装置
17日前
株式会社ウィンサイド
外国為替両建システム
17日前
続きを見る
他の特許を見る