TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025013498
公報種別
公開特許公報(A)
公開日
2025-01-24
出願番号
2024193737,2022564967
出願日
2024-11-05,2020-11-27
発明の名称
対応装置、学習装置、対応方法、学習方法、及びプログラム
出願人
日本電信電話株式会社
代理人
弁理士法人ITOH
主分類
G06F
40/45 20200101AFI20250117BHJP(計算;計数)
要約
【課題】2つの系列情報において互いに対応している情報の対を同定する対応処理を精度良く行う。
【解決手段】対応装置において、第一言語テキストと第二言語テキストとを入力とし、前記第一言語テキストと前記第二言語テキストとの間のスパン予測問題を生成する問題生成部と、第一言語と第二言語との間のスパン予測問題とその回答からなるデータを用いて作成したスパン予測モデルを用いて、前記問題生成部により生成された前記スパン予測問題の回答となるスパンを予測するスパン予測部とを備える。
【選択図】図1
特許請求の範囲
【請求項1】
第一言語テキストと第二言語テキストとを入力とし、前記第一言語テキストと前記第二言語テキストとの間のスパン予測問題を生成する問題生成部と、
第一言語と第二言語との間のスパン予測問題とその回答からなるデータを用いて作成したスパン予測モデルを用いて、前記問題生成部により生成された前記スパン予測問題の回答となるスパンを予測するスパン予測部と
を備える対応装置。
続きを表示(約 1,100 文字)
【請求項2】
前記スパン予測モデルは、前記データを用いて事前学習済みモデルの追加学習を行うことにより得られたモデルである
請求項1に記載の対応装置。
【請求項3】
前記第一言語テキストから前記第二言語テキストへのスパン予測における第一スパンの質問により第二スパンを予測する確率と、前記第二言語テキストから前記第一言語テキストへのスパン予測における、前記第二スパンの質問により前記第一スパンを予測する確率とに基づいて、前記第一スパンのテキストと前記第二スパンのテキストとが対応するか否かを判断する対応生成部
を備える請求項1又は2に記載の対応装置。
【請求項4】
前記対応生成部は、前記第一言語テキストと前記第二言語テキストとの間のテキストの対応関係のコストの和が最小となるように、整数線形計画問題を解くことによって、前記第一言語テキストと前記第二言語テキストとの間のテキストの対応を生成する
請求項3に記載の対応装置。
【請求項5】
第一言語テキストに含まれるスパンと第二言語テキストに含まれるスパンとの対応を示す対応データから、スパン予測問題とその回答とを有するデータを生成する問題回答生成部と、
前記データを用いて、スパン予測モデルを生成する学習部と
を備える学習装置。
【請求項6】
対応装置が実行する対応方法であって、
第一言語テキストと第二言語テキストとを入力とし、前記第一言語テキストと前記第二言語テキストとの間のスパン予測問題を生成する問題生成ステップと、
第一言語と第言語との間のスパン予測問題とその回答からなるデータを用いて作成したスパン予測モデルを用いて、前記問題生成ステップにより生成された前記スパン予測問題の回答となるスパンを予測するスパン予測ステップと
を備える対応方法。
【請求項7】
学習装置が実行する学習方法であって、
第一言語テキストに含まれるスパンと第二言語テキストに含まれるスパンとの対応を示す対応データから、スパン予測問題とその回答とを有するデータを生成する問題回答生成ステップと、
前記データを用いて、スパン予測モデルを生成する学習ステップと
を備える学習方法。
【請求項8】
コンピュータを、請求項1ないし4のうちいずれか1項に記載の対応装置における各部として機能させるためのプログラム、又は、コンピュータを、請求項5に記載の学習装置における各部として機能させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、互いに対応関係にある2つの文書において互いに対応している文集合(1つ又は複数の文)の対を同定する技術に関連するものである。
続きを表示(約 1,900 文字)
【背景技術】
【0002】
互いに対応関係にある2つの文書において互いに対応している文集合の対を同定することを文対応(sentence alignment)という。文対応付けシステムは一般に、2つの文書の文同士の類似度スコアを計算する機構と、その機構で得られた文対応の候補とそのスコアから文書全体の文対応を同定する機構から構成される。
【先行技術文献】
【非特許文献】
【0003】
Brian Thompson and Philipp Koehn. Vecalign: Improved sentence alignment in linear time and space. In Proceedings of EMNLP-2019, pp. 1342-1348, 2019.
【発明の概要】
【発明が解決しようとする課題】
【0004】
文対応を行う従来技術では、文同士の類似度計算を行う際に文脈情報を用いない。更に、近年では、ニューラルネットワークによる文のベクトル表現によって類似度計算を行う方法が高い精度を達成しているが、この方法では文を一度1つのベクトル表現に変換するために単語単位の情報をうまく活用することが出来ない。そのため精度が良くないという問題がある。
【0005】
すなわち、従来技術では、互いに対応関係にある2つの文書において互いに対応している文集合の対を同定する文対応を精度良く行うことができなかった。なお、このような課題は文書に限られない系列情報においても生じ得る課題である。
【0006】
本発明は上記の点に鑑みてなされたものであり、2つの系列情報において互いに対応している情報の対を同定する対応処理を精度良く行うことを可能とする技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
開示の技術によれば、第一言語テキストと第二言語テキストとを入力とし、前記第一言語テキストと前記第二言語テキストとの間のスパン予測問題を生成する問題生成部と、
第一言語と第二言語との間のスパン予測問題とその回答からなるデータを用いて作成したスパン予測モデルを用いて、前記問題生成部により生成された前記スパン予測問題の回答となるスパンを予測するスパン予測部と
を備える対応装置が提供される。
【発明の効果】
【0008】
開示の技術によれば、2つの系列情報において互いに対応している情報の対を同定する対応処理を精度良く行うことを可能とする技術が提供される。
【図面の簡単な説明】
【0009】
実施例1における装置構成図である。
処理の全体の流れを示すフローチャートである。
言語横断スパン予測モデルを学習する処理を示すフローチャートである。
文対応の生成処理を示すフローチャートである。
装置のハードウェア構成図である。
文対応データの例を示す図である。
各データセットでの平均文数及びトークン数を示す図である。
対応関係全体でのF
1
scoreを示す図である。
対応関係中の原言語及び目的言語の文の数毎に評価した文対応付け精度を示す図である。
学習に使用する対訳文対の量を変化させた際の翻訳精度の比較結果を示す図である。
実施例2における装置構成図である。
処理の全体の流れを示すフローチャートである。
言語横断スパン予測モデルを学習する処理を示すフローチャートである。
単語対応の生成処理を示すフローチャートである。
単語対応データの例を示す図である。
英語から日本語への質問の例を示す図である。
スパン予測の例を示す図である。
単語対応の対称化の例を示す図である。
実験に使用したデータ数を示す図である。
従来技術と実施形態に係る技術との比較を示す図である。
対称化の効果を示す図である。
原言語単語の文脈の重要性を示す図である。
中英の訓練データの部分集合を用いて訓練した場合の単語対応精度を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
情報提示方法
7日前
個人
アカウントマップ
今日
個人
プログラム
6日前
個人
自動精算システム
15日前
個人
自動精算システム
1か月前
個人
RFタグ読取装置
24日前
個人
売買システム
21日前
個人
管理サーバ
1か月前
個人
市場受発注システム
13日前
個人
発想支援方法及びシステム
10日前
個人
分類処理プログラム及び方法
10日前
日本精機株式会社
車両用表示装置
23日前
日本精機株式会社
車両用表示装置
23日前
キヤノン株式会社
印刷装置
1か月前
富士通株式会社
金融システム
7日前
個人
VRによる人体各部位の立体化
1か月前
井関農機株式会社
ロボット作業車両
15日前
個人
未来型家系図構築システム
1か月前
株式会社SEKT
文字認識装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
推定装置
1か月前
トヨタ自動車株式会社
表認識装置
1か月前
株式会社プレニーズ
仲介システム
今日
トヨタ自動車株式会社
情報通知方法
13日前
トヨタ自動車株式会社
作業管理装置
13日前
個人
情報処理装置およびプログラム
1か月前
富士通株式会社
情報処理プログラム
1か月前
個人
販売支援システム
15日前
ブラザー工業株式会社
無線通信装置
13日前
トヨタ自動車株式会社
作業評価装置
1か月前
ダイハツ工業株式会社
移動支援装置
1か月前
トヨタ自動車株式会社
記号識別方法
1か月前
トヨタ自動車株式会社
画像処理装置
1か月前
村田機械株式会社
人員配置システム
10日前
トヨタ自動車株式会社
作業評価装置
22日前
トヨタ自動車株式会社
生成装置
7日前
続きを見る
他の特許を見る