TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025073547
公報種別公開特許公報(A)
公開日2025-05-13
出願番号2023184451
出願日2023-10-27
発明の名称翻訳装置、翻訳学習装置、翻訳方法、翻訳学習方法及びプログラム
出願人日本電信電話株式会社,国立大学法人 東京大学
代理人弁理士法人ITOH,個人,個人,個人
主分類G06F 40/44 20200101AFI20250502BHJP(計算;計数)
要約【課題】構文的に多様な翻訳を生成する新たな方法を提供すること。
【解決手段】翻訳装置は、原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成するように構成されている翻訳部を有する。
【選択図】図2
特許請求の範囲【請求項1】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成するように構成されている翻訳部
を有することを特徴とする翻訳装置。
続きを表示(約 990 文字)【請求項2】
前記翻訳部は、入力文と構成要素タグを含む接頭辞とを前記翻訳モデルに入力することで、前記接頭辞を制約とする構文木を前記翻訳モデルに出力させるように構成されている、
ことを特徴とする請求項1記載の翻訳装置。
【請求項3】
前記翻訳モデルは、出力文の先頭からの一部を構成する複数種類のトークン系列をビーム探索によって生成し、それぞれの前記トークン系列を接頭辞としてビーム探索することで前記構文木を生成するように構成されている、
ことを特徴とする請求項1記載の翻訳装置。
【請求項4】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで、入力文に対応する目的言語文の構文木を出力する翻訳モデルを生成するように構成されている多言語モデルファインチューニング部、
を有することを特徴とする翻訳学習装置。
【請求項5】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成する翻訳手順
をコンピュータが実行することを特徴とする翻訳方法。
【請求項6】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで、入力文に対応する目的言語文の構文木を出力する翻訳モデルを生成する多言語モデルファインチューニング手順、
をコンピュータが実行することを特徴とする翻訳学習方法。
【請求項7】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成する翻訳手順
をコンピュータに実行させることを特徴とするプログラム。
【請求項8】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで、入力文に対応する目的言語文の構文木を出力する翻訳モデルを生成する多言語モデルファインチューニング手順、
をコンピュータに実行させることを特徴とするプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、翻訳装置、翻訳学習装置、翻訳方法、翻訳学習方法及びプログラムに関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
近年の深層学習の進歩により、ニューラル機械翻訳(Neural Machine Translation,NMT)の精度は飛躍的に向上した。しかし、従来のNMTの手法は、多様な翻訳を生成する能力に欠けている。
【0003】
一般的に用いられるビームサーチ(beam search)は、NMTモデルから異なる翻訳候補を生成することができるが、多くの場合、出力文に小さな語彙的な変化をもたらすだけで、出力文の構文構造を大きく変化させることはできない。
【0004】
多様な翻訳を生成するアプローチの一例として、diverse beam search(DBS)(非特許文献1)がある。DBSは、ビームをグループに分け、グループごとにビームサーチを行うことでビームサーチを拡張する。前のグループで既に訪問されたノードにはペナルティが割り当てられ、多様な出力を奨励する。DBSは出力文の語彙的多様性を高めるが、構文的多様性への効果は限定的である。
【0005】
構文的に多様な翻訳を生成するために、文の構造を符号化する離散的な構文コード(syntactic code)を使用する方法が提案されている(非特許文献2)。この方法では、TreeLSTMに基づく自己符号化器(auto-encoder)を使って、文の構文木から埋め込みベクトルを作成し、これを離散化して構文コードとする。
【0006】
対訳データの目的言語側の文の文頭に構文コードを接頭辞として与えることで、与えられた構文コードを条件として文を生成するようにNMTモデルを訓練することができる。前置する構文コードをサンプリングすることで、ランダム化された構文コードにより構文的に多様な訳文を生成することができる。
【0007】
このアプローチの欠点は、出力構文を明示的に制御することができないことである。構文コードと文構造の間には一対一の対応関係がないため、望ましい構文構造を持つ文を出力することは保証されない。
【先行技術文献】
【非特許文献】
【0008】
Ashwin K Vijayakumar, Michael Cogswell, Ramprasath R. Selvaraju, Qing Sun, Stefan Lee, avid Crandall, and Dhruv Batra、"Diverse beam search for improved description of complex scenes"、In AAAI, 2018
Raphael Shu, Hideki Nakayama, and Kyunghyun Cho、"Generating diverse translations with sentence codes"、In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 1823-1827, Florence, Italy, July 2019. Association for Computational Linguistics
【発明の概要】
【発明が解決しようとする課題】
【0009】
上記したように、機械翻訳が多様な文を出力するようにするための従来法は、diverse beam search(DBS)と構文コード(syntactic code)である。DBSは、同じ単語または単語列を出力することに対するペナルティがあるので、出力文の語彙を多様にする効果はある。しかし、出力文の構文、すなわち語順を多様にする効果はあまりないという問題がある。
【0010】
構文コードは、構文木に基づいているので、出力文の構文を多様にする効果がある。しかし、構文コードは構文木から埋め込みベクトルを作成し、それをさらに離散化したものなので、構文コードと構文構造の間の対応関係は不明である。そのため出力文が望ましい構文構造を持つように外部から制御する方法がないという問題がある。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

日本電信電話株式会社
算出装置、算出システム、算出方法、及びプログラム
1日前
個人
物品給付年金
1日前
個人
非正規コート
1か月前
個人
RFタグ読取装置
14日前
個人
人物再現システム
29日前
個人
在宅介護システム
14日前
個人
AI飲食最適化プラグイン
22日前
キヤノン株式会社
通信装置
2日前
有限会社ノア
データ読取装置
1か月前
個人
電話管理システム及び管理方法
23日前
株式会社ザメディア
出席管理システム
1か月前
個人
広告提供システムおよびその方法
1か月前
株式会社CROSLAN
支援装置
14日前
個人
日誌作成支援システム
29日前
トヨタ自動車株式会社
工程計画装置
1か月前
個人
ポイント還元付き配送システム
1か月前
トヨタ自動車株式会社
作業判定方法
1か月前
長屋印刷株式会社
画像形成システム
14日前
ミサワホーム株式会社
情報処理装置
1か月前
ひびきの電子株式会社
認証システム
16日前
ミサワホーム株式会社
情報処理装置
1日前
株式会社タクテック
商品取出集品システム
1か月前
株式会社ユピテル
電子機器及びプログラム等
4日前
オムロン株式会社
回転装置及びマウス
18日前
オベック実業株式会社
接続構造
29日前
株式会社村田製作所
動き検知装置
1か月前
トヨタ自動車株式会社
情報処理システム
1か月前
トヨタ自動車株式会社
情報処理装置
今日
株式会社ドクター中松創研
生成AIの適切使用法
29日前
株式会社実身美
ワーキングシェアリングシステム
1か月前
個人
コンテンツ配信システム
1か月前
個人
アルバム作成システム及びアルバム作成方法
16日前
トヨタ自動車株式会社
情報処理方法
1か月前
株式会社デンソー
電子制御装置
2日前
個人
プラットフォームシステム
1か月前
株式会社デンソー
電子制御装置
8日前
続きを見る