TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025073547
公報種別公開特許公報(A)
公開日2025-05-13
出願番号2023184451
出願日2023-10-27
発明の名称翻訳装置、翻訳学習装置、翻訳方法、翻訳学習方法及びプログラム
出願人日本電信電話株式会社,国立大学法人 東京大学
代理人弁理士法人ITOH,個人,個人,個人
主分類G06F 40/44 20200101AFI20250502BHJP(計算;計数)
要約【課題】構文的に多様な翻訳を生成する新たな方法を提供すること。
【解決手段】翻訳装置は、原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成するように構成されている翻訳部を有する。
【選択図】図2
特許請求の範囲【請求項1】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成するように構成されている翻訳部
を有することを特徴とする翻訳装置。
続きを表示(約 990 文字)【請求項2】
前記翻訳部は、入力文と構成要素タグを含む接頭辞とを前記翻訳モデルに入力することで、前記接頭辞を制約とする構文木を前記翻訳モデルに出力させるように構成されている、
ことを特徴とする請求項1記載の翻訳装置。
【請求項3】
前記翻訳モデルは、出力文の先頭からの一部を構成する複数種類のトークン系列をビーム探索によって生成し、それぞれの前記トークン系列を接頭辞としてビーム探索することで前記構文木を生成するように構成されている、
ことを特徴とする請求項1記載の翻訳装置。
【請求項4】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで、入力文に対応する目的言語文の構文木を出力する翻訳モデルを生成するように構成されている多言語モデルファインチューニング部、
を有することを特徴とする翻訳学習装置。
【請求項5】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成する翻訳手順
をコンピュータが実行することを特徴とする翻訳方法。
【請求項6】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで、入力文に対応する目的言語文の構文木を出力する翻訳モデルを生成する多言語モデルファインチューニング手順、
をコンピュータが実行することを特徴とする翻訳学習方法。
【請求項7】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成する翻訳手順
をコンピュータに実行させることを特徴とするプログラム。
【請求項8】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで、入力文に対応する目的言語文の構文木を出力する翻訳モデルを生成する多言語モデルファインチューニング手順、
をコンピュータに実行させることを特徴とするプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、翻訳装置、翻訳学習装置、翻訳方法、翻訳学習方法及びプログラムに関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
近年の深層学習の進歩により、ニューラル機械翻訳(Neural Machine Translation,NMT)の精度は飛躍的に向上した。しかし、従来のNMTの手法は、多様な翻訳を生成する能力に欠けている。
【0003】
一般的に用いられるビームサーチ(beam search)は、NMTモデルから異なる翻訳候補を生成することができるが、多くの場合、出力文に小さな語彙的な変化をもたらすだけで、出力文の構文構造を大きく変化させることはできない。
【0004】
多様な翻訳を生成するアプローチの一例として、diverse beam search(DBS)(非特許文献1)がある。DBSは、ビームをグループに分け、グループごとにビームサーチを行うことでビームサーチを拡張する。前のグループで既に訪問されたノードにはペナルティが割り当てられ、多様な出力を奨励する。DBSは出力文の語彙的多様性を高めるが、構文的多様性への効果は限定的である。
【0005】
構文的に多様な翻訳を生成するために、文の構造を符号化する離散的な構文コード(syntactic code)を使用する方法が提案されている(非特許文献2)。この方法では、TreeLSTMに基づく自己符号化器(auto-encoder)を使って、文の構文木から埋め込みベクトルを作成し、これを離散化して構文コードとする。
【0006】
対訳データの目的言語側の文の文頭に構文コードを接頭辞として与えることで、与えられた構文コードを条件として文を生成するようにNMTモデルを訓練することができる。前置する構文コードをサンプリングすることで、ランダム化された構文コードにより構文的に多様な訳文を生成することができる。
【0007】
このアプローチの欠点は、出力構文を明示的に制御することができないことである。構文コードと文構造の間には一対一の対応関係がないため、望ましい構文構造を持つ文を出力することは保証されない。
【先行技術文献】
【非特許文献】
【0008】
Ashwin K Vijayakumar, Michael Cogswell, Ramprasath R. Selvaraju, Qing Sun, Stefan Lee, avid Crandall, and Dhruv Batra、"Diverse beam search for improved description of complex scenes"、In AAAI, 2018
Raphael Shu, Hideki Nakayama, and Kyunghyun Cho、"Generating diverse translations with sentence codes"、In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 1823-1827, Florence, Italy, July 2019. Association for Computational Linguistics
【発明の概要】
【発明が解決しようとする課題】
【0009】
上記したように、機械翻訳が多様な文を出力するようにするための従来法は、diverse beam search(DBS)と構文コード(syntactic code)である。DBSは、同じ単語または単語列を出力することに対するペナルティがあるので、出力文の語彙を多様にする効果はある。しかし、出力文の構文、すなわち語順を多様にする効果はあまりないという問題がある。
【0010】
構文コードは、構文木に基づいているので、出力文の構文を多様にする効果がある。しかし、構文コードは構文木から埋め込みベクトルを作成し、それをさらに離散化したものなので、構文コードと構文構造の間の対応関係は不明である。そのため出力文が望ましい構文構造を持つように外部から制御する方法がないという問題がある。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

西日本電信電話株式会社
分析装置
8日前
西日本電信電話株式会社
評価装置
8日前
西日本電信電話株式会社
路線分析装置
8日前
日本電信電話株式会社
三次元形状計測方法
3日前
日本電信電話株式会社
階段型数モードファイバ及び光伝送システム
10日前
富士通株式会社
リソース管理装置、リソース管理方法およびリソース管理プログラム
6日前
個人
政治のAI化
16日前
個人
非正規コート
1か月前
個人
物品給付年金
21日前
個人
RFタグ読取装置
1か月前
個人
在宅介護システム
1か月前
個人
人物再現システム
1か月前
個人
プラグインホームページ
7日前
個人
AI飲食最適化プラグイン
1か月前
キヤノン株式会社
通信装置
22日前
有限会社ノア
データ読取装置
1か月前
個人
電話管理システム及び管理方法
1か月前
キヤノン株式会社
画像処理装置
14日前
個人
全アルゴリズム対応型プログラム
17日前
個人
広告提供システムおよびその方法
1か月前
株式会社CROSLAN
支援装置
1か月前
大同特殊鋼株式会社
輝線検出方法
16日前
シャープ株式会社
電子機器
16日前
個人
日誌作成支援システム
1か月前
トヨタ自動車株式会社
欠け検査装置
16日前
長屋印刷株式会社
画像形成システム
1か月前
パテントフレア株式会社
交差型バーコード
9日前
ひびきの電子株式会社
認証システム
1か月前
ミサワホーム株式会社
情報処理装置
1か月前
個人
ポイント還元付き配送システム
1か月前
ミサワホーム株式会社
情報処理装置
21日前
ミサワホーム株式会社
宅配ロッカー
13日前
株式会社アジラ
データ転送システム
16日前
株式会社タクテック
商品取出集品システム
1か月前
株式会社ユピテル
電子機器及びプログラム等
24日前
応研株式会社
業務支援システム
7日前
続きを見る