特許ウォッチ

公開番号2025073547
公報種別公開特許公報(A)
公開日2025-05-13
出願番号2023184451
出願日2023-10-27
発明の名称翻訳装置、翻訳学習装置、翻訳方法、翻訳学習方法及びプログラム
出願人日本電信電話株式会社,国立大学法人東京大学
代理人弁理士法人ITOH,個人,個人,個人
主分類G06F 40/44 20200101AFI20250502BHJP(計算;計数)
要約【課題】構文的に多様な翻訳を生成する新たな方法を提供すること。
【解決手段】翻訳装置は、原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成するように構成されている翻訳部を有する。
【選択図】図2
特許請求の範囲【請求項１】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成するように構成されている翻訳部
を有することを特徴とする翻訳装置。
続きを表示（約 990 文字）【請求項２】
前記翻訳部は、入力文と構成要素タグを含む接頭辞とを前記翻訳モデルに入力することで、前記接頭辞を制約とする構文木を前記翻訳モデルに出力させるように構成されている、
ことを特徴とする請求項１記載の翻訳装置。
【請求項３】
前記翻訳モデルは、出力文の先頭からの一部を構成する複数種類のトークン系列をビーム探索によって生成し、それぞれの前記トークン系列を接頭辞としてビーム探索することで前記構文木を生成するように構成されている、
ことを特徴とする請求項１記載の翻訳装置。
【請求項４】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで、入力文に対応する目的言語文の構文木を出力する翻訳モデルを生成するように構成されている多言語モデルファインチューニング部、
を有することを特徴とする翻訳学習装置。
【請求項５】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成する翻訳手順
をコンピュータが実行することを特徴とする翻訳方法。
【請求項６】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで、入力文に対応する目的言語文の構文木を出力する翻訳モデルを生成する多言語モデルファインチューニング手順、
をコンピュータが実行することを特徴とする翻訳学習方法。
【請求項７】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで生成された翻訳モデルに入力文を入力することで、前記入力文に対する構文木を生成する翻訳手順
をコンピュータに実行させることを特徴とするプログラム。
【請求項８】
原言語文と目的言語文の構文木との対を訓練データとして訓練済み多言語モデルをファインチューンすることで、入力文に対応する目的言語文の構文木を出力する翻訳モデルを生成する多言語モデルファインチューニング手順、
をコンピュータに実行させることを特徴とするプログラム。

発明の詳細な説明【技術分野】
【０００１】
本発明は、翻訳装置、翻訳学習装置、翻訳方法、翻訳学習方法及びプログラムに関する。
続きを表示（約 1,800 文字）【背景技術】
【０００２】
近年の深層学習の進歩により、ニューラル機械翻訳（Neural Machine Translation，ＮＭＴ）の精度は飛躍的に向上した。しかし、従来のＮＭＴの手法は、多様な翻訳を生成する能力に欠けている。
【０００３】
一般的に用いられるビームサーチ（beam search）は、ＮＭＴモデルから異なる翻訳候補を生成することができるが、多くの場合、出力文に小さな語彙的な変化をもたらすだけで、出力文の構文構造を大きく変化させることはできない。
【０００４】
多様な翻訳を生成するアプローチの一例として、diverse beam search（ＤＢＳ）（非特許文献１）がある。ＤＢＳは、ビームをグループに分け、グループごとにビームサーチを行うことでビームサーチを拡張する。前のグループで既に訪問されたノードにはペナルティが割り当てられ、多様な出力を奨励する。ＤＢＳは出力文の語彙的多様性を高めるが、構文的多様性への効果は限定的である。
【０００５】
構文的に多様な翻訳を生成するために、文の構造を符号化する離散的な構文コード（syntactic code）を使用する方法が提案されている（非特許文献２）。この方法では、TreeLSTMに基づく自己符号化器（auto-encoder）を使って、文の構文木から埋め込みベクトルを作成し、これを離散化して構文コードとする。
【０００６】
対訳データの目的言語側の文の文頭に構文コードを接頭辞として与えることで、与えられた構文コードを条件として文を生成するようにＮＭＴモデルを訓練することができる。前置する構文コードをサンプリングすることで、ランダム化された構文コードにより構文的に多様な訳文を生成することができる。
【０００７】
このアプローチの欠点は、出力構文を明示的に制御することができないことである。構文コードと文構造の間には一対一の対応関係がないため、望ましい構文構造を持つ文を出力することは保証されない。
【先行技術文献】
【非特許文献】
【０００８】
Ashwin K Vijayakumar, Michael Cogswell, Ramprasath R. Selvaraju, Qing Sun, Stefan Lee, avid Crandall, and Dhruv Batra、"Diverse beam search for improved description of complex scenes"、In AAAI, 2018
Raphael Shu, Hideki Nakayama, and Kyunghyun Cho、"Generating diverse translations with sentence codes"、In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 1823-1827, Florence, Italy, July 2019. Association for Computational Linguistics
【発明の概要】
【発明が解決しようとする課題】
【０００９】
上記したように、機械翻訳が多様な文を出力するようにするための従来法は、diverse beam search（ＤＢＳ）と構文コード（syntactic code）である。ＤＢＳは、同じ単語または単語列を出力することに対するペナルティがあるので、出力文の語彙を多様にする効果はある。しかし、出力文の構文、すなわち語順を多様にする効果はあまりないという問題がある。
【００１０】
構文コードは、構文木に基づいているので、出力文の構文を多様にする効果がある。しかし、構文コードは構文木から埋め込みベクトルを作成し、それをさらに離散化したものなので、構文コードと構文構造の間の対応関係は不明である。そのため出力文が望ましい構文構造を持つように外部から制御する方法がないという問題がある。
（【００１１】以降は省略されています）

関連特許