発明の詳細な説明【技術分野】 【0001】 本発明は、翻訳装置、翻訳学習装置、翻訳方法、翻訳学習方法及びプログラムに関する。 続きを表示(約 1,800 文字)【背景技術】 【0002】 近年の深層学習の進歩により、ニューラル機械翻訳(Neural Machine Translation,NMT)の精度は飛躍的に向上した。しかし、従来のNMTの手法は、多様な翻訳を生成する能力に欠けている。 【0003】 一般的に用いられるビームサーチ(beam search)は、NMTモデルから異なる翻訳候補を生成することができるが、多くの場合、出力文に小さな語彙的な変化をもたらすだけで、出力文の構文構造を大きく変化させることはできない。 【0004】 多様な翻訳を生成するアプローチの一例として、diverse beam search(DBS)(非特許文献1)がある。DBSは、ビームをグループに分け、グループごとにビームサーチを行うことでビームサーチを拡張する。前のグループで既に訪問されたノードにはペナルティが割り当てられ、多様な出力を奨励する。DBSは出力文の語彙的多様性を高めるが、構文的多様性への効果は限定的である。 【0005】 構文的に多様な翻訳を生成するために、文の構造を符号化する離散的な構文コード(syntactic code)を使用する方法が提案されている(非特許文献2)。この方法では、TreeLSTMに基づく自己符号化器(auto-encoder)を使って、文の構文木から埋め込みベクトルを作成し、これを離散化して構文コードとする。 【0006】 対訳データの目的言語側の文の文頭に構文コードを接頭辞として与えることで、与えられた構文コードを条件として文を生成するようにNMTモデルを訓練することができる。前置する構文コードをサンプリングすることで、ランダム化された構文コードにより構文的に多様な訳文を生成することができる。 【0007】 このアプローチの欠点は、出力構文を明示的に制御することができないことである。構文コードと文構造の間には一対一の対応関係がないため、望ましい構文構造を持つ文を出力することは保証されない。 【先行技術文献】 【非特許文献】 【0008】 Ashwin K Vijayakumar, Michael Cogswell, Ramprasath R. Selvaraju, Qing Sun, Stefan Lee, avid Crandall, and Dhruv Batra、"Diverse beam search for improved description of complex scenes"、In AAAI, 2018 Raphael Shu, Hideki Nakayama, and Kyunghyun Cho、"Generating diverse translations with sentence codes"、In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 1823-1827, Florence, Italy, July 2019. Association for Computational Linguistics 【発明の概要】 【発明が解決しようとする課題】 【0009】 上記したように、機械翻訳が多様な文を出力するようにするための従来法は、diverse beam search(DBS)と構文コード(syntactic code)である。DBSは、同じ単語または単語列を出力することに対するペナルティがあるので、出力文の語彙を多様にする効果はある。しかし、出力文の構文、すなわち語順を多様にする効果はあまりないという問題がある。 【0010】 構文コードは、構文木に基づいているので、出力文の構文を多様にする効果がある。しかし、構文コードは構文木から埋め込みベクトルを作成し、それをさらに離散化したものなので、構文コードと構文構造の間の対応関係は不明である。そのため出力文が望ましい構文構造を持つように外部から制御する方法がないという問題がある。 (【0011】以降は省略されています) この特許をJ-PlatPatで参照する