TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025120010
公報種別公開特許公報(A)
公開日2025-08-15
出願番号2024015195
出願日2024-02-02
発明の名称推論装置、推論方法、及びプログラム
出願人NTT株式会社,国立大学法人 筑波大学
代理人弁理士法人ITOH,個人,個人,個人
主分類G06F 40/40 20200101AFI20250807BHJP(計算;計数)
要約【課題】翻訳メモリとして対訳データを用いることなく、原言語入力文と、当該原言語入力文に類似する目的言語文とを用いた翻訳を行う。
【解決手段】推論装置において、原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索部と、前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論部と、前記複数の出力候補文に対するリランキングを行うリランキング部とを備える。
【選択図】図4
特許請求の範囲【請求項1】
原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索部と、
前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論部と、
前記複数の出力候補文に対するリランキングを行うリランキング部と
を備える推論装置。
続きを表示(約 490 文字)【請求項2】
前記リランキング部は、出力候補文の対数尤度を当該出力候補文の長さで正規化したスコアを用いてリランキングを行う
請求項1に記載の推論装置。
【請求項3】
前記リランキング部は、出力候補文の対数尤度と、当該出力候補文と前記原言語入力文との間の類似度とを有するスコアを用いてリランキングを行う
請求項1に記載の推論装置。
【請求項4】
推論装置が実行する推論方法であって、
原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索ステップと、
前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論ステップと、
前記複数の出力候補文に対するリランキングを行うリランキングステップと
を備える推論方法。
【請求項5】
コンピュータを、請求項1ないし3のうちいずれか1項に記載の推論装置における各部として機能させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、ニューラルネットワークを用いて機械翻訳を行う技術に関連するものである。
続きを表示(約 1,900 文字)【背景技術】
【0002】
高品質な対訳データの集合である翻訳メモリ(translation memory)を利用したニューラル機械翻訳に関する従来技術として、例えば非特許文献1、2に開示された技術がある。
【0003】
非特許文献1、2に開示された技術では、入力文と、翻訳メモリ中の原言語文との間の類似度に基づいて、入力文に類似する原言語文と対になる目的言語文を抽出し、当該目的言語文と入力文とを連結して翻訳モデルへの入力としている。このような処理により、ニューラル機械翻訳のアーキテクチャを変更することなく翻訳精度を向上させることができる。
【先行技術文献】
【非特許文献】
【0004】
Bram Bulte and Arda Tezcan. Neural fuzzy repair: Integrating fuzzy matches into neural machine translation. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 1800-1809, Florence, Italy, July 2019. Association for Computational Linguistics.
Nabil Hossain, Marjan Ghazvininejad, and Luke Zettlemoyer. Simple and effective retrieve-edit-rerank text generation. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pp. 2532-2538, Online, July 2020. Association for Computational Linguistics.
【発明の概要】
【発明が解決しようとする課題】
【0005】
言語対あるいは翻訳対象領域によっては、十分な量の対訳データが存在しない場合がある。翻訳メモリとして十分な量の対訳データが存在しない場合、非特許文献1、2に開示された手法を適用することができない。
【0006】
本発明は上記の点に鑑みてなされたものであり、翻訳メモリとして対訳データを用いることなく、原言語入力文と、当該原言語入力文に類似する目的言語文とを用いた翻訳を行うための技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
開示の技術によれば、原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索部と、
前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論部と、
前記複数の出力候補文に対するリランキングを行うリランキング部と
を備える推論装置が提供される。
【発明の効果】
【0008】
開示の技術によれば、翻訳メモリとして対訳データを用いることなく、原言語入力文と、当該原言語入力文に類似する目的言語文とを用いた翻訳を行うことが可能となる。
【図面の簡単な説明】
【0009】
入力文と目的言語文の対を翻訳モデルへ入力する様子を示す図である。
訓練装置100の構成例を示す図である。
訓練装置100の動作例を説明するためのフローチャートである。
推論装置200の構成例を示す図である。
推論装置200の動作例を説明するためのフローチャートである。
推論処理の流れを示す図である。
実験で用いた訓練文、開発文、テスト文、及び、翻訳メモリ(目的言語文)それぞれについての文数を示す図である。
類似訳文検索法とリランキング法の違いによる翻訳精度の比較を示す図である。
装置のハードウェア構成例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

NTT株式会社
光デバイス
19日前
NTT株式会社
圧力センサ
12日前
NTT株式会社
信号送信装置
20日前
NTT株式会社
光信号処理装置
21日前
NTT株式会社
推定装置及び推定方法
5日前
NTT株式会社
解析装置および解析方法
11日前
NTT株式会社
通信システム、及び通信方法
28日前
NTT株式会社
音声抽出装置及び音声抽出方法
1か月前
NTT株式会社
秘匿計算システム及び秘匿計算方法
19日前
NTT株式会社
検索装置、検索方法及びプログラム
19日前
NTT株式会社
映像処理装置、方法及びプログラム
1日前
NTT株式会社
交通量推定装置及び交通量推定方法
5日前
NTT株式会社
秘匿計算システム及び秘匿計算方法
19日前
NTT株式会社
イオン伝送装置、及びイオン伝送方法
21日前
NTT株式会社
光ファイバの群遅延時間測定システム
11日前
NTT株式会社
情報処理装置、方法およびプログラム
19日前
NTT株式会社
データ解析装置、方法およびプログラム
19日前
NTT株式会社
生成システム、生成装置、および生成方法
1か月前
NTT株式会社
単一光子生成装置、及び単一光子生成方法
1か月前
NTT株式会社
情報処理装置、情報処理方法及びプログラム
1か月前
NTT株式会社
周期検出装置、周期検出方法及びプログラム
1か月前
NTT株式会社
推論装置、学習装置、推論方法、及びプログラム
11日前
NTT株式会社
組合せ最適化方法、組合せ最適化装置、及びプログラム
1日前
NTT株式会社
通信品質予測装置、通信品質予測方法、及びプログラム
4日前
NTT株式会社
基地局及び端末
1か月前
NTT株式会社
生成装置、再生システム、生成方法、再生方法、およびプログラム
12日前
NTT株式会社
音響信号出力装置
1か月前
NTT株式会社
施工計画立案装置、施工計画立案方法、及び施工計画立案プログラム
5日前
NTT株式会社
光伝送システムの異常個所絞り込み装置、および、異常個所絞り込み方法
29日前
NTT株式会社
制御装置、及びプログラム
19日前
NTT株式会社
装置、方法及びプログラム
1か月前
NTT株式会社
光伝送システムにおける伝送品質劣化判定装置、および、伝送品質劣化判定方法
29日前
NTT株式会社
無線通信システム、特徴量推定装置、無線通信方法、および無線通信用プログラム
29日前
NTT株式会社
サーバ内データ転送装置、サーバ内データ転送方法およびプログラム
19日前
NTT株式会社
アクセラレータ状態制御装置、アクセラレータ状態制御方法およびプログラム
11日前
NTT株式会社
脂質膜巨大ベシクル、脂質膜巨大ベシクルの製造方法、脂質膜巨大ベシクル内部に含まれる標的生体分子の検出方法、バイオセンサー
20日前
続きを見る