TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025120010
公報種別公開特許公報(A)
公開日2025-08-15
出願番号2024015195
出願日2024-02-02
発明の名称推論装置、推論方法、及びプログラム
出願人NTT株式会社,国立大学法人 筑波大学
代理人弁理士法人ITOH,個人,個人,個人
主分類G06F 40/40 20200101AFI20250807BHJP(計算;計数)
要約【課題】翻訳メモリとして対訳データを用いることなく、原言語入力文と、当該原言語入力文に類似する目的言語文とを用いた翻訳を行う。
【解決手段】推論装置において、原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索部と、前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論部と、前記複数の出力候補文に対するリランキングを行うリランキング部とを備える。
【選択図】図4
特許請求の範囲【請求項1】
原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索部と、
前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論部と、
前記複数の出力候補文に対するリランキングを行うリランキング部と
を備える推論装置。
続きを表示(約 490 文字)【請求項2】
前記リランキング部は、出力候補文の対数尤度を当該出力候補文の長さで正規化したスコアを用いてリランキングを行う
請求項1に記載の推論装置。
【請求項3】
前記リランキング部は、出力候補文の対数尤度と、当該出力候補文と前記原言語入力文との間の類似度とを有するスコアを用いてリランキングを行う
請求項1に記載の推論装置。
【請求項4】
推論装置が実行する推論方法であって、
原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索ステップと、
前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論ステップと、
前記複数の出力候補文に対するリランキングを行うリランキングステップと
を備える推論方法。
【請求項5】
コンピュータを、請求項1ないし3のうちいずれか1項に記載の推論装置における各部として機能させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、ニューラルネットワークを用いて機械翻訳を行う技術に関連するものである。
続きを表示(約 1,900 文字)【背景技術】
【0002】
高品質な対訳データの集合である翻訳メモリ(translation memory)を利用したニューラル機械翻訳に関する従来技術として、例えば非特許文献1、2に開示された技術がある。
【0003】
非特許文献1、2に開示された技術では、入力文と、翻訳メモリ中の原言語文との間の類似度に基づいて、入力文に類似する原言語文と対になる目的言語文を抽出し、当該目的言語文と入力文とを連結して翻訳モデルへの入力としている。このような処理により、ニューラル機械翻訳のアーキテクチャを変更することなく翻訳精度を向上させることができる。
【先行技術文献】
【非特許文献】
【0004】
Bram Bulte and Arda Tezcan. Neural fuzzy repair: Integrating fuzzy matches into neural machine translation. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 1800-1809, Florence, Italy, July 2019. Association for Computational Linguistics.
Nabil Hossain, Marjan Ghazvininejad, and Luke Zettlemoyer. Simple and effective retrieve-edit-rerank text generation. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pp. 2532-2538, Online, July 2020. Association for Computational Linguistics.
【発明の概要】
【発明が解決しようとする課題】
【0005】
言語対あるいは翻訳対象領域によっては、十分な量の対訳データが存在しない場合がある。翻訳メモリとして十分な量の対訳データが存在しない場合、非特許文献1、2に開示された手法を適用することができない。
【0006】
本発明は上記の点に鑑みてなされたものであり、翻訳メモリとして対訳データを用いることなく、原言語入力文と、当該原言語入力文に類似する目的言語文とを用いた翻訳を行うための技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
開示の技術によれば、原言語入力文をクエリとした言語横断検索を行うことにより、目的言語文の集合から前記原言語入力文に類似する複数の類似訳文を抽出する検索部と、
前記原言語入力文と前記複数の類似訳文における各類似訳文とを用いて翻訳を行うことにより、複数の出力候補文を生成する推論部と、
前記複数の出力候補文に対するリランキングを行うリランキング部と
を備える推論装置が提供される。
【発明の効果】
【0008】
開示の技術によれば、翻訳メモリとして対訳データを用いることなく、原言語入力文と、当該原言語入力文に類似する目的言語文とを用いた翻訳を行うことが可能となる。
【図面の簡単な説明】
【0009】
入力文と目的言語文の対を翻訳モデルへ入力する様子を示す図である。
訓練装置100の構成例を示す図である。
訓練装置100の動作例を説明するためのフローチャートである。
推論装置200の構成例を示す図である。
推論装置200の動作例を説明するためのフローチャートである。
推論処理の流れを示す図である。
実験で用いた訓練文、開発文、テスト文、及び、翻訳メモリ(目的言語文)それぞれについての文数を示す図である。
類似訳文検索法とリランキング法の違いによる翻訳精度の比較を示す図である。
装置のハードウェア構成例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

NTT株式会社
計算装置
10日前
NTT株式会社
復号装置及び復号方法
24日前
NTT株式会社
推定装置及び推定方法
1か月前
NTT株式会社
解析装置および解析方法
1か月前
NTT株式会社
情報処理装置、及び情報処理方法
18日前
NTT株式会社
情報処理装置、及び情報処理方法
18日前
NTT株式会社
通信システム、方法及びプログラム
24日前
NTT株式会社
通信システム、方法及びプログラム
24日前
NTT株式会社
交通量推定装置及び交通量推定方法
1か月前
NTT株式会社
映像処理装置、方法及びプログラム
28日前
NTT株式会社
評価装置、評価方法およびプログラム
6日前
NTT株式会社
光ファイバの群遅延時間測定システム
1か月前
NTT株式会社
量子鍵配送システム及び量子鍵配送方法
19日前
NTT株式会社
座屈剥離構造の予測装置および予測方法
24日前
NTT株式会社
電子署名システム、方法及びプログラム
24日前
NTT株式会社
微生物の土壌中での生存性を調節する方法
19日前
NTT株式会社
測定装置、測定方法、及び、測定プログラム
20日前
NTT株式会社
推論装置、学習装置、推論方法、及びプログラム
1か月前
NTT株式会社
推定装置、復元装置、推定方法、およびプログラム
17日前
NTT株式会社
情報処理システム、情報処理装置および情報処理方法
25日前
NTT株式会社
組合せ最適化方法、組合せ最適化装置、及びプログラム
28日前
NTT株式会社
通信品質予測装置、通信品質予測方法、及びプログラム
1か月前
NTT株式会社
伝搬グラフ復元装置、伝搬グラフ復元方法、及びプログラム
24日前
NTT株式会社
生成装置、再生システム、生成方法、再生方法、およびプログラム
1か月前
NTT株式会社
施工計画立案装置、施工計画立案方法、及び施工計画立案プログラム
1か月前
NTT株式会社
連続発話推定方法、連続発話推定装置、およびプログラム
5日前
NTT株式会社
文生成装置、文生成学習装置、文生成方法、文生成学習方法及びプログラム
12日前
NTT株式会社
アクセラレータ状態制御装置、アクセラレータ状態制御方法およびプログラム
1か月前
個人
詐欺保険
13日前
個人
縁伊達ポイン
13日前
個人
RFタグシート
今日
個人
地球保全システム
26日前
個人
QRコードの彩色
17日前
個人
冷凍食品輸出支援構造
1か月前
個人
為替ポイント伊達夢貯
1か月前
個人
残土処理システム
19日前
続きを見る