TOP
|
特許
|
意匠
|
商標
特許ウォッチ
DM通知
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2023038929
公報種別
公開特許公報(A)
公開日
2023-03-17
出願番号
2022140877
出願日
2022-09-05
発明の名称
機械読解方法、装置、およびコンピュータ読み取り可能な記憶媒体
出願人
株式会社リコー
代理人
個人
,
個人
,
個人
主分類
G06N
20/10 20190101AFI20230310BHJP(計算;計数)
要約
【課題】機械読解モデルの性能を向上し、解答予測の精度を向上させる方法を提供する。
【解決手段】方法は、段落と問題からなる段落・問題ペアを取得し、段落・問題ペア中の各サブワードに対応するサブワードベクトルを生成するステップ201と、段落・問題ペア中の各サブワードについて、いずれかのサブワードに対するサブワードの相対位置を決定し、相対位置およびサブワードのサブワードベクトルを用いて、第1部分におけるサブワードの自己注目情報を算出し、第2部分におけるサブワードの相互注目情報を算出するステップ202と、段落・問題ペア中の各サブワードについて、サブワードの自己注目情報と相互注目情報に基づいて、サブワードの融合ベクトルを生成するステップ203と、段落・問題ペア中の各サブワードの融合ベクトルを機械読解モデルのデコーダに入力し、前記デコーダにより予測された解答を得るステップ204と、を含む。
【選択図】図2
特許請求の範囲
【請求項1】
段落と問題からなる段落・問題ペアを取得し、前記段落・問題ペア中の各サブワードに対応するサブワードベクトルを生成するステップと、
前記段落・問題ペア中の各サブワードについて、前記サブワードと前記段落・問題ペア中のいずれかのサブワードとの間の距離に基づいて、前記いずれかのサブワードに対する前記サブワードの相対位置を決定し、前記相対位置および前記サブワードのサブワードベクトルを用いて、第1部分における前記サブワードの自己注目情報を算出し、第2部分における前記サブワードの相互注目情報を算出するステップであって、前記第1部分は、前記サブワードが所在する段落または問題であり、前記第1部分が段落である場合は、前記第2部分は問題であり、前記第1部分が問題である場合は、前記第2部分は段落である、ステップと、
前記段落・問題ペア中の各サブワードについて、当該サブワードの自己注目情報と相互注目情報に基づいて、当該サブワードの融合ベクトルを生成するステップと、
前記段落・問題ペア中の各サブワードの融合ベクトルを機械読解モデルのデコーダに入力し、前記デコーダにより予測された解答を得るステップと、を含む、ことを特徴とする機械読解方法。
続きを表示(約 2,300 文字)
【請求項2】
前記第1部分における当該サブワードの自己注目情報を算出するステップは、
前記段落・問題ペア中の各サブワードについて、前記第1部分におけるいずれかのサブワードに対する当該サブワードの相対位置を用いて、前記第1部分のいずれかのサブワードの自己注目重みを算出し、前記自己注目重みを用いて、前記第1部分のサブワードに対応するサブワードベクトルの加重合計を行うことにより、前記第1部分における当該サブワードの自己注目情報を得るステップを含む、ことを特徴とする請求項1に記載の機械読解方法。
【請求項3】
前記第2部分における当該サブワードの相互注目情報を算出するステップは、
前記段落・問題ペア中の各サブワードについて、前記第2部分のいずれかのサブワードに対する当該サブワードの相対位置を用いて、前記第2部分のいずれかのサブワードの相互注目重みを算出し、前記相互注目重みを用いて、前記第2部分のサブワードに対応するサブワードベクトルの加重合計を行い、前記第2部分のサブワードの相互注目情報を得るステップを含む、ことを特徴とする請求項1に記載の機械読解方法。
【請求項4】
前記サブワードの自己注目情報と相互注目情報に基づいて、当該サブワードの融合ベクトルを生成するステップは、
前記段落・問題ペア中の各サブワードについて、当該サブワードの自己注目情報と相互注目情報を融合して、当該サブワードの融合ベクトルを取得するステップを含む、ことを特徴とする請求項1に記載の機械読解方法。
【請求項5】
前記サブワードの自己注目情報と相互注目情報に基づいて、当該サブワードの融合ベクトルを生成するステップは、
前記段落・問題ペア中の各サブワードについて、当該サブワードの自己注目情報と相互注目情報を融合して、当該サブワードの注目情報を取得し、当該サブワードの注目情報と当該サブワードの所属するワードにおけるワード境界情報を融合して、当該サブワードの融合ベクトルを取得するステップを含む、ことを特徴とする請求項1に記載の機械読解方法。
【請求項6】
前記サブワードの注目情報と当該サブワードの所属ワードのワード境界情報を融合して、当該サブワードの融合ベクトルを取得するステップは、
各サブワードについて、当該サブワードが所属するワードにおける最初のサブワードであるか否かに基づいて、当該サブワードに対応するワード先頭情報を決定し、当該サブワードが所属するワードにおける最後のサブワードであるか否かに基づいて、当該サブワードに対応するワード末尾情報を決定するステップと、
当該サブワードの注目情報、ワード先頭情報、ワード末尾情報に対してベクトル融合を行い、当該サブワードの融合ベクトルを取得するステップと、を含む、ことを特徴とする請求項5に記載の機械読解方法。
【請求項7】
前記当該サブワードの自己注目情報と相互注目情報の融合は、当該サブワードの自己注目情報と相互注目情報のベクトル加算またはベクトル結合を含む、ことを特徴とする請求項4または5に記載の機械読解方法。
【請求項8】
段落と問題からなる段落・問題ペアを取得し、前記段落・問題ペア中の各サブワードに対応するサブワードベクトルを生成する符号化モジュールと、
前記段落・問題ペア中の各サブワードについて、当該サブワードと前記段落・問題ペア中のいずれかのサブワードとの間の距離に基づいて、前記段落・問題ペア中のいずれかのサブワードに対する前記サブワードの相対位置を決定し、前記相対位置と前記サブワードのサブワードベクトルを用いて、第1部分における前記サブワードの自己注目情報を算出し、第2部分における前記サブワードの相互注目情報を算出し、当該サブワードの自己注目情報と相互注目情報に基づいて、当該サブワードの融合ベクトルを生成する相互作用情報算出モジュールであって、前記第1部分は、前記サブワードが所在する段落または問題であり、前記第1部分が段落である場合は、前記第2部分が問題であり、前記第1部分が問題である場合は、前記第2部分が段落である、相互作用情報算出モジュールと、
前記段落・問題ペア中の各サブワードの融合ベクトルを機械読解モデルのデコーダに入力し、前記デコーダにより予測された解答を得る復号化モジュールと、を備えることを特徴とする機械読解装置。
【請求項9】
前記相互作用情報算出モジュールは、
前記段落・問題ペア中の各サブワードについて、前記第1部分のいずれかのサブワードに対する当該サブワードの相対位置を用いて、前記第1部分のいずれかのサブワードの自己注目重みを算出し、前記自己注目重みを用いて、前記第1部分のサブワードに対応するサブワードベクトルの加重合計を行うことにより、前記第1部分における当該サブワードの自己注目情報を得る自己注目情報算出モジュールを備えることを特徴とする請求項8に記載の機械読解装置。
【請求項10】
前記相互作用情報算出モジュールは、
前記段落・問題ペア中の各サブワードについて、第2部分のいずれかのサブワードに対する該サブワードの相対位置を用いて、前記第2部分のいずれかのサブワードの相互注目重みを算出し、前記相互注目重みを用いて、前記第2部分のサブワードに対応するサブワードベクトルの加重合計を行い、当該サブワードの第2部分における相互注目情報を得る相互注目情報算出モジュールを備えることを特徴とする請求項8に記載の機械読解装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、自然言語処理(Natural Language Processing:NLP)における機械読解(Machine Reading Comprehension)の分野に関し、具体的には、機械読解方法、装置およびコンピュータ読み取り可能な記憶媒体に関する。
続きを表示(約 2,000 文字)
【背景技術】
【0002】
機械読解技術とは、アルゴリズムを用いてコンピュータに文章の意味を理解させるとともに、関連する問題に答えられるようにする技術である。段落と問題のいずれも、人間の言語形式による文字表現であり、文章は、1つまたは複数の段落を含むことができる。機械読解モデルの入力は、段落(Paragraph)と問題(Question)からなる段落・問題ペアであり、通常は一段落の文字である。機械読解モデルの出力は、該問題への予測された解答(Answer)である。
【0003】
機械読解モデルから出力する解答には、あらかじめ用意された複数の解答選択肢から解答を選択する多肢選択型、段落から解答の開始位置と終了位置を特定して解答を提供する区間解答型、自ら解答を生成する自由生成型などの種類がある。
【0004】
図1は、機械読解モデルの一般的なアーキテクチャを示し、通常は、符号化層、相互作用層、復号層(復号層は、デコーダまたは出力層と呼ばれることもある)を有する。符号化層では、段落と問題のそれぞれに底層処理を施し、段落・問題ペアをデジタル符号に変換し、コンピュータで処理可能な情報単位とする。符号化において、モデルは元の語句の文章における意味を維持する必要がある。
【0005】
相互作用層では、モデルに段落と問題の意味的なつながりに注目させ、段落の意味分析から問題への理解を深めるとともに、問題の意味分析から段落への理解を深めることができる。読解モデルは、段落と問題の意味を組み合わせて考慮し、モデルの両者への理解を深める。
【0006】
相互作用層を経て、モデルは段落と問題の意味的つながりを確立し、これにより、問題への解答を予測することができる。予測機能を完成させるモジュールは、復号層(デコーダまたは出力層)と呼ばれる。前述したように、機械読解タスクの解答には、区間解答型、多肢選択型など、様々なタイプがあるため、復号層の具体的な形態は、タスクの解答タイプとの連付けを行う必要がある。また、復号層は、モデル最適化時の評価関数と損失関数を決定する。
【0007】
本発明者らは、従来技術の機械読解モデルは、通常、相互作用層における段落と問題間の意味的つながりしか考慮しておらず、したがって、解答予測の精度を高めるためには、それらを改良する必要があることを見出した。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明の実施形態は、機械読解モデルの性能を向上し、解答予測の精度を向上させることができる機械読解方法、装置およびコンピュータ読み取り可能な記憶媒体を提供する。
【課題を解決するための手段】
【0009】
本発明の一態様によれば、少なくとも1つの実施形態は、段落と問題からなる段落・問題ペアを取得し、前記段落・問題ペア中の各サブワードに対応するサブワードベクトルを生成するステップと、
前記段落・問題ペア中の各サブワードについて、前記サブワードと前記段落・問題ペア中のいずれかのサブワードとの間の距離に基づいて、前記いずれかのサブワードに対する前記サブワードの相対位置を決定し、前記相対位置および前記サブワードのサブワードベクトルを用いて、第1部分における前記サブワードの自己注目情報を算出し、第2部分における前記サブワードの相互注目情報を算出するステップであって、前記第1部分は、前記サブワードが所在する段落または問題であり、前記第1部分が段落である場合は、前記第2部分は問題であり、前記第1部分が問題である場合は、前記第2部分は段落である、ステップと、前記段落・問題ペア中の各サブワードについて、当該サブワードの自己注目情報と相互注目情報に基づいて、当該サブワードの融合ベクトルを生成するステップと、前記段落・問題ペア中の各サブワードの融合ベクトルを機械読解モデルのデコーダに入力し、前記デコーダにより予測された解答を得るステップと、を含む機械読解方法を提供する。
【0010】
さらに、本発明の少なくとも1つの実施形態によれば、前記第1部分における当該サブワードの自己注目情報を算出するステップは、前記段落・問題ペア中の各サブワードについて、前記第1部分におけるいずれかのサブワードに対する当該サブワードの相対位置を用いて、前記第1部分のいずれかのサブワードの自己注目重みを算出し、前記自己注目重みを用いて、前記第1部分のサブワードに対応するサブワードベクトルの加重合計を行うことにより、前記第1部分における当該サブワードの自己注目情報を得るステップを含んでもよい。
(【0011】以降は省略されています)
特許ウォッチbot のツイート
この特許をJ-PlatPatで参照する
関連特許
個人
画像処理装置
28日前
個人
防犯システム
1か月前
個人
デジタル認証システム
24日前
個人
デジタル認証システム
21日前
個人
情報端末用タッチペン
1か月前
個人
改善会議システム
15日前
個人
パーソナルコンピューター
11日前
凸版印刷株式会社
メタルカード
4日前
キーコム株式会社
花火プリンター
8日前
株式会社東京
情報提供方法
1日前
株式会社アジラ
対象追跡装置
28日前
株式会社大野
遺骨合祀システム
11日前
個人
スポーツ用具管理システム
22日前
凸版印刷株式会社
ICモジュール基板
8日前
凸版印刷株式会社
金属製指紋認証カード
4日前
学校法人早稲田大学
触覚提示装置
21日前
個人
価値評価システム
10日前
アイリスオーヤマ株式会社
調理装置
11日前
株式会社サタケ
穀物乾燥機の選定システム
21日前
株式会社ノンピ
情報処理装置
8日前
株式会社アクト
投票システム
1日前
株式会社日立国際電気
通信システム
11日前
個人
広告装置およびプログラム
16日前
富士通株式会社
異常検出
16日前
個人
取引システム、取引方法及びプログラム
4日前
個人
商品管理システム及びプログラム
16日前
株式会社アスタリスク
読取装置
28日前
中部電力株式会社
情報処理装置
1か月前
株式会社クラハシ
水産物の売買システム
11日前
レバレジーズ株式会社
性格診断システム
28日前
株式会社スローネ
撮影計画支援システム
1か月前
株式会社SLA
太陽光発電装置管理システム。
16日前
個人
勤怠管理機能を有する勤怠情報連携ソフト
14日前
キヤノン株式会社
電子機器および制御方法
15日前
株式会社サタケ
稲の収穫期判定装置
28日前
トヨタ自動車株式会社
物体認識装置
1か月前
続きを見る
他の特許を見る