TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024059179
公報種別公開特許公報(A)
公開日2024-05-01
出願番号2022166696
出願日2022-10-18
発明の名称機械学習プログラム、機械学習方法および情報処理装置
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06N 20/00 20190101AFI20240423BHJP(計算;計数)
要約【課題】自然言語モデルと分類モデルとを接続した機械学習モデル全体のパラメータを更新すること。
【解決手段】情報処理装置100は、機械学習処理のn番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、自然言語処理モデルから分類モデルに入力される入力データと、分類モデルから出力される出力データとの対応関係を示すプロジェクションマトリックスを取得する。情報処理装置100は、自然言語処理モデルのパラメータを更新する。情報処理装置100は、プロジェクションマトリックスを用いて、分類モデルのパラメータを更新する。情報処理装置100は、機械学習処理のn+1番目のイテレーションにおいて、更新した自然言語処理モデルから更新した分類モデルに入力される入力データと、更新した分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する。
【選択図】図3
特許請求の範囲【請求項1】
自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、
前記機械学習処理のn番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、前記自然言語処理モデルから前記分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す前記プロジェクションマトリックスを取得し、
前記自然言語処理モデルのパラメータを更新し、
前記プロジェクションマトリックスを用いて、前記分類モデルのパラメータを更新し、
前記機械学習処理のn+1番目のイテレーションにおいて、更新した前記自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した前記分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する
処理をコンピュータに実行させることを特徴とする機械学習プログラム。
続きを表示(約 1,100 文字)【請求項2】
前記分類モデルへの入力データと、前記プロジェクションマトリックスを基にして、前記分類モデルからの出力データを算出する処理を更にコンピュータに実行させることを特徴とする請求項1に記載の機械学習プログラム。
【請求項3】
前記分類モデルのパラメータを更新する処理は、前記分類モデルに入力データを入力した際に前記分類モデルから出力される出力データと、前記算出された出力データとの誤差を基にして、前記分類モデルのパラメータを更新することを特徴とする請求項2に記載の機械学習プログラム。
【請求項4】
自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、
前記機械学習処理のn番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、前記自然言語処理モデルから前記分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す前記プロジェクションマトリックスを取得し、
前記自然言語処理モデルのパラメータを更新し、
前記プロジェクションマトリックスを用いて、前記分類モデルのパラメータを更新し、
前記機械学習処理のn+1番目のイテレーションにおいて、更新した前記自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した前記分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する
処理をコンピュータが実行することを特徴とする機械学習方法。
【請求項5】
自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、
前記機械学習処理のn番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、前記自然言語処理モデルから前記分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す前記プロジェクションマトリックスを取得し、
前記自然言語処理モデルのパラメータを更新し、
前記プロジェクションマトリックスを用いて、前記分類モデルのパラメータを更新し、
前記機械学習処理のn+1番目のイテレーションにおいて、更新した前記自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した前記分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する
処理を実行する制御部を有する情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習プログラム等に関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
自然言語処理において、ドメイン適応(Domain Adaptation)と呼ばれる技術がある。たとえば、ドメイン適応は、Sourceドメインと、Targetドメインとのサンプル間のドメインshiftを軽減するという問題に取り組む技術である。
【0003】
図6は、各ドメインのデータ分布の一例を示す図である。図6に示す例では、空間上に、Original LM domainのデータ10、Target domainのデータ11、Target domain downstream taskのデータ12が含まれる。
【0004】
Original LM domainのデータ10は、インターネット上に存在する文のデータに対応する。Target domainのデータ11は、Target domainのコーパスデータである。Target domain downstream taskのデータ12は、downstream taskを実行するために選択された文のデータである。
【0005】
以下では、Original LM domainのデータ10、Target domainのデータ11、Target domain downstream taskのデータ12を用いた、ドメイン適応の従来技術の一例について説明する。
【0006】
図7は、ドメイン適応の従来技術を説明するための図である。たとえば、従来技術によるドメイン適応では、ステップS10、ステップS11、ステップS12の順に、処理を実行する。ドメイン適応を実行する従来の装置を、従来装置と表記する。
【0007】
従来装置は、ステップS10において、Original LM domainのデータ10を用いて、第1モデル10a(Pretrained language model)の学習を実行する。第1モデル10aは、自然言語処理モデルである。第1モデル10aは、NN(Neural Network)等で実現される。たとえば、第1モデル10aに文を入力すると、文に含まれる各単語のベクトルが出力される。
【0008】
従来装置は、ステップS11において、Target domainのデータ11を用いて、第1モデル10aの再学習を実行することで、第2モデル11a(Re-pretrained language model)を得る。
【0009】
従来装置は、ステップS12において、第2モデル11aを、NERモデル12aに接続し、Target domain downstream taskのデータ12を用いて、第2モデル11a、NERモデル12aに対するFine-tuningを実行する。NERモデル12aは、分類モデルである。NERモデル12aは、NN等である。
【0010】
続いて、データ分類で起こす問題の一例について説明する。図8は、データ分類で起こす問題を説明するための図である。図8に示す例では、ドメインを「Electronic medical records domain」および「Disease explanation documents domain」とする。また、クラスを「Person」および「B-Disease」が存在する。文15を「Behcet's disease is globalized and infectious.」とする。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
光送信機
22日前
富士通株式会社
キャッシュメモリ
6日前
富士通株式会社
受光素子及び赤外線撮像装置
15日前
富士通株式会社
光リンク電力プロファイル推定
22日前
富士通株式会社
生成プログラムおよび生成方法
5日前
富士通株式会社
情報処理装置および情報処理方法
2日前
富士通株式会社
業務管理プログラム、装置、及び方法
8日前
富士通株式会社
プログラム,方法,及び情報処理装置
28日前
富士通株式会社
性能監視プログラムおよび性能監視方法
22日前
富士通株式会社
機械学習プログラムおよび機械学習方法
22日前
富士通株式会社
制御プログラム,制御方法及び情報処理装置
6日前
富士通株式会社
生成プログラム、生成方法および情報処理装置
5日前
富士通株式会社
探索プログラム、探索システム、及び探索方法
5日前
富士通株式会社
抽出プログラム、抽出方法および情報処理装置
28日前
富士通株式会社
予測プログラム、情報処理装置および予測方法
5日前
富士通株式会社
出力プログラム、出力方法および情報処理装置
12日前
富士通株式会社
生成プログラム、生成方法および情報処理装置
5日前
富士通株式会社
出力プログラム、出力方法、および情報処理装置
13日前
富士通株式会社
多重化変換器の伝送劣化を評価する方法及び装置
22日前
富士通株式会社
表示プログラム及び表示方法、並びに情報処理装置
8日前
富士通株式会社
最適化プログラム、最適化方法および情報処理装置
22日前
富士通株式会社
データ処理装置、データ処理方法およびプログラム
12日前
富士通株式会社
位置予測プログラム、情報処理装置及び位置予測方法
8日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
5日前
富士通株式会社
機械学習プログラム、機械学習方法および情報処理装置
6日前
富士通株式会社
機械学習プログラム、機械学習方法および情報処理装置
21日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
5日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
12日前
富士通株式会社
機械学習プログラム、機械学習方法および機械学習装置
2日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
22日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
5日前
富士通株式会社
機械学習プログラム、機械学習方法、及び、情報処理装置
15日前
富士通株式会社
情報処理プログラム、情報処理装置、および情報処理方法
5日前
富士通株式会社
照合支援プログラム、照合支援方法、および情報処理装置
7日前
富士通株式会社
情報処理装置、情報処理方法及びコンピュータプログラム
7日前
富士通株式会社
評価支援プログラム、評価支援方法、および情報処理装置
7日前
続きを見る