発明の詳細な説明【技術分野】 【0001】 本発明は、学習方法、推論方法、学習装置、推論装置及びプログラムに関する。 続きを表示(約 2,100 文字)【背景技術】 【0002】 自然言語でのクエリを入力とし、検索対象のテキストの集合であるコーパスからクエリに関連するテキストを規定の数だけ出力するタスクを検索タスクという。 【0003】 非特許文献1のSPARTAは、任意の検索タスクに適用可能であり、特に訓練時と推論時のコーパスのドメイン(分野・話題など)が違う場合に注目している。訓練時にはサービスプロバイダが一般的なドメイン(ソースドメイン)のデータを用いてモデルを訓練する。モデルのユーザは、十分な訓練データを持たない、コーパスの機密性が高くモデルの訓練のためにコーパスをクラウドに置きたくない、などの理由から、モデルの訓練を行わない。ユーザが保有するコーパス(ターゲットドメイン)は推論時にのみ検索対象とされる。 【0004】 SPARTAは、BERT(非特許文献2)を使ってコーパス中の各テキストsをスパースなベクトルに変換する。BERTの語彙数をVとした場合スパースベクトルはV次元のベクトルとなる。スパースベクトルの第v成分は語彙中のv番目のトークンに対応する。テキストsにおけるトークンvの重要度がスパースベクトルの第v成分の値となる。 【0005】 スパースベクトルを転置インデックスとして保存しておくことで、クエリが与えられたときに高速に検索することが可能である。なお、転置インデックスを利用した高速検索には様々な既存研究及び実装がある。 【0006】 iをテキストsにおける位置インデックス、H(s) i をテキストsのi番目のトークンについてのBERTの出力、vを語彙V中のトークン、e v をBERTにおけるトークンvの単語埋め込みとすると、前述のスパースベクトルの第v成分は以下の式(1)で定義できる。 【0007】 TIFF 2025044907000002.tif 29 169 推論時はf(v,s)のうち値の大きいK個の成分のみを保存することでスパース性を保証する。 【0008】 クエリqが入力されたときのクエリqとテキストsのマッチングスコアは以下の式(2)で定義できる。 【0009】 TIFF 2025044907000003.tif 33 169 式(1)はBERTの出力に基づいて計算した、テキストsにおけるトークンvの重要度と解釈できる。そのため、式(1)は、ソースドメインにおけるトークンvの珍しさを反映していることになる。すなわち、式(1)は、一般的なトークン(例えば、てにをは等の頻出語)には小さい値を割り当て、珍しいトークン(例えば、固有名詞等)に対して大きい値を割り当てる。 【先行技術文献】 【非特許文献】 【0010】 Tiancheng Zhao, Xiaopeng Lu, and Kyusong Lee、"SPARTA: Efficient Open-Domain Question Answering via Sparse Transformer Matching Retrieval"、In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Association for Computational Linguistics, 565-575、[online]、インターネット<URL:https://doi.org/10.18653/v1/2021.naaclmain.47> Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova、"BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding"、In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). Association for Computational Linguistics, 4171-4186、[online]、インターネット<URL:https: //doi.org/10.18653/v1/N19-1423> 【発明の概要】 【発明が解決しようとする課題】 (【0011】以降は省略されています) この特許をJ-PlatPatで参照する