TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025132315
公報種別公開特許公報(A)
公開日2025-09-10
出願番号2024029780
出願日2024-02-29
発明の名称処理方法、処理装置及び処理プログラム
出願人ダイキン工業株式会社,国立大学法人 東京大学
代理人個人,個人
主分類G06F 40/216 20200101AFI20250903BHJP(計算;計数)
要約【課題】物質について記載したテキスト情報が含まれる文書を解析する際の解析精度を向上させる。
【解決手段】処理方法は、文書に含まれる物質名を有する物質の構造情報に基づく第1分散表現を出力する第1出力工程と、前記文書に含まれる物質名を有する物質について記載したテキスト情報に基づく第2分散表現を出力する第2出力工程と、前記第1分散表現と、前記第2分散表現とを用いてモデルの学習を行う学習工程とを含む。
【選択図】図3
特許請求の範囲【請求項1】
文書に含まれる物質名を有する物質の構造情報に基づく第1分散表現を出力する第1出力工程と、
前記文書に含まれる物質名を有する物質について記載したテキスト情報に基づく第2分散表現を出力する第2出力工程と、
前記第1分散表現と、前記第2分散表現とを用いてモデルの学習を行う学習工程と
を含む処理方法。
続きを表示(約 1,500 文字)【請求項2】
前記学習工程において、前記モデルの学習を行うことには、学習済みのモデルの再学習を行うことが含まれる、
を含む請求項1に記載の処理方法。
【請求項3】
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記モデルの学習を行うことには、
前記第1出力工程と前記第2出力工程とを実行することで出力された、第1分散表現と第2分散表現とを含む分散表現の集合を用いてモデルの学習を行うこと、が含まれる、
請求項1に記載の処理方法。
【請求項4】
前記テキスト情報が物質名を含む文章である場合、物質名の位置に対応する位置に第1分散表現が配置され、物質名以外の文章の位置に対応する位置に第2分散表現が配置された、前記分散表現の集合が生成される、
請求項3に記載の処理方法。
【請求項5】
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記モデルの再学習を行うことには、
前記テキスト情報の物質名以外の一部にマスク処理を行うことと、
マスク処理後の前記テキスト情報について、前記第1出力工程と前記第2出力工程とを実行することで出力された、第1分散表現と第2分散表現とを含む分散表現の集合を入力データとし、前記テキスト情報の物質名以外の一部を正解データとする教師有り学習を行うことと、が含まれる、
請求項3に記載の処理方法。
【請求項6】
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記学習済みのモデルの再学習を行うことには、
前記テキスト情報の物質名に、共通のトークンを用いてマスク処理を行うことと、
マスク処理後の前記テキスト情報について、前記第1出力工程と前記第2出力工程とを実行することで出力された、第1分散表現と第2分散表現とを含む分散表現の集合を入力データとし、前記テキスト情報の物質名を正解データとする教師有り学習を行うことと、が含まれる、
請求項2に記載の処理方法。
【請求項7】
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記モデルの学習を行うことには、
第1分散表現を出力する学習済みの第1モデル、または、第2分散表現を出力する学習済みの第2モデル、または、前記学習済みの第1モデル及び前記学習済みの第2モデルの出力が入力される前記学習済みのモデル、のいずれかの再学習を行うこと、が含まれる、
請求項1に記載の処理方法。
【請求項8】
前記学習工程において、前記第1分散表現を出力する学習済みの第1モデルは、文脈が類似する文章にそれぞれ含まれる、互いに異なる物質名を有する物質の構造情報に基づく第1分散表現が、互いに近傍に配置されるように学習が行われる、
請求項7に記載の処理方法。
【請求項9】
物質の構造情報に基づく第1分散表現を、前記学習工程において学習が行われた学習済みのモデルに入力することで、前記物質の用途または機能を示すトークンを出力する第3出力工程
を含む請求項1に記載の処理方法。
【請求項10】
物質の用途または機能が記載されたテキスト情報に基づく第2分散表現を、前記学習工程において学習が行われた学習済みのモデルに入力することで、前記物質の物質名を示すトークンを出力する第3出力工程
を含む請求項1に記載の処理方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、処理方法、処理装置及び処理プログラムに関する。
続きを表示(約 1,100 文字)【背景技術】
【0002】
化学分野等における論文、雑誌、特許文献等の文書には、物質の分子構造を示す構造情報と、当該物質について記載したテキスト情報とが含まれる。このような文書を、機械学習モデルを用いて解析する場合、従来は構造情報とテキスト情報とに分けて解析が行われていた。また、テキスト情報に対しては、物質名も物質名以外の他の文字列も同様の解析が行われていた。
【先行技術文献】
【特許文献】
【0003】
韓国公開特許第2021-0044003号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記解析方法では、所望する解析結果が得られない場合がある。
【0005】
本開示は、物質について記載したテキスト情報が含まれる文書を解析する際の解析精度を向上させることを目的とする。
【課題を解決するための手段】
【0006】
本開示の第1の態様は、処理方法であって、
文書に含まれる物質名を有する物質の構造情報に基づく第1分散表現を出力する第1出力工程と、
前記文書に含まれる物質名を有する物質について記載したテキスト情報に基づく第2分散表現を出力する第2出力工程と、
前記第1分散表現と、前記第2分散表現とを用いてモデルの学習を行う学習工程と
を含む。
【0007】
本開示の第1の態様によれば、物質について記載したテキスト情報が含まれる文書を解析する際の解析精度を向上させることができる。
【0008】
本開示の第2の態様は、第1の態様に記載の処理方法であって
前記学習工程において、前記モデルの学習を行うことには、学習済みのモデルの学習を行うことが含まれる。
【0009】
本開示の第3の態様は、第1または第2の態様に記載の処理方法であって、
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記モデルの学習を行うことには、
前記第1出力工程と前記第2出力工程とを実行することで出力された、第1分散表現と第2分散表現とを含む分散表現の集合を用いてモデルの学習を行うこと、が含まれる。
【0010】
本開示の第4の態様は、第3の態様に記載の処理方法であって、
前記テキスト情報が物質名を含む文章である場合、物質名の位置に対応する位置に第1分散表現が配置され、物質名以外の文章の位置に対応する位置に第2分散表現が配置された、前記分散表現の集合が生成される。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

ダイキン工業株式会社
正極合剤、正極および二次電池
6日前
ダイキン工業株式会社
圧縮機、および冷凍サイクル装置
12日前
ダイキン工業株式会社
圧縮機、および冷凍サイクル装置
12日前
ダイキン工業株式会社
圧縮機、冷凍装置、及び圧縮機の組立方法
8日前
ダイキン工業株式会社
粒子、組成物、成形体、及び、粒子の製造方法
15日前
ダイキン工業株式会社
空調機
15日前
ダイキン工業株式会社
硬化性エポキシ樹脂組成物、硬化物及び硬化物の製造方法
15日前
ダイキン工業株式会社
中継装置、およびその中継装置を備えた室外機並びに室内機
2日前
ダイキン工業株式会社
シラン化合物
12日前
ダイキン工業株式会社
エッチングガス
1日前
ダイキン工業株式会社
デポジションガス
1日前
ダイキン工業株式会社
ノイズ抑制回路、空気調和機
15日前
ダイキン工業株式会社
制御システムおよび冷凍システム
15日前
ダイキン工業株式会社
虫駆除システム、および空気処理装置
15日前
ダイキン工業株式会社
高純度フルオロポリマー含有組成物の製造方法および高純度フルオロポリマー含有組成物
5日前
三星電子株式会社
プラズマエッチング工程を含む半導体素子の製造方法
5日前
個人
詐欺保険
15日前
個人
縁伊達ポイン
15日前
個人
RFタグシート
2日前
個人
QRコードの彩色
19日前
個人
地球保全システム
28日前
個人
自動調理装置
1日前
個人
為替ポイント伊達夢貯
1か月前
個人
冷凍食品輸出支援構造
1か月前
個人
残土処理システム
21日前
個人
農作物用途分配システム
14日前
個人
表変換編集支援システム
1か月前
個人
知財出願支援AIシステム
1か月前
個人
知的財産出願支援システム
22日前
個人
タッチパネル操作指代替具
8日前
個人
携帯端末障害問合せシステム
7日前
個人
パスワード管理支援システム
1か月前
個人
スケジュール調整プログラム
7日前
個人
AIによる情報の売買の仲介
1か月前
個人
行動時間管理システム
1か月前
個人
AIキャラクター制御システム
1か月前
続きを見る