TOP特許意匠商標
特許ウォッチ DM通知 Twitter
公開番号2022094334
公報種別公開特許公報(A)
公開日2022-06-24
出願番号2021200018
出願日2021-12-09
発明の名称分子生成モデルをトレーニングするためのコンピュータ実装方法、システム、およびコンピュータプログラム製品、ならびに分子と分子の部分構造の数とを生成するためのコンピュータ実装方法およびシステム(解釈可能な分子生成モデル)
出願人インターナショナル・ビジネス・マシーンズ・コーポレーション,INTERNATIONAL BUSINESS MACHINES CORPORATION
代理人個人,個人,個人
主分類G16C 20/70 20190101AFI20220617BHJP(特定の用途分野に特に適合した情報通信技術)
要約【課題】分子生成モデルをトレーニングするためのコンピュータ実装方法、システム及びコンピュータプログラム製品並びに分子と分子の部分構造の数とを生成するコンピュータ実装方法、システム及びプログラムを提供する。
【解決手段】分子生成モデルをトレーニングするための方法300は、解釈可能な潜在空間を用いて分子生成モデルをトレーニングし、目標特性を有する入力分子から生成された潜在空間から、生成された分子生成の部分構造を識別するアプローチを提供する。分子生成モデルは、関連する特性と既知の部分構造を有する分子構造のデータセットを用いてトレーニングでき、潜在空間を生成する。この潜在空間では、部分構造予測子モデルをさらにトレーニングすることができ、目標特性を有する分子の部分構造の数を、目標特性と識別された部分構造を有する入力分子から予測する。
【選択図】図3
特許請求の範囲【請求項1】
分子生成モデルをトレーニングするためのコンピュータ実装方法であって、前記方法は、
1つまたは複数のプロセッサによって、目標特性を有する入力分子構造に基づいて前記目標特性を有する出力分子構造を生成するために、分子構造のデータセットを用いて分子生成モデルをトレーニングすることと、
前記1つまたは複数のプロセッサによって、前記分子構造のデータセットから潜在空間を生成することと、
前記1つまたは複数のプロセッサによって、前記入力分子構造の前記生成された潜在空間に基づいて、前記目標特性を有する前記出力分子構造の1つまたは複数の部分構造を予測するために、部分構造予測モデルをトレーニングすることと、
を含む、コンピュータ実装方法。
続きを表示(約 1,200 文字)【請求項2】
前記分子生成モデルは、変分オートエンコーダである、請求項1に記載のコンピュータ実装方法。
【請求項3】
前記分子生成モデル内の前記入力分子構造、出力分子構造、および分子構造のデータセットに対する前記分子構造の記法は、簡略化分子入力ラインエントリである、請求項1に記載のコンピュータ実装方法。
【請求項4】
前記分子構造のデータセットは複数の分子構造から構成され、各分子構造は特性データおよび部分構造データを有する、請求項1に記載のコンピュータ実装方法。
【請求項5】
1つまたは複数の部分構造を予測するために前記部分構造予測モデルをトレーニングすることは、
前記1つまたは複数のプロセッサによって、分子構造データセットからの分子構造に関連する複数の部分構造に、前記潜在空間内のローカル潜在ユニットのセットをまばらに割り当てることをさらに含む、請求項1に記載のコンピュータ実装方法。
【請求項6】
分子生成モデルをトレーニングするためのシステムであって、前記システムは、
1つまたは複数のコンピュータプロセッサと、
1つまたは複数のコンピュータ可読記憶媒体と、
コンピュータプログラム命令と、を含み、前記コンピュータプログラム命令は、
目標特性を有する入力分子構造に基づいて前記目標特性を有する出力分子構造を生成するために、分子構造のデータセットを用いて分子生成モデルをトレーニングすることと、
前記分子構造のデータセットから潜在空間を生成することと、
前記入力分子構造の前記生成された潜在空間に基づいて、前記目標特性を有する前記出力分子構造の1つまたは複数の部分構造を予測するために、部分構造予測モデルをトレーニングすることと、
を実行する、システム。
【請求項7】
前記分子生成モデルは、変分オートエンコーダである、請求項6に記載のシステム。
【請求項8】
前記分子生成モデル内の前記入力分子構造、出力分子構造、および分子構造のデータセットに対する前記分子構造の記法は、簡略化分子入力ラインエントリである、請求項6に記載のシステム。
【請求項9】
前記分子構造のデータセットは複数の分子構造から構成され、各分子構造は特性データおよび部分構造データを有する、請求項6に記載のシステム。
【請求項10】
1つまたは複数の部分構造を予測するために前記部分構造予測モデルをトレーニングすることは、
1つまたは複数のプロセッサによって、分子構造データセットからの分子構造に関連する複数の部分構造に、前記潜在空間内のローカル潜在ユニットのセットをまばらに割り当てることをさらに含む、請求項6に記載のシステム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、一般に分子構造生成モデルの分野に関し、より具体的には、分子生成モデルによって生成される分子構造における部分構造識別に関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
新しい化合物を設計するには、多大な労力とコストがかかる可能性がある。多くの場合、新しい化合物が意図された目的のために利用できるかどうかを判断することは、試行錯誤によって判断される。湿式実験を行う化学者や化学技術者の進歩は限られており、可能なすべての化合物を試験するのは非現実的である。既知の特性を有する化合物のより迅速な開発は、自動車、製薬、航空、半導体および農業を含む多くの産業において望ましい。現在、研究に利用可能な物理的および化学的性質を持つ分子構造を有する多数のライブラリーが存在する。生成モデルは、研究者が所望の特性を有する分子構造の探索を絞り込むのに役立つ。機械学習技術は、分子構造のデータベースを含む、ますます大量のデータを分析および処理することを可能にしている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
分子生成モデルをトレーニングするためのコンピュータ実装方法、システム、およびコンピュータプログラム製品、ならびに分子と分子の部分構造の数とを生成するためのコンピュータ実装方法およびシステムを提供する。
【課題を解決するための手段】
【0004】
本開示の実施形態は、分子生成モデルをトレーニングするためのコンピュータ実装方法、コンピュータプログラム製品、およびシステムを含む。本実施形態は、目標特性を有する入力分子構造に基づいて目標特性を有する出力分子構造を生成するために、分子構造のデータセットを用いて機械学習モデルをトレーニングすることを含む。さらに、実施形態は、分子構造のデータセットから潜在空間を生成することを含む。さらに、実施形態は、入力分子構造の生成された潜在空間に基づいて、目標特性を有する出力分子構造の1つまたは複数の部分構造を予測するために、部分構造予測モデルをトレーニングすることを含む。
【0005】
本開示はまた、目標特性を有する候補分子と、目標特性に関連する生成された分子の予測される部分構造の数とを生成するための実施形態を提供する。実施形態は、分子生成モデルを用いて入力分子のための潜在空間を生成することを含む。さらに、実施形態は、1つまたは複数の目標特性を有する出力分子の1つまたは複数の部分構造を、入力分子に基づいて、分子生成モデルによって生成された潜在空間から1つまたは複数の部分構造を予測するためにトレーニングされた部分構造予測モデルを用いて予測することを含む。
【0006】
上記の概要は、本開示のすべての実施のそれぞれの図示された実施形態を説明することを意図していない。
【図面の簡単な説明】
【0007】
本発明の一実施形態による、一般的に解釈可能な分子構造生成モデル環境を示す機能ブロック図である。
本発明の一実施形態による、分子生成エンジンを示す機能ブロック図である。
本発明の実施形態による、分子生成モデルによって生成された分子構造の部分構造を予測するために、解釈可能な分子生成モデルおよび部分構造予測モデルをトレーニングする方法を示すフローチャートである。
生成された分子構造内の部分構造の数を予測する方法を示すフローチャートである。
本発明の一実施形態による、解釈可能な分子構造生成モデル環境内の例示的なコンピューティングシステムの機能ブロック図である。
本発明の一実施形態による、クラウドコンピューティング環境を示す図である。
本発明の一実施形態による、抽象化モデルレイヤを示す機能ブロック図である。
【発明を実施するための形態】
【0008】
本明細書に記載された実施形態は、種々の修正および代替形態に応じるが、その詳細は、例として図面に示されており、詳細に説明される。しかしながら、説明した特定の実施形態に限定する意図はないことを理解されたい。反対に、意図は、本開示の精神および範囲内にあるすべての改変、均等物および代替物を包含することである。
【0009】
図示された実施形態は、解釈可能な分子構造生成モデルを可能にし、より具体的には、機械学習モデルをトレーニングして、入力分子に基づいて目標特性を有する候補分子構造を生成し、候補分子構造に関連する特性を予測することを可能にする。さらに、実施形態は、候補分子構造中の目標特性に関連する部分構造の数を予測するために、分子生成モデルの潜在空間を解釈する機械学習モデルを共同でトレーニングするためのアプローチを提供する。
【0010】
材料開発の絶え間ない改善は人類に多大な恩恵をもたらした。分子の膨大なライブラリーとそれに関連した分子構造および分子の特性が集められた。これらのライブラリーは、研究者が新しい化合物をレビューし、作成を試みることを可能にした。しかし、これらの新しい化合物の開発には時間と費用がかかり、時には危険も伴う。機械学習法の最近の進歩は、大量のデータの解析を可能にした。これは材料と化合物開発の領域を含む。そのような機械学習法の1つがニューラルネットワークである。ニューラルネットワークやその他の機械学習法を用いて、所望の特性を持つ新しい分子を開発し識別することは、このタスクを達成するための効率的な方法である。逆分子設計システムとしてディープニューラルネットワーク(DNN)を使用することは、所望の特性を有する入力分子から候補分子を生成するための効果的なアプローチであり得る。しかし、研究者がディープニューラルネットワークの隠れレイヤや潜在空間を理解する方法はない。これは、潜在空間内の情報がレイヤ内で混合または絡み合っているためである。潜在空間から生成される候補分子構造の部分構造の数を予測するアプローチは、研究者が新しい候補分子構造を識別するプロセスを改善することを可能にする。
(【0011】以降は省略されています)

特許ウォッチbot のツイート
この特許をJ-PlatPatで参照する

関連特許

個人
発熱パスポートシステム
1か月前
個人
医用文書提供支援システム
1か月前
個人
電子医療システム、および方法
2か月前
個人
遠隔診療システムの被診療者側情報処理端末
1か月前
大和ハウス工業株式会社
介護システム
2か月前
キヤノン株式会社
医療情報の閲覧システム
1か月前
個人
感染者特定・絞り込みシステム、方法及びプログラム
1か月前
TXP Medical株式会社
診断支援システム
1か月前
からだポータル株式会社
からだポータルサイトシステム
1か月前
株式会社NTTドコモ
健康管理装置
1か月前
ホクユーメディックス株式会社
採血管理システム
3か月前
株式会社医療情報技術研究所
組織間文書情報共有システム
1か月前
株式会社Splink
情報処理方法及びプログラム
1か月前
株式会社World Life Mapping
精神状態推定装置
2か月前
個人
医療診断補助装置および医療診断補助プログラム
1か月前
長瀬産業株式会社
健康インセンティブ・サポート・システム
1か月前
KDDI株式会社
移動評価装置、方法およびプログラム
20日前
ベストリハ株式会社
管理装置、管理システムおよびプログラム
1か月前
学校法人慶應義塾
情報処理装置及びプログラム
2か月前
メドケア株式会社
受診勧奨システム
2か月前
株式会社モリタ東京製作所
情報処理装置およびプログラム
1か月前
パラマウントベッド株式会社
ポイント表示システム
1か月前
株式会社エクサウィザーズ
通知方法、プログラム、及び作業記録システム
1か月前
株式会社ニデック
医療情報管理システム、および医療情報管理プログラム
3か月前
Kotozna株式会社
検査結果確認システム
13日前
株式会社H&Bホールディングス
クラウド総合電子カルテシステム
2か月前
株式会社日立ビルシステム
通知システム
26日前
株式会社湯山製作所
業務支援システム及び業務支援プログラム
1か月前
株式会社ソフトアップJ
下半身トレーニング装置
2か月前
大王製紙株式会社
物品管理システム、及び、物品管理プログラム
3か月前
個人
検体検査システム
2か月前
ミズホ株式会社
医療機器管理システム
2か月前
富士通株式会社
構造探索プログラム、構造探索装置、及び構造探索方法
2か月前
株式会社シーエス・ワークス
医療機関紹介システム
3か月前
株式会社World Life Mapping
メンタル改善支援装置
2か月前
株式会社リエンゲージメント
指示箋システム
4日前
続きを見る