TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024170880
公報種別
公開特許公報(A)
公開日
2024-12-11
出願番号
2023087628
出願日
2023-05-29
発明の名称
配列生成装置および配列生成方法
出願人
株式会社日立製作所
代理人
弁理士法人平木国際特許事務所
主分類
G16B
30/00 20190101AFI20241204BHJP(特定の用途分野に特に適合した情報通信技術)
要約
【課題】結合親和性を高く維持しつつ、多様な配列を生成する。
【解決手段】配列生成装置は、複数のアミノ酸から構成される配列に対する代理評価値を算出する配列代理評価部と、学習モデルを用いて前記配列を生成する配列生成部と、を備える。前記配列生成部は、前記学習モデルによって生成された前記配列の一部の前記アミノ酸を所定確率で変更し、変更前のアミノ酸に特性がより近いアミノ酸がより高確率で選択されるような確率密度関数を用いて、変更後のアミノ酸を選択し、アミノ酸が変更された後の配列に対する前記代理評価値に基づき、より高い代理評価値を示す配列を生成するよう前記学習モデルを学習させ、これによって学習済みモデルを生成し、前記学習済みモデルを用いて生成配列を生成する。
【選択図】図3
特許請求の範囲
【請求項1】
複数のアミノ酸から構成される配列に対する代理評価値を算出する配列代理評価部と、
学習モデルを用いて前記配列を生成する配列生成部と、
を備える配列生成装置であって、
前記配列生成部は、
‐前記学習モデルによって生成された前記配列の一部の前記アミノ酸を所定確率で変更し、変更前のアミノ酸に特性がより近いアミノ酸がより高確率で選択されるような確率密度関数を用いて、変更後のアミノ酸を選択し、
‐アミノ酸が変更された後の配列に対する前記代理評価値に基づき、より高い代理評価値を示す配列を生成するよう前記学習モデルを学習させ、これによって学習済みモデルを生成し、
‐前記学習済みモデルを用いて生成配列を生成する、
配列生成装置。
続きを表示(約 1,700 文字)
【請求項2】
前記代理評価値は、前記配列によって表される抗体と、抗原との結合親和性を表す、請求項1に記載の配列生成装置。
【請求項3】
前記特性は疎水性を含む、請求項1に記載の配列生成装置。
【請求項4】
確率密度関数は、変更前のアミノ酸の疎水性インデックスと、変更後のアミノ酸の疎水性インデックスとの差分が大きくなるにつれて徐々に確率が小さくなる関数である、請求項1に記載の配列生成装置。
【請求項5】
前記配列代理評価部は、
前記配列の第一特性を示す第一代理評価値を算出する第一配列代理評価部と、
前記配列の第二特性を示す第二代理評価値を算出する第二配列代理評価部と、
を備え、
前記配列代理評価部は、前記第一代理評価値と前記第二代理評価値とに基づき、前記代理評価値を算出する、
請求項1に記載の配列生成装置。
【請求項6】
前記第一特性は、前記配列によって表される抗体と、抗原との結合親和性を表し、
前記第二特性は、前記配列によって表される抗体の溶解性を表す、
請求項5に記載の配列生成装置。
【請求項7】
前記配列代理評価部は、前記第一代理評価値と前記第二代理評価値との重み付き加算に基づいて前記代理評価値を算出する、請求項5に記載の配列生成装置。
【請求項8】
前記配列生成装置は、さらに、配列出力部と、評価真値入力部と、配列蓄積部とを備え、
前記配列出力部は、前記生成配列を出力し、
前記評価真値入力部は、前記生成配列に対する評価真値を取得し、
前記配列蓄積部は、前記生成配列と前記評価真値の組を格納し、
前記配列代理評価部は、前記配列蓄積部から前記生成配列と前記評価真値の前記組を取得し、これに基づいて機械学習を行う、
請求項1に記載の配列生成装置。
【請求項9】
前記配列生成装置は、第一配列生成群と、第二配列生成群と、配列生成選択部とを備え、
前記第一配列生成群および前記第二配列生成群は、いずれも、
‐前記配列の第一特性を示す第一代理評価値を算出する第一配列代理評価部と、
‐前記配列の第二特性を示す第二代理評価値を算出する第二配列代理評価部と、
を備え、
前記第一配列生成群は、前記第一代理評価値と前記第二代理評価値との、第一比率による重み付き加算によって前記代理評価値を算出し、
前記第二配列生成群は、前記第一代理評価値と前記第二代理評価値との、前記第一比率とは異なる第二比率による重み付き加算によって前記代理評価値を算出し、
前記配列生成選択部は、前記第一配列生成群が算出した複数の前記代理評価値の平均値と、前記第二配列生成群が算出した複数の前記代理評価値の平均値とに基づき、前記第一配列生成群および前記第二配列生成群を含む配列生成群グループからいずれか1つを選択し、
前記配列出力部は、前記配列生成選択部によって選択された前記1つによって生成された前記生成配列を出力する、
請求項8に記載の配列生成装置。
【請求項10】
複数のアミノ酸から構成される配列に対する代理評価値を算出する配列代理評価ステップと、
学習モデルを用いて前記配列を生成する配列生成ステップと、
を備える配列生成方法であって、
前記配列生成ステップは、
‐前記学習モデルによって生成された前記配列の一部の前記アミノ酸を所定確率で変更し、変更前のアミノ酸に特性がより近いアミノ酸がより高確率で選択されるような確率密度関数を用いて、変更後のアミノ酸を選択するステップと、
‐アミノ酸が変更された後の配列に対する前記代理評価値に基づき、より高い代理評価値を示す配列を生成するよう前記学習モデルを学習させ、これによって学習済みモデルを生成するステップと、
‐前記学習済みモデルを用いて生成配列を生成するステップと、
を含む、配列生成方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は配列生成装置および配列生成方法に関し、とくにアミノ酸から構成される配列を生成するものに関する。
続きを表示(約 1,600 文字)
【背景技術】
【0002】
抗体は、抗体医薬として利用される。抗体は20種類のアミノ酸が合計で1500程度連なって構成されている。このため、1つの抗体を構成するアミノ酸の配列において、アミノ酸の組み合わせは20の1500乗程度になりうる。このような膨大な数の配列を実際に作製して実験で評価するのは非現実的である。
【0003】
実験を効率的に行うために、計算機上で配列を生成してシミュレーションで評価し、有望な配列だけを実際に作製して実験で評価するという手法が可能である。しかしながら、配列の評価項目は多岐にわたり(結合親和性、粘性、溶解性、免疫原性など)、シミュレーションで評価できるのは評価項目の一部のみである。このため、シミュレーションで高く評価された有望な配列であっても、実際の実験での評価は低く合格基準をクリアできないことが多い。
【0004】
実際の実験での合格基準のクリア率を上げるために、様々な手法が提案されている。
【0005】
特許文献1では、配列のあらかじめ同定した位置に対して突然変異を行い、親和性スコアまたは安定性スコアが向上する配列を選択する。突然変異は網羅的であり、親和性スコアや安定性スコアによる評価は単純なランキングである。
【0006】
特許文献2では、結合領域に関する閾値量が非ヒト抗体と同一で、重鎖および軽鎖フレームワーク領域に関する閾値量がヒト抗体と同一であるアミノ酸配列をGAN(Generative Adversarial Network)で生成する。疎水性アミノ酸が他の疎水性アミノ酸に変更されることに対するペナルティを設けている。
【0007】
特許文献3では、LSTM(Long Short Term Memory)を用いて結合親和性が高い配列を生成するモデルを用いる。アミノ酸の位置や前後関係を用いることが特徴である。
【0008】
また、強化学習を用いる例も知られている。たとえば、配列の結合親和性をシミュレーションで評価し、この評価値がより高くなる配列を出力するように強化学習を行う。ここで、一般的な強化学習では、結合親和性は高いがアミノ酸の構成が似ている配列ばかりを生成してしまう場合がある。構成が似ている配列は特性も似ているので、多数の配列を生成しても実際の実験で全滅する可能性がある。
【0009】
このような問題に対し、非特許文献1では、GFlowNets(Generative Flow Networks)を用い、結合親和性が高い多様な配列を生成することで、全滅を回避している。GFlowNetsは、強化学習の探索においてある状態に至るまでの確率値合計とその状態以降の確率値合計が一致するようにQ関数を学習する点に特徴がある。一般的な強化学習では一定の割引率に応じた単調なQ関数を用いるため、最終的な報酬が高い単一の経路に誘導されやすいが、GFlowNetsでは各状態でより適切な行動価値が得られるため多様なモードからのサンプリングが可能になる。こうして学習したQ関数は、それまでに生成された部分的配列に基づいて、次のアミノ酸候補20種類それぞれについてQ値を計算する。Q値が最も高くなるアミノ酸候補が、次のアミノ酸として選択され、生成される配列に組み込まれる。
【0010】
ここで、常にQ値に従ってアミノ酸を選択すると、その時点のQ関数が低くなるようなアミノ酸が選択されにくくなる。このため、選択されなかったアミノ酸を用いてより良い配列を構成する可能性については見逃されてしまう可能性がある。これを解決するために、GFlowNetsでは一定確率でアミノ酸をランダムに変更する機能(突然変異機能)を有している。
【先行技術文献】
【特許文献】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
N式トータルシステム
3か月前
エムスリー株式会社
媒体
17日前
富士通株式会社
リスクと診断
4か月前
株式会社M-INT
情報処理システム
3か月前
株式会社タカゾノ
作業時間計測システム
3か月前
医療法人社団梅華会
医療の支援装置
1か月前
株式会社サンクスネット
リスク判定システム
1か月前
株式会社日立製作所
情報システム
2か月前
株式会社Smart119
情報処理システム
4か月前
個人
透析医療に関する回答方法及びその装置
1か月前
個人
弾塑性有限要素法におけるデータ同化の演算方法
3か月前
アルケア株式会社
コミュニケーションシステム
1か月前
株式会社JVCケンウッド
表示装置及び表示方法
1か月前
公立大学法人大阪
診断装置
25日前
株式会社グローバルビジョン
検体検査管理システム
1か月前
個人
服薬指導支援システム、及び、服薬指導支援方法
1か月前
公益財団法人がん研究会
画像診断報告書作成システム
3か月前
株式会社バシラックス
零売サービス提供システム
3か月前
ロゴスサイエンス株式会社
ヘルスケアシステムおよびその方法
2か月前
トヨタ自動車株式会社
情報処理装置
2か月前
トヨタ自動車株式会社
情報処理装置
2か月前
株式会社ベーシック
遠隔医療支援システム及びプログラム
18日前
大和ハウス工業株式会社
消費カロリー推定システム
1か月前
個人
プログラムおよび情報処理装置
3か月前
株式会社AIVICK
食品提供装置及びプログラム
3か月前
個人
重症化予測装置、重症化予測方法、及びプログラム
3か月前
株式会社メドレー
プログラム、システム及び方法
1か月前
株式会社Windy
薬局等を活用したオンライン問診システム
3か月前
トヨタ自動車株式会社
画像解析装置
1か月前
日清ファルマ株式会社
提案装置、提案方法及びプログラム
18日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
3か月前
株式会社日立製作所
配列情報処理装置および方法
1か月前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
3日前
大日本印刷株式会社
情報処理システム、及び情報処理方法
2か月前
S&E株式会社
薬品販売システム
4か月前
株式会社トマーレ
透析条件情報共有システム
10日前
続きを見る
他の特許を見る