TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025016802
公報種別
公開特許公報(A)
公開日
2025-02-04
出願番号
2024199009,2021568087
出願日
2024-11-14,2020-05-13
発明の名称
モデルベースの特徴量化および分類
出願人
グレイル リミテッド ライアビリティ カンパニー
代理人
弁理士法人谷・阿部特許事務所
主分類
G16B
40/00 20190101AFI20250128BHJP(特定の用途分野に特に適合した情報通信技術)
要約
【課題】核酸試料から疾患状態を予測するためのモデルベースの特徴量化および分類器を提供する。
【解決手段】様々な実施形態においては、解析システムは、疾患状態の特徴量および分類を決定するために、モデルを使用する。疾患状態は、がんの有無、がんタイプ、またはがん原発組織を示すことができる。モデルは、バイナリ分類器と、原発組織分類器とを含むことができる。解析システムは、分類器を訓練するためのデータを生成するために、試験生物試料からの配列リードを処理することができる。解析システムは、多層パーセプトロンを含むことができる、モデルを訓練するための機械学習技法の組み合わせも使用することができる。いくつかの実施形態においては、解析システムは、疾患状態に関する予測を決定するためのモデルを訓練するために、メチル化情報を使用する。
【選択図】図1
特許請求の範囲
【請求項1】
特徴量を生成するために配列リードを解析することによって、試験試料中のがんシグナルを識別するための方法であって、
複数の配列リードを、試験試料から取得するステップと、
第1の疾患状態と関連付けられた第1の確率モデルを前記試験試料の各配列リードに適用して、前記配列リードが前記第1の疾患状態と関連付けられる第1の確率を出力するステップであって、前記第1の確率モデルは、前記第1の疾患状態と関連付けられた1つまたは複数の試料から導出された第1の複数の参照配列リードで訓練される、ステップと、
第2の疾患状態と関連付けられた第2の確率モデルを前記試験試料の各配列リードに適用して、前記配列リードが前記第2の疾患状態と関連付けられる第2の確率を出力するステップであって、前記第2の確率モデルは、前記第2の疾患状態と関連付けられた1つまたは複数の試料から導出された第2の複数の参照配列リードで訓練される、ステップと、
前記試験試料についての特徴ベクトルを、前記第1の確率および前記第2の確率に基づいて決定するステップと、
訓練されたがん分類器を、前記試験試料についての前記特徴ベクトルに適用して、前記試験試料ががんシグナルを有する可能性を予測するステップと
を含む方法。
続きを表示(約 1,500 文字)
【請求項2】
前記第1の疾患状態は、がんであり、前記第2の疾患状態は、非がんである請求項1に記載の方法。
【請求項3】
前記第1の疾患状態は、第1のタイプのがんであり、前記第2の疾患状態は、第2のタイプのがんであり、前記第1のタイプのがんと前記第2のタイプのがんは、異なる請求項1に記載の方法。
【請求項4】
前記方法は、
複数の参照配列リードを、第3、第4、第5、第6、第7、第8、第9、および/または第10の参照試料から取得するステップであって、前記第3、第4、第5、第6、第7、第8、第9、および/または第10の参照試料の各々は、異なる疾患状態を有し、前記異なる疾患状態の各々は、異なるタイプのがんである、ステップと、
前記第3、第4、第5、第6、第7、第8、第9、および/または第10の複数の参照配列リードを使用して、第3、第4、第5、第6、第7、第8、第9、および/または第10の確率モデルを訓練するステップであって、前記第3、第4、第5、第6、第7、第8、第9、および/または第10の確率モデルの各々は、各々が、異なるタイプのがんと関連付けられる、ステップと
をさらに含む請求項1に記載の方法。
【請求項5】
前記がんまたはがんのタイプは、乳がん、子宮がん、子宮頸がん、卵巣がん、膀胱がん、腎盂および尿管の尿路上皮がん、尿路上皮以外の腎臓がん、前立腺がん、肛門直腸がん、結腸直腸がん、食道の扁平上皮がん、扁平上皮以外の食道がん、胃がん、肝細胞から生じた肝胆がん、肝細胞以外の細胞から生じた肝胆がん、膵がん、ヒトパピローマウイルスと関連付けられた頭頸部がん、ヒトパピローマウイルスと関連付けられない頭頸部がん、肺腺癌、小細胞肺がん、腺癌または小細胞肺がん以外の扁平上皮肺がんおよび肺がん、神経内分泌がん、黒色腫、甲状腺がん、肉腫、多発性骨髄腫、リンパ腫、ならびに白血病を含む群から選択される請求項2乃至4のいずれか一項に記載の方法。
【請求項6】
前記がんタイプは、脳腫瘍、外陰がん、膣がん、精巣がん、胸膜の中皮腫、腹膜の中皮腫、および胆嚢がんを含む群からさらに選択される請求項5に記載の方法。
【請求項7】
前記第1の疾患状態は、第1の原発組織を含み、前記第2の疾患状態は、第2の原発組織を含む請求項1に記載の方法。
【請求項8】
前記第1の原発組織または前記第2の原発組織は、乳房組織、甲状腺組織、肺組織、膀胱組織、子宮頸部組織、小腸組織、結腸直腸組織、食道組織、胃組織、扁桃組織、肝臓組織、卵巣組織、卵管組織、膵臓組織、前立腺組織、腎臓組織、および子宮組織を含む群から選択される請求項7に記載の方法。
【請求項9】
前記第1の原発組織または前記第2の原発組織は、脳組織および細胞、内分泌組織および細胞、血管内皮組織および細胞、頭頸部組織および細胞、膵外分泌組織および細胞、膵内分泌組織および細胞、リンパ組織および細胞、間葉組織および細胞、骨髄組織および細胞、胸膜組織および細胞、筋肉組織および細胞、骨髄組織および細胞、脂肪組織および細胞、胆嚢組織および細胞を含む群からさらに選択される請求項8に記載の方法。
【請求項10】
前記第1の確率モデルまたは前記第2の確率モデルは、定数モデル、二項モデル、独立サイトモデル、ニューラルネットモデル、またはマルコフモデルである請求項1に記載の方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、一般に、核酸試料から疾患状態を予測するためのモデルベースの特徴量化および分類器に関する。
続きを表示(約 4,200 文字)
【背景技術】
【0002】
DNAメチル化は、遺伝子発現を調節する役割を果たす。がんを含む多くの疾患プロセスには、異常なDNAメチル化が関与している。メチル化シーケンシング(たとえば、全ゲノムバイサルファイトシーケンシング(WGBS)を使用したDNAメチル化プロファイリングは、がんの検出、診断、および/またはモニタリングのための有益な診断ツールとして、ますます認識されるようになっている。たとえば、異なるメチル化を施された領域の特定のパターンは、様々な疾患状態のための分子マーカとして有用であり得る。
【先行技術文献】
【特許文献】
【0003】
国際公開2010/037001号パンフレット
国際公開2011/127136号パンフレット
米国特許出願公開第2019/0287652号明細書
米国特許出願第16/352,602号明細書
国際公開第2019/195268号パンフレット
PCT/米国特許出願公開第2019/053509号明細書
PCT/米国特許出願公開第2020/015082号明細書
【非特許文献】
【0004】
Clinical Trial.gov 識別子:NCT02889978(https://www.clinicaltrials.gov/ct2/show/NCT02889978)
Clinical Trail.gov 識別子:NCT03085888(//clinicaltrials.gov/ct2/show/NCT03085888)
2020年3月30日にオンラインで公開された(https://www.annalsofoncology.org/article/S0923-7534(20)36058-0/fulltext)、「Sensitive and specific multi-cancer detection and localization using methylation signatures in cell-free DNA」と題するAnnals of Oncologyジャーナル記事
Riedmiller M, Braun H. RPROP - A Fast Adaptive Learning Algorithm. Proceedings of the International Symposium on Computer and Information Science VII, 1992
【発明の概要】
【0005】
本明細書においては、核酸試料を使用した、特徴量の生成のための、ならびに/または疾患状態(たとえば、がんの有無、がんタイプ、および/もしくはがん原発組織)の分類のためのモデルを訓練および適用するための方法が開示される。一態様においては、本開示は、複数の特徴量を生成するために、配列リードを解析するための方法であって、第1の複数の参照配列リードを、第1の参照試料から生成するステップであって、第1の試料は、第1の疾患状態を有する対象からのものである、ステップと、第2の複数の参照配列リードを、第2の参照試料から生成するステップであって、第2の試料は、第2の疾患状態を有する対象からのものである、ステップと、第1の複数の参照配列リードを使用して、第1の確率モデルを訓練するステップであって、第1の確率モデルは、第1の疾患状態と関連付けられる、ステップと、第2の複数の参照配列リードを使用して、第2の確率モデルを訓練するステップであって、第2の確率モデルは、第2の疾患状態と関連付けられる、ステップと、複数の訓練配列リードを、訓練試料から生成するステップであって、複数の訓練配列リードのうちの各配列リードについて、第1の確率値を決定するために、配列リードを第1の確率モデルに適用し、第1の確率値は、配列リードが、第1の疾患状態と関連付けられた試料に由来する確率であり、第2の確率値を決定するために、配列リードを第2の確率モデルに適用し、第2の確率値は、配列リードが、第2の疾患状態と関連付けられた試料に由来する確率である、ステップと、各配列リードについて、第1の確率値と第2の確率値とを比較することによって、1つまたは複数の特徴量を識別するステップとを含む方法を提供する。
【0006】
別の態様においては、本開示は、コンピュータプロセッサと、メモリとを備える、システムを提供し、メモリは、コンピュータプロセッサによって実行されたときに、第1の参照試料からの第1の複数の参照配列リードにアクセスするステップであって、第1の試料は、第1の疾患状態を有する対象からのものである、ステップと、第2の参照試料からの第2の複数の参照配列リードにアクセスするステップであって、第2の試料は、第2の疾患状態を有する対象からのものである、ステップと、第1の複数の参照配列リードを使用して、第1の確率モデルを訓練するステップであって、第1の確率モデルは、第1の疾患状態と関連付けられる、ステップと、第2の複数の参照配列リードを使用して、第2の確率モデルを訓練するステップであって、第2の確率モデルは、第2の疾患状態と関連付けられる、ステップと、訓練試料からの複数の訓練配列リードにアクセスするステップであって、複数の訓練配列リードのうちの各配列リードについて、第1の確率値を決定するために、配列リードを第1の確率モデルに適用し、第1の確率値は、配列リードが、第1の疾患状態と関連付けられた試料に由来する確率であり、第2の確率値を決定するために、配列リードを第2の確率モデルに適用し、第2の確率値は、配列リードが、第2の疾患状態と関連付けられた試料に由来する確率である、ステップと、各配列リードについて、第1の確率値と第2の確率値とを比較することによって、1つまたは複数の特徴量を識別するステップとを含むステップをプロセッサに実行させる、コンピュータプログラム命令を記憶する。
【0007】
別の態様においては、本開示は、1つまたは複数のプロセッサによって実行されたときに、第1の参照試料からの第1の複数の参照配列リードにアクセスするステップであって、第1の試料は、第1の疾患状態を有する対象からのものである、ステップと、第2の参照試料からの第2の複数の参照配列リードにアクセスするステップであって、第2の試料は、第2の疾患状態を有する対象からのものである、ステップと、第1の複数の参照配列リードを使用して、第1の確率モデルを訓練するステップであって、第1の確率モデルは、第1の疾患状態と関連付けられる、ステップと、第2の複数の参照配列リードを使用して、第2の確率モデルを訓練するステップであって、第2の確率モデルは、第2の疾患状態と関連付けられる、ステップと、訓練試料からの複数の訓練配列リードにアクセスするステップであって、複数の訓練配列リードのうちの各配列リードについて、第1の確率値を決定するために、配列リードを第1の確率モデルに適用し、第1の確率値は、配列リードが、第1の疾患状態と関連付けられた試料に由来する確率であり、第2の確率値を決定するために、配列リードを第2の確率モデルに適用し、第2の確率値は、配列リードが、第2の疾患状態と関連付けられた試料に由来する確率である、ステップと、各配列リードについて、第1の確率値と第2の確率値とを比較することによって、1つまたは複数の特徴量を識別するステップとを含むステップを1つまたは複数のプロセッサに実行させる命令を含む非一時的コンピュータ可読媒体を提供する。
【0008】
いくつかの実施形態においては、第1の疾患状態は、がんであり、第2の疾患状態は、非がんである。いくつかの実施形態においては、第1の疾患状態は、第1のタイプのがんであり、第2の疾患状態は、第2のタイプのがんであり、第1のタイプのがんと第2のタイプのがんは、異なる。
【0009】
いくつかの実施形態においては、方法、システム、または非一時的コンピュータ可読媒体は、複数の参照配列リードを、第3、第4、第5、第6、第7、第8、第9、および/または第10の参照試料から生成するステップであって、第3、第4、第5、第6、第7、第8、第9、および/または第10の参照試料の各々は、異なる疾患状態を有し、異なる疾患状態の各々は、異なるタイプのがんである、ステップと、第3、第4、第5、第6、第7、第8、第9、および/または第10の複数の参照配列リードを使用して、第3、第4、第5、第6、第7、第8、第9、および/または第10の確率モデルを訓練するステップであって、第3、第4、第5、第6、第7、第8、第9、および/または第10の確率モデルの各々は、各々が、異なるタイプのがんと関連付けられる、ステップとをさらに含む。
【0010】
いくつかの実施形態においては、がんまたはがんのタイプは、乳がん、子宮がん、子宮頸がん、卵巣がん、膀胱がん、腎盂および尿管の尿路上皮がん、尿路上皮以外の腎臓がん、前立腺がん、肛門直腸がん、結腸直腸がん、食道の扁平上皮がん、扁平上皮以外の食道がん、胃がん、肝細胞から生じた肝胆道がん、肝細胞以外の細胞から生じた肝胆膵がん、膵がん、ヒトパピローマウイルスと関連付けられた頭頸部がん、ヒトパピローマウイルスと関連付けられない頭頸部がん、肺腺癌、小細胞肺がん、腺癌または小細胞肺がん以外の扁平上皮肺がんおよび肺がん、神経内分泌がん、黒色腫、甲状腺がん、肉腫、多発性骨髄腫、リンパ腫、ならびに白血病を含む群から選択される。いくつかの実施形態においては、がんタイプは、脳腫瘍、外陰がん、膣がん、精巣がん、胸膜の中皮腫、腹膜の中皮腫、および胆嚢がんを含む群からさらに選択される。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
抗体パスポート
4か月前
個人
N式トータルシステム
2か月前
個人
自動車乗員の健康管理システム
5か月前
エムスリー株式会社
媒体
9日前
株式会社Y4.com
情報処理装置
4か月前
富士通株式会社
リスクと診断
3か月前
株式会社M-INT
情報処理システム
2か月前
株式会社I.W.G
医療支援システム
5か月前
株式会社タカゾノ
作業時間計測システム
3か月前
医療法人社団梅華会
医療の支援装置
1か月前
住友化学株式会社
組成提案システム
5か月前
株式会社日立製作所
情報システム
2か月前
個人
透析医療に関する回答方法及びその装置
1か月前
富士通株式会社
介入方法及び介入プログラム
6か月前
株式会社Smart119
情報処理システム
3か月前
株式会社サンクスネット
リスク判定システム
1か月前
アルケア株式会社
コミュニケーションシステム
1か月前
個人
弾塑性有限要素法におけるデータ同化の演算方法
3か月前
株式会社JVCケンウッド
表示装置及び表示方法
1か月前
公立大学法人大阪
診断装置
17日前
株式会社グローバルビジョン
検体検査管理システム
1か月前
株式会社BiPSEE
情報処理装置及びプログラム
6か月前
公益財団法人がん研究会
画像診断報告書作成システム
3か月前
個人
服薬指導支援システム、及び、服薬指導支援方法
1か月前
ロゴスサイエンス株式会社
ヘルスケアシステムおよびその方法
2か月前
トヨタ自動車株式会社
情報処理装置
2か月前
トヨタ自動車株式会社
情報処理装置
2か月前
株式会社ミラボ
スケジュール案内装置、及びプログラム
5か月前
株式会社バシラックス
零売サービス提供システム
3か月前
ロゴスサイエンス株式会社
ヘルスケアシステムおよびその方法
4か月前
TIS株式会社
処方箋管理システム
4か月前
日清食品ホールディングス株式会社
シニアの健康状態の改善方法
5か月前
株式会社ベーシック
遠隔医療支援システム及びプログラム
10日前
個人
プログラムおよび情報処理装置
3か月前
大和ハウス工業株式会社
消費カロリー推定システム
1か月前
株式会社AIVICK
食品提供装置及びプログラム
3か月前
続きを見る
他の特許を見る