TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024103502
公報種別公開特許公報(A)
公開日2024-08-01
出願番号2024076311,2021502513
出願日2024-05-09,2019-07-16
発明の名称ニューラルネットワークを使用して倍数性状態を呼び出すための方法およびシステム
出願人ナテラ, インコーポレイテッド
代理人個人,個人,個人,個人,個人,個人
主分類C12Q 1/6858 20180101AFI20240725BHJP(生化学;ビール;酒精;ぶどう酒;酢;微生物学;酵素学;突然変異または遺伝子工学)
要約【課題】ニューラルネットワークを使用して倍数性状態を呼び出す方法の提供。
【解決手段】胎児染色体の倍数性状態を検出するための方法であって、 胎児由来の無細胞DNAと母体由来の無細胞DNAとの混合物を含む妊婦の生体サンプルから無細胞DNAを単離することと、 前記無細胞DNAを解析して、前記生体サンプルの遺伝子配列決定データまたは遺伝子アレイデータを作成することと、及び 前記配列決定データまたは遺伝子アレイデータを、ニューラルネットワークを介して伝播させて、ニューラルネットワークの出力として、胎児染色体の倍数性状態を示す分類情報を獲得することと、を含みここで前記ニューラルネットワークは合成データによる拡張された訓練データを利用して生成され、当該訓練データは(i)複数のケースと(ii)前記複数のケースにおけるセグメントのホモログであるセグメントを含む合成ケースとを含み、前記合成ケースはサブ染色体異常をシミュレーションするように、かつ前記ニューラルネットワークがサブ染色体異数性をより正確に検出することを可能にするよう、前記複数のケースに基づき生成される、方法。
【選択図】なし
特許請求の範囲【請求項1】
胎児染色体の倍数性状態を検出するための方法であって、
胎児由来の無細胞DNAと母体由来の無細胞DNAとの混合物を含む妊婦の生体サンプルから無細胞DNAを単離することと、
前記単離された無細胞DNAから複数の一塩基バリアント(SNV)遺伝子座を増幅することと、
増幅産物を配列決定して、前記複数のSNV遺伝子座の遺伝子配列決定データまたは遺伝子アレイデータを判定することと、
前記複数のSNV遺伝子座の前記配列決定データまたは遺伝子アレイデータをニューラルネットワークを介して伝播させることによって、前記胎児染色体の倍数性状態を呼び出すことと、を含む、方法。
続きを表示(約 3,100 文字)【請求項2】
癌の早期検出のための方法であって、
腫瘍由来の無細胞DNAと正常な組織由来の無細胞DNAとの混合物を含む癌を有することが疑われる対象の生体サンプルから無細胞DNAを単離することと、
前記単離された無細胞DNAから複数の一塩基バリアント(SNV)遺伝子座を増幅することと、
増幅産物を配列決定して、前記複数のSNV遺伝子座の遺伝子配列決定データまたは遺伝子アレイデータを判定することと、
前記複数のSNV遺伝子座の前記配列決定データまたは遺伝子アレイデータをニューラルネットワークを介して伝播させることによって、前記対象の癌状態を呼び出すことと、を含む、方法。
【請求項3】
癌の再発または転移を検出するための方法であって、
腫瘍由来の無細胞DNAと正常な組織由来の無細胞DNAとの混合物を含む癌患者の生体サンプルから無細胞DNAを単離することと、
前記単離された無細胞DNAから複数の一塩基バリアント(SNV)遺伝子座を増幅することと、
増幅産物を配列決定して、前記複数のSNV遺伝子座の遺伝子配列決定データまたは遺伝子アレイデータを判定することと、
前記複数のSNV遺伝子座の前記配列決定データまたは遺伝子アレイデータをニューラルネットワークを介して伝播させることによって、前記対象の癌状態を呼び出すことと、を含む、方法。
【請求項4】
移植拒絶を検出するための方法であって、
ドナー由来の無細胞DNAとレシピエント由来の無細胞DNAとの混合物を含む移植レシピエントの生体サンプルから無細胞DNAを単離することと、
前記単離された無細胞DNAから複数の一塩基バリアント(SNV)遺伝子座を増幅することと、
増幅産物を配列決定して、前記複数のSNV遺伝子座の遺伝子配列決定データまたは遺伝子アレイデータを判定することと、
前記複数のSNV遺伝子座の前記配列決定データまたは遺伝子アレイデータをニューラルを介して伝播させることによって、前記移植レシピエントの移植拒絶状態を呼び出すことと、を含む、方法。
【請求項5】
前記ニューラルネットワークが、それぞれの状態値を呼び出すための1つ以上の層を含み、前記ニューラルネットワークが、複数の重みによって少なくとも部分的に定義される、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記ニューラルネットワークが、
訓練サンプルについて、複数の遺伝子位置に関する遺伝子配列決定データまたは遺伝子アレイデータを判定することと、
前記遺伝子配列決定データまたは遺伝子アレイデータに基づいて、複数の遺伝子セグメントのそれぞれの真の状態値を判定することであって、各遺伝子セグメントがそれぞれ、前記複数の遺伝子位置の少なくともいくつかを含む、判定することと、
それぞれの状態値を呼び出すための1つ以上の層を含むニューラルネットワークを判定することであって、前記ニューラルネットワークが、複数の重みによって少なくとも部分的に定義される、判定することと、
終了条件が満たされるまで前記ニューラルネットワークを反復的に修正することであって、
複数のケースを含むデータのバッチを判定することであって、各ケースが、前記複数の遺伝子セグメントのそれぞれの遺伝子セグメントに対応し、前記それぞれの遺伝子セグメントの1つ以上の位置に関する対立遺伝子頻度を示すデータを含む、判定することと、 前記バッチの前記複数のケースのうちの1つ以上に基づいて、合成ケースを生成し、前記バッチに前記合成ケースを含めて、拡張バッチを生成することと、
前記合成ケースに基づいて、前記真の状態値を拡張することと、
前記ニューラルネットワークを介して前記データのバッチを伝播させて、各ケースに対する1つ以上のそれぞれの状態値を含むネットワーク出力を生成することと、
前記ネットワーク出力に基づいて、前記複数の重みのうちの1つ以上を修正することと、を含む、修正することと、を含む、請求項1~4のいずれか一項に記載の方法。
【請求項7】
前記複数のSNV遺伝子座が、少なくとも10、または少なくとも20、または少なくとも50、または少なくとも100、または少なくとも200、または少なくとも500、または少なくとも1,000、または少なくとも2,000、または少なくとも5,000、または少なくとも10,000のSNV遺伝子座を含む、請求項1~4のいずれか一項に記載の方法。
【請求項8】
前記増幅産物が、少なくとも200、または少なくとも500、または少なくとも1,000、または少なくとも2,000、または少なくとも5,000、または少なくとも10,000、または少なくとも20,000、または少なくとも50,000、または少なくとも100,000のリード深度で配列決定される、請求項1~4のいずれか一項に記載の方法。
【請求項9】
出生前検査を実施する方法であって、
訓練サンプルについて、複数の遺伝子位置に関する遺伝子配列決定データまたは遺伝子アレイデータを決定することと、
前記遺伝子配列決定データまたは遺伝子アレイデータに基づいて、複数の遺伝子セグメントのそれぞれの真の倍数性状態値を判定することであって、各遺伝子セグメントがそれぞれ、前記複数の遺伝子位置の少なくともいくつかを含む、判定することと、
それぞれの倍数性状態値を呼び出すための1つ以上の層を含むニューラルネットワークを判定することであって、前記ニューラルネットワークが、複数の重みによって少なくとも部分的に定義される、判定することと、
終了条件が満たされるまで前記ニューラルネットワークを反復的に修正することであって、
複数のケースを含むデータのバッチを判定することであって、各ケースは、前記複数の遺伝子セグメントのそれぞれの遺伝子セグメントに対応し、前記それぞれの遺伝子セグメントの1つ以上の位置に関する対立遺伝子頻度を示すデータを含む、判定することと、 前記バッチの前記複数のケースのうちの1つ以上に基づいて、合成ケースを生成し、前記バッチに前記合成ケースを含めて、拡張バッチを生成することと、
前記合成ケースに基づいて、前記真の状態値を拡張することと、
前記ニューラルネットワークを介して前記データのバッチを伝播させて、各ケースに対する1つ以上のそれぞれの状態値を含むネットワーク出力を生成することと、
損失値に基づいて、前記複数の重みのうちの1つ以上を修正することと、を含む、修正することと、
妊婦から抽出された血漿を含む試験サンプルを選択することと、
前記試験サンプルについて、前記修正されたニューラルネットワークを介して前記試験サンプルについての遺伝子配列決定データまたは前記試験サンプルについての遺伝子アレイデータを伝播させることによって、標的遺伝子領域についての倍数性状態を呼び出すことと、を含む、方法。
【請求項10】
前記訓練サンプルが、遺伝子配列決定データを使用して表される血漿サンプルを含む、請求項9に記載の方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年7月17日に出願された米国仮出願第62/699,135号に対する優先権を主張し、この仮出願は、参照によりその全体が本明細書に組み込まれる。
続きを表示(約 5,700 文字)【背景技術】
【0002】
胚性染色体異常を検出することは、胚または胎児の健康を判定するのに有用であり得る。例えば、胚の健康は、体外受精(IVF)プロセスを介して、着床の前に、全体的な染色体異数性または局所的な異数性を含む異数性を検出することによって決定することができるか、または異数性の観点から胎児の健康は、非侵襲的な出生前検査(NIPT)を使用して決定することができる。しかしながら、従来の技術を用いてそのような異数性を検出することは困難である可能性があり、異数性の位置に関し粒度を有してそのような異数性を検出することは困難である可能性がある。本開示は、とりわけ、正確に、胚および胎児の異数性を呼び出すことと、染色体の特定のセグメントについて、胚および胎児の異数性を呼び出すこととを提供する改善されたシステムおよび方法を記載する。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本明細書に記載されるシステムおよび方法の少なくともいくつかは、ニューラルネットワークを使用して胚または胎児異数性を呼び出すことに関する。ニューラルネットワークは、注釈付きデータについて訓練されて、胚サンプルの倍数性状態を正確に呼び出すことができ、したがって、胚の健康に関する洞察を提供する。本明細書におけるシステムおよび方法は、染色体の小さなセグメントに特異的な異数性を含む配列および配列決定データの両方から、胚および胎児における異数性の改善された検出、位置および分類を提供することができ、より大きな倍数性領域を分類することに加えて、倍数性状態による各ゲノム位置の分類を提供することができる。本明細書に記載されるシステムおよび方法は、その全体が本明細書に組み込まれる、出版物Deep Learning(Adaptive Computation and Machine Learning)、Ian Goodfellow、Yoshua Bengio、Aaron Courville、MIT Press(2016年11月18日)に記載されるもののいずれかのような、深層学習または機械学習プロセスを実装してもよい。
【課題を解決するための手段】
【0004】
本明細書に記載されるシステムおよび方法は、多くの条件について試験することに使用され得る、改善された非侵襲的な出生前試験を提供して、胎児がダウン症候群、エドワーズ症候群、またはターナー症候群などの何らかの全体的な染色体異常を有するかどうかを決定すること、胎児がモザイク、欠失症候群、または重複などの何らかの部分的な染色体異常を有するかどうかを決定すること、あるいは1つまたは複数の遺伝子座、例えば、単一一塩基多型(SNP)にリンクした疾患についての胎児の遺伝子型を決定することができる。さらに、本明細書に記載されるシステムおよび方法は、改善された着床前遺伝子診断(PGD)を提供することができる。PGDは、異数性のような染色体異常を検出することができ、着床の成功および健康な赤子を確実にするために使用され得る。PGDは、遺伝子疾患スクリーニングのために訴えることもできる。
【0005】
本明細書に記載されるいくつかの実施形態は、ニューラルネットワークを訓練し、それを用いることによって染色体セグメントの倍数性状態を呼び出し、シミュレートするためのシステムおよび方法を対象とする。呼び出される染色体セグメントは、血漿混合物およびゲノムサンプルから得られた標的配列決定またはアレイデータによって表される。本明細書に記載されるニューラルネットワーク訓練方法は、全体的な染色体異数性呼び出しおよびサブ染色体レベルに存在する異数性呼び出しを対象とする。本方法は、既存のアルゴリズムを改善し、ニューラルネットワークがゲノム位置バイアスを学習し、訓練パイプラインを変更することによってノイズに堅牢性および不変性を加えることを可能にする。集団中の共通の相同体の存在を最初に捕捉することによって現実的なセグメント倍数性状態をシミュレートするためのシステムが教示され、訓練されたニューラルネットワークが染色体構造中の小さな微小欠失のような欠失を呼び出すことを可能にする訓練データを拡張するために用いられる。試験サンプルは、遺伝的異常の検出を含む、試験サンプルの特徴を決定するために、ニューラルネットワークを通過することができる。
【0006】
いくつかの実施態様において、ニューラルネットワークは、胚遺伝子データに加えて、母系遺伝子データおよび父系遺伝子データについての遺伝子データを入力とする。遺伝子データは、例えば、任意のタイプのDNAもしくはRNAの鎖もしくはフラグメント、またはそれらから導出されたデータのリードまたは配列決定であってもよい。ニューラルネットワークは、胚、母系、および父系の遺伝子データを含む訓練データを使用して開発することができ、そのようなデータを利用することによって、胚サンプルの倍数性状態を正確に呼び出すことができる。本明細書で使用される場合、用語「倍数性状態」は、正倍数体または異数性である遺伝子セグメントまたは染色体の分類を指すことができ、特定の異数性を提示する遺伝子セグメントまたは染色体を指すことができる。いくつかの実施態様において、ニューラルネットワークは、1つ以上の合成ケースを含む拡張データを使用して訓練される。例えば、拡張データは、訓練データに含まれる2つの他の遺伝子セグメントを組み合わせることによって生成される遺伝子情報を含んでもよく、または訓練データに含まれる遺伝子セグメント内の欠失をシミュレートすることによって生成される遺伝子情報を含んでもよい。合成ケースは、特に異数性を含むように生成されてもよく、「真」または既知の値のセット(例えば、手動注釈によって決定された)は、合成ケースを考慮するように更新されてもよい。訓練における合成ケースの使用は、いくつかの他の技法よりもはるかに効率的かつ正確に、サブ染色体異数性呼び出すことが容易に可能なニューラルネットワークを提供することができる。
【0007】
したがって、一態様において、本開示は、出生前試験を実施する方法であって、訓練サンプルについて、複数の遺伝子位置に関する遺伝子配列決定データまたは遺伝子アレイデータを判定することと、遺伝子配列決定データまたは遺伝子アレイデータに基づいて、複数の遺伝子セグメントのそれぞれの真の倍数性状態値を判定することであって、各遺伝子セグメントがそれぞれ、複数の遺伝子位置の少なくともいくつかを含む、判定することと、それぞれの倍数性状態値を呼び出すための1つ以上の層を含むニューラルネットワークを判定することであって、ニューラルネットワークは、複数の重みによって少なくとも部分的に定義される、判定することと、を含む、方法を提供する。本方法は、さらに、終了条件が満たされるまで、ニューラルネットワークを反復的に修正することを含み、修正することは、複数のケースを含むデータのバッチを判定することであって、各ケースは、複数の遺伝子セグメントのそれぞれの遺伝子セグメントに対応し、それぞれの遺伝子セグメントの1つ以上の位置に関する対立遺伝子頻度を示すデータを含む、判定することと、バッチの複数のケースのうちの1つ以上に基づいて、合成ケースを生成し、バッチに合成ケースを含めて、拡張バッチを生成することと、合成ケースに基づいて、真の状態値を拡張することと、ニューラルネットワークを介してデータのバッチを伝播させて、各ケースに対する1つ以上のそれぞれの状態値を含むネットワーク出力を生成することと、損失値に基づいて、複数の重みのうちの1つ以上を修正することと、を含む。本方法は、さらに、妊婦から抽出された血漿を含む試験サンプルを選択することと、試験サンプルについて、修正されたニューラルネットワークを介して試験サンプルについての遺伝子配列決定データまたは試験サンプルについての遺伝子アレイデータを伝播させることによって、標的遺伝子領域についての倍数性状態を呼び出すことと、を含む。
【0008】
別の態様において、本開示は、着床前遺伝子スクリーニングを実施する方法であって、訓練サンプルについて、複数の遺伝子位置に関する遺伝子配列決定データまたは遺伝子アレイデータを判定することと、遺伝子配列決定データまたは遺伝子アレイデータに基づいて、複数の遺伝子セグメントのそれぞれの真の倍数性状態値を判定することであって、各遺伝子セグメントがそれぞれ、複数の遺伝子位置の少なくともいくつかを含む、判定することと、それぞれの倍数性状態値を呼び出すための1つ以上の層を含むニューラルネットワークを判定することであって、ニューラルネットワークは、複数の重みによって少なくとも部分的に定義される、判定することと、を含む、方法を提供する。本方法は、さらに、終了条件が満たされるまで、ニューラルネットワークを反復的に修正することを含み、修正することは、複数のケースを含むデータのバッチを判定することであって、各ケースは、複数の遺伝子セグメントのそれぞれの遺伝子セグメントに対応し、それぞれの遺伝子セグメントの1つ以上の位置に関する対立遺伝子頻度を示すデータを含む、判定することと、バッチの複数のケースのうちの1つ以上に基づいて、合成ケースを生成し、バッチに合成ケースを含めて、拡張バッチを生成することと、合成ケースに基づいて、真の状態値を拡張することと、ニューラルネットワークを介してデータのバッチを伝播させて、各ケースに対する1つ以上のそれぞれの状態値を含むネットワーク出力を生成することと、損失値に基づいて、複数の重みのうちの1つ以上を修正することと、を含む。モデルは、さらに、胚から試験サンプルを選択することと、試験サンプルについて、修正されたニューラルネットワークを介して試験サンプルについての遺伝子配列決定データまたは試験サンプルについての遺伝子アレイデータを伝播させることによって、標的遺伝子領域についての倍数性状態を呼び出すことと、を含む。
【0009】
別の態様において、本開示は、ニューラルネットワークを使用して倍数性状態を呼び出す方法を提供する。本方法は、訓練サンプルについて、複数の遺伝子位置に関する遺伝子配列決定データまたは遺伝子アレイデータを判定することと、遺伝子配列決定データまたは遺伝子アレイデータに基づいて、複数の遺伝子セグメントのそれぞれの真の倍数性状態値を判定することであって、各遺伝子セグメントがそれぞれ、複数の遺伝子位置の少なくともいくつかを含む、判定することと、それぞれの倍数性状態値を呼び出すための1つ以上の層を含むニューラルネットワークを判定することであって、ニューラルネットワークは、複数の重みによって少なくとも部分的に定義される、判定することと、を含む。本方法は、さらに、終了条件が満たされるまでニューラルネットワークを反復的に修正することを含み、修正することは、複数のケースを含むデータのバッチを判定することであって、各ケースは、複数の遺伝子セグメントのそれぞれの遺伝子セグメントに対応し、それぞれの遺伝子セグメントの1つ以上の位置に関する対立遺伝子頻度を示すデータを含む、判定することと、ニューラルネットワークを介してデータのバッチを伝播させて、各ケースに対する1つ以上のそれぞれの倍数性状態値を含むネットワーク出力を生成することと、損失関数および真の倍数性状態値を使用して、1つ以上のそれぞれの倍数性状態値に基づいて、1つ以上の損失値を判定することと、損失値に基づいて、複数の重みのうちの1つ以上を修正することと、を含む。本方法は、さらに、試験サンプルについて、修正されたニューラルネットワークを介して試験サンプルについての遺伝子配列決定データまたは試験サンプルについての遺伝子アレイデータを伝播させることによって、標的遺伝子領域についての倍数性状態を呼び出すことを含む。
【0010】
別の態様において、本開示は、拡張データを使用してニューラルネットワークを訓練する方法であって、訓練サンプルについて、複数の遺伝子位置に関する遺伝子配列決定データまたは遺伝子アレイデータを判定することと、遺伝子配列決定データまたは遺伝子アレイデータに基づいて、複数の遺伝子セグメントのそれぞれの真の状態値を判定することであって、各遺伝子セグメントがそれぞれ、複数の遺伝子位置の少なくともいくつかを含む、判定することと、それぞれの状態値を呼び出すための1つ以上の層を含むニューラルネットワークを判定することであって、ニューラルネットワークは、複数の重みによって少なくとも部分的に定義される、判定することと、を含む。本方法は、さらに、終了条件が満たされるまでニューラルネットワークを反復的に修正することを含み、修正することは、複数のケースを含むデータのバッチを判定することであって、各ケースは、複数の遺伝子セグメントのそれぞれの遺伝子セグメントに対応し、それぞれの遺伝子セグメントの1つ以上の位置に関する対立遺伝子頻度を示すデータを含む、判定することと、バッチの複数のケースのうちの1つ以上に基づいて、合成ケースを生成し、バッチに合成ケースを含めることと、ニューラルネットワークを介してデータのバッチを伝播させて、各ケースに対する1つ以上のそれぞれの状態値を含むネットワーク出力を生成することと、を含む。
本方法は、さらに、ネットワーク出力に基づいて、複数の重みのうちの1つ以上を修正することを含む。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許