TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025016639
公報種別
公開特許公報(A)
公開日
2025-02-04
出願番号
2024191291,2023512747
出願日
2024-10-31,2021-08-20
発明の名称
配列生成および予測のための方法およびシステム
出願人
リジェネロン・ファーマシューティカルズ・インコーポレイテッド
,
REGENERON PHARMACEUTICALS, INC.
代理人
個人
,
個人
,
個人
,
個人
主分類
G16B
40/20 20190101AFI20250128BHJP(特定の用途分野に特に適合した情報通信技術)
要約
【課題】制御配列を生成し、かつ、予測するコンピュータ実装方法を提供する。
【解決手段】方法は、第一の複数のヌクレオチド配列の各配列が、関連発現スコアを有する少なくとも一つの転写開始点(TSS)を含む遺伝的データを受信することと、コアプロモーターとして標識された第二の複数のヌクレオチド配列を決定することと、閾値を満たす関連発現スコアに基づき、第二の複数のヌクレオチド配列から第三の複数のヌクレオチド配列を決定することと、第三の複数のヌクレオチド配列に基づいて、コアプロモーターではないとして標識された第四の複数のヌクレオチド配列を生成することと、コアプロモーターとして標識された第三の複数のヌクレオチド配列およびコアプロモーターではないとして標識された第四の複数のヌクレオチド配列に基づいて、訓練データセットを生成し、訓練データセットに基づいて、生成モデルを訓練し、生成モデルを出力することと、を含む。
【選択図】図19
特許請求の範囲
【請求項1】
遺伝的データをコンピュータにより受信することであって、前記遺伝的データは、第一の複数のヌクレオチド配列を含み、前記複数のヌクレオチド配列の各ヌクレオチド配列は、関連発現スコアを有する少なくとも一つの転写開始点(TSS)を含む、受信することと、
前記第一の複数のヌクレオチド配列に基づいて、コアプロモーターとして標識された第二の複数のヌクレオチド配列をコンピュータにより決定することと、
閾値を満たす前記関連発現スコアに基づいて、前記第二の複数のヌクレオチド配列から第三の複数のヌクレオチド配列をコンピュータにより決定することと、
前記第三の複数のヌクレオチド配列に基づいて、コアプロモーターではないとして標識された第四の複数のヌクレオチド配列をコンピュータにより生成することと、
コアプロモーターとして標識された前記第三の複数のヌクレオチド配列およびコアプロモーターではないとして標識された前記第四の複数のヌクレオチド配列に基づいて、訓練データセットをコンピュータにより生成することと、
前記訓練データセットに基づいて、生成モデルをコンピュータにより訓練することと、
前記生成モデルをコンピュータにより出力することと、を含む、コンピュータ実装方法。
続きを表示(約 2,300 文字)
【請求項2】
前記第一の複数のヌクレオチド配列に基づいて、コアプロモーターとして標識された前記第二の複数のヌクレオチド配列をコンピュータにより決定することが、
閾値を満たす前記関連発現スコアに基づいて、前記第一の複数のヌクレオチド配列から複数のTSSをコンピュータにより決定することと、
前記複数のTSSに基づいて、複数のサミットヌクレオチド塩基をコンピュータにより決定することと、
前記複数のサミットヌクレオチド塩基の各サミットヌクレオチド塩基について、関連する複数の周辺塩基をコンピュータにより決定することと、
各サミットヌクレオチド塩基および前記関連する複数の周辺塩基を、コアプロモーターとして標識された前記第二の複数のヌクレオチド配列としてコンピュータにより保存することと、を含む、請求項1に記載の方法。
【請求項3】
前記複数のTSSに基づいて、前記複数のサミットヌクレオチド塩基をコンピュータにより決定することは、前記複数のTSSのそれぞれについて、最強の遺伝子発現のキャップ解析(CAGE)シグナルを有するヌクレオチド塩基をコンピュータにより決定することを含む、請求項2に記載の方法。
【請求項4】
前記複数のサミットヌクレオチド塩基の各サミットヌクレオチド塩基について、前記関連する複数の周辺塩基をコンピュータにより決定することが、前記複数のサミットヌクレオチド塩基の各サミットヌクレオチド塩基について、5’方向の第一の複数のヌクレオチド塩基および3’方向の第二の複数のヌクレオチド塩基をコンピュータにより決定することを含む、請求項2に記載の方法。
【請求項5】
5’方向の前記第一の複数のヌクレオチド塩基が49個のヌクレオチド塩基を含み、3’方向の前記第二の複数のヌクレオチド塩基が50個のヌクレオチド塩基を含む、請求項4に記載の方法。
【請求項6】
前記第三の複数のヌクレオチド配列に基づいて、コアプロモーターではないとして標識された前記第四の複数のヌクレオチド配列をコンピュータにより生成することが、
前記第三の複数のヌクレオチド配列の各ヌクレオチド配列について、関連する複数のシフト塩基をコンピュータにより決定することと、
コアプロモーターではないとして標識された第四の複数のヌクレオチド配列として、各関連する複数のシフト塩基をコンピュータにより保存することと、を含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記第三の複数のヌクレオチド配列の各ヌクレオチド配列について、前記関連する複数のシフト塩基をコンピュータにより決定することが、前記第三の複数のヌクレオチド配列の各ヌクレオチド配列から、ある量のヌクレオチド塩基をコンピュータによりシフトさせることを含み、前記ヌクレオチド塩基の前記量は、前記第三の複数のヌクレオチド配列と類似のクロマチンランドスケープを持たせるのに十分近い距離を保つことと、その一方で、近隣にある調節要素を拾わない程度に十分に離れていることとのバランスを表す、請求項6に記載の方法。
【請求項8】
前記訓練データセットに基づいて、前記生成モデルをコンピュータにより訓練することが、
前記訓練データセットの各ヌクレオチド配列について、複数のシード配列および標的ヌクレオチド対をコンピュータにより生成することであって、各シード配列および標的ヌクレオチド対は、定義された長さを有するシード配列、および所定のヌクレオチド配列上の前記シード配列の直後に標的ヌクレオチドを含む、生成することと、
前記複数のシード配列および標的ヌクレオチド対の各シード配列および標的ヌクレオチド対をコンピュータによりベクター化することと、
前記ベクター化されたシード配列および標的ヌクレオチド対に基づいて、前記生成モデルをコンピュータにより訓練することと、を含む、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記訓練データセットの各ヌクレオチド配列について、前記複数のシード配列および標的ヌクレオチド対をコンピュータにより生成することが、
前記関連発現スコアに基づいて、前記複数のTSSをコンピュータによりクラスタリングすることと、
TSSの各クラスターについて、四分位幅をコンピュータにより決定することと、
前記四分位幅に基づいて、各TSSをシャープTSSまたはブロードTSSとしてコンピュータにより標識することと、
シャープTSSまたはブロードTSS標識に基づいて、前記訓練データセット中の前記ヌクレオチド配列をシャープTSS群またはブロードTSS群にコンピュータにより分割することと、
前記定義された長さで、定義された工程サイズを有するスライディングウィンドウを、各ヌクレオチド配列にコンピュータにより適用することと、
前記スライディングウィンドウの各工程で、シード配列および標的ヌクレオチド対をコンピュータにより保存することと、を含む、請求項8に記載の方法。
【請求項10】
前記複数のシード配列および標的ヌクレオチド対の各シード配列および標的ヌクレオチド対をコンピュータによりベクター化することは、各ヌクレオチドをそれぞれの番号としてコンピュータによりコード化することを含む、請求項8に記載の方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【背景技術】
【0001】
関連出願の相互参照
本出願は、2020年8月21日に出願された米国仮特許出願第63/068,654号の出願日における優先権の利益を主張するものである。これ以前の出願の内容は、参照によりその全体が本明細書に組み込まれる。
続きを表示(約 3,700 文字)
【0002】
配列表への参照
2021年8月20日に提出された配列表は、2021年8月20日に「37595_0033P1_Sequence_Listing.txt」というファイル名のテキストファイル(サイズ2,805バイト)として作成されたものであり、連邦規則法典第37巻特許法第1.52条(e)(5)に従い、本明細書において参照により援用されている。
【0003】
アデノ随伴ウイルス(AAV)は、遺伝子治療において導入遺伝子の送達のためのゴールドスタンダードである。免疫原性が低く感染性が強いなど、多くの利点を提供する一方で、一つの制限は、その厳密なDNAパッケージング能力である。多くの治療法がすでにこの限界に近づいている。組換えAAVベクターにコードされた他の特徴とともに、これは制御配列のためのスペースをほとんど残さない。一般的に使用されるウイルス性および内因性哺乳類プロモーターは両方ともこれらの制限を超えており、AAVを介した大きな導入遺伝子の送達には使用できない。したがって、短く効率的な制御配列に対する強いニーズがある。
【発明の概要】
【0004】
遺伝的データが、第一の複数のヌクレオチド配列を含み、複数のヌクレオチド配列の各ヌクレオチド配列が、関連発現スコアを有する少なくとも一つの転写開始点(TSS)を含む、遺伝的データを受信することと、閾値を満たす関連発現スコアに基づいて、第一の複数のヌクレオチド配列から複数のTSSを決定することと、複数のTSSに基づいて、複数のサミットヌクレオチド塩基を決定することと、複数のサミットヌクレオチド塩基の各サミットヌクレオチド塩基に対して、関連する複数の周辺塩基を決定することと、コアプロモーターとして標識された第二の複数のヌクレオチド配列として、各サミットヌクレオチド塩基および関連する複数の周辺塩基を保存することと、第二の複数のヌクレオチド配列の各ヌクレオチド配列に対して、関連する複数のシフト塩基を決定することと、コアプロモーターではないとして標識された第三の複数のヌクレオチド配列として、各関連する複数のシフト塩基を保存することと、コアプロモーターとして標識された第二の複数のヌクレオチド配列、およびコアプロモーターではないとして標識された第三の複数のヌクレオチド配列に基づいて、訓練データセットを生成することと、訓練データセットに基づいて、予測モデルに対する複数の特徴を決定することと、訓練データセットの第一の部分に基づいて、複数の特徴に従って予測モデルを訓練することと、訓練データセットの第二の部分に基づいて、予測モデルを試験することと、および試験に基づいて、予測モデルを出力することと、を含む方法が開示される。
【0005】
遺伝的データが、第一の複数のヌクレオチド配列を含み、複数のヌクレオチド配列の各ヌクレオチド配列が、関連発現スコアを有する少なくとも一つの転写開始点(TSS)を含む、遺伝的データを受信することと、第一の複数のヌクレオチド配列に基づいて、コアプロモーターとして標識された第二の複数のヌクレオチド配列を決定することと、第二の複数のヌクレオチド配列に基づいて、コアプロモーターではないとして標識された第三の複数のヌクレオチド配列を決定することと、コアプロモーターとして標識された第二の複数のヌクレオチド配列、およびコアプロモーターではないとして標識された第三の複数のヌクレオチド配列に基づいて、訓練データセットを生成することと、訓練データセットに基づいて、予測モデルに対する複数の特徴を決定することと、訓練データセットの第一の部分に基づいて、複数の特徴に従って予測モデルを訓練することと、訓練データセットの第二の部分に基づいて、予測モデルを試験することと、および試験に基づいて、予測モデルを出力することと、を含む方法も開示される。
【0006】
遺伝的データが、第一の複数のヌクレオチド配列を含み、複数のヌクレオチド配列の各ヌクレオチド配列が、関連発現スコアを有する少なくとも一つの転写開始点(TSS)を含む、遺伝的データを受信することと、遺伝的データを正規化することと、関連発現スコアに基づいて、TSSをクラスター化することと、TSSの各クラスターについて、四分位幅を決定することと、四分位幅に基づいて、各TSSをシャープTSSまたはブロードTSSに標識することと、複数のTSSに基づいて、複数のサミットヌクレオチド塩基を決定することと、複数のサミットヌクレオチド塩基の各サミットヌクレオチド塩基に対して、関連する複数の周辺塩基を決定することと、コアプロモーターとして標識された第二の複数のヌクレオチド配列として、各サミットヌクレオチド塩基および関連する複数の周辺塩基を保存することと、閾値を満たす関連発現スコアに基づいて、第二の複数のヌクレオチド配列から第三の複数のヌクレオチド配列を決定することと、第三の複数のヌクレオチド配列の各ヌクレオチド配列に対して、関連する複数のシフト塩基を決定することと、コアプロモーターではないとして標識された第四の複数のヌクレオチド配列として、各関連する複数のシフト塩基を保存することと、コアプロモーターとして標識された第三の複数のヌクレオチド配列、およびコアプロモーターではないとして標識された第四の複数のヌクレオチド配列に基づいて、訓練データセットを生成することと、訓練データセットにおける各ヌクレオチド配列に対して、複数のシード配列および標的ヌクレオチド対を生成することと、複数のシード配列および標的ヌクレオチド対の各シード配列および標的ヌクレオチド対をベクトル化することと、ベクトル化されたシード配列および標的ヌクレオチド対に基づいて、生成モデルを訓練することと、および生成モデルを出力することと、を含む方法も開示される。
【0007】
遺伝的データが、第一の複数のヌクレオチド配列を含み、複数のヌクレオチド配列の各ヌクレオチド配列が、関連発現スコアを有する少なくとも一つの転写開始点(TSS)を含む、遺伝的データを受信することと、第一の複数のヌクレオチド配列に基づいて、コアプロモーターとして標識された第二の複数のヌクレオチド配列を決定することと、閾値を満たす関連発現スコアに基づいて、第二の複数のヌクレオチド配列から第三の複数のヌクレオチド配列を決定することと、第三の複数のヌクレオチド配列に基づいて、コアプロモーターではないとして標識された第四の複数のヌクレオチド配列を決定することと、コアプロモーターとして標識された第三の複数のヌクレオチド配列およびコアプロモーターではないとして標識された第四の複数のヌクレオチド配列に基づいて、訓練データセットを生成することと、訓練データセットに基づいて、生成モデルを訓練することと、および生成モデルを出力することと、を含む方法も開示される。
【0008】
また、ヌクレオチド配列を受信することと、訓練された予測モデルにヌクレオチド配列を提供することと、および予測モデルに基づいて、ヌクレオチド配列がコアプロモーターであることを決定することと、を含む方法が開示される。
【0009】
また、(a)ヌクレオチド配列と配列長を受信すること、(b)訓練された生成モデルに、ヌクレオチド配列を提供すること、(c)生成モデルに基づいて、ヌクレオチド配列に関連付けられた次のヌクレオチドを決定すること、(d)ヌクレオチド配列に次のヌクレオチドを付与すること、(e)ヌクレオチド配列の長さが配列長に等しくなるまでb~dを繰り返すこと、および(f)ヌクレオチド配列をコアプロモーター配列として出力すること、を含む方法も開示される。
【0010】
遺伝的データが、第一の複数のヌクレオチド配列を含み、複数のヌクレオチド配列の各ヌクレオチド配列が、関連発現スコアを有する少なくとも一つの転写開始点(TSS)を含む、遺伝的データを受信することと、第一の複数のヌクレオチド配列に基づいて、コアプロモーターとして標識された第二の複数のヌクレオチド配列を決定することと、閾値を満たす関連発現スコアに基づいて、第二の複数のヌクレオチド配列から第三の複数のヌクレオチド配列を決定することと、第三の複数のヌクレオチド配列に基づいて、コアプロモーターではないとして標識された第四の複数のヌクレオチド配列を決定することと、コアプロモーターとして標識された第三の複数のヌクレオチド配列およびコアプロモーターではないとして標識された第四の複数のヌクレオチド配列に基づいて、訓練データセットを生成することと、訓練データセットに基づいて、生成モデルを訓練することと、を含む方法も開示される。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
抗体パスポート
4か月前
個人
N式トータルシステム
2か月前
個人
自動車乗員の健康管理システム
5か月前
エムスリー株式会社
媒体
10日前
株式会社Y4.com
情報処理装置
4か月前
富士通株式会社
リスクと診断
3か月前
株式会社M-INT
情報処理システム
2か月前
株式会社I.W.G
医療支援システム
5か月前
株式会社タカゾノ
作業時間計測システム
3か月前
住友化学株式会社
組成提案システム
5か月前
医療法人社団梅華会
医療の支援装置
1か月前
株式会社Smart119
情報処理システム
3か月前
個人
透析医療に関する回答方法及びその装置
1か月前
株式会社サンクスネット
リスク判定システム
1か月前
株式会社日立製作所
情報システム
2か月前
富士通株式会社
介入方法及び介入プログラム
6か月前
個人
弾塑性有限要素法におけるデータ同化の演算方法
3か月前
アルケア株式会社
コミュニケーションシステム
1か月前
株式会社JVCケンウッド
表示装置及び表示方法
1か月前
公立大学法人大阪
診断装置
18日前
株式会社BiPSEE
情報処理装置及びプログラム
6か月前
株式会社グローバルビジョン
検体検査管理システム
1か月前
公益財団法人がん研究会
画像診断報告書作成システム
3か月前
個人
服薬指導支援システム、及び、服薬指導支援方法
1か月前
ロゴスサイエンス株式会社
ヘルスケアシステムおよびその方法
4か月前
ロゴスサイエンス株式会社
ヘルスケアシステムおよびその方法
2か月前
株式会社ミラボ
スケジュール案内装置、及びプログラム
5か月前
株式会社バシラックス
零売サービス提供システム
3か月前
トヨタ自動車株式会社
情報処理装置
2か月前
トヨタ自動車株式会社
情報処理装置
2か月前
株式会社ベーシック
遠隔医療支援システム及びプログラム
11日前
大和ハウス工業株式会社
消費カロリー推定システム
1か月前
日清食品ホールディングス株式会社
シニアの健康状態の改善方法
5か月前
株式会社AIVICK
食品提供装置及びプログラム
3か月前
個人
プログラムおよび情報処理装置
3か月前
TIS株式会社
処方箋管理システム
4か月前
続きを見る
他の特許を見る