TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025023887
公報種別
公開特許公報(A)
公開日
2025-02-19
出願番号
2024104875
出願日
2024-06-28
発明の名称
電子データをキャプチャーしたデータセットを標準データ集計モデル(SDTM)データセットに変換するシステムおよび方法
出願人
メディデータ ソリューションズ インク
,
MEDIDATA SOLUTIONS, INC.
代理人
個人
主分類
G06F
18/213 20230101AFI20250212BHJP(計算;計数)
要約
【課題】電子データ収集(EDC)データセットを標準データ集計モデル(SDTM)データセットに変換する方法を提供する。
【解決手段】この方法は、EDCデータセットのEDCフィールド名を含むメタデータを処理して、特定の次元数のベクトルを生成するステップを含む。そのベクトルは、埋め込みモデルで処理され、より小さい次元の埋め込みベクトルが生成される。埋め込みベクトルは予測モデルにおいて処理され、EDCフィールド名のクラス予測を生成する。クラスはSDTMフィールド名に対応する。EDCフィールド名は、EDCフィールド名のクラス予測に基づいてSDTMフィールド名と対応付けられる。埋め込みモデルは学習されたシャムニューラルネットワークから得られる。
【選択図】図1
特許請求の範囲
【請求項1】
電子データ収集(EDC)データセットを標準データ集計モデル(SDTM)データセットに変換する変換方法であって、
EDCデータセットのEDCフィールド名を含むメタデータを処理して、次元数n1(n1は整数)のベクトルを生成するステップと、
埋め込みモデルにおいて次元数n1のベクトルを処理して、次元数n2の埋め込みベクトルを生成する(n2は整数であり、n1よりも小さい)ステップと、
前記埋め込みベクトルを予測モデルで処理し、SDTMフィールド名に対応する、前記EDCフィールド名のクラス予測を生成するステップと、
前記EDCフィールド名のクラス予測に少なくとも部分的に基づいて、EDCフィールド名のそれぞれを前記SDTMフィールド名に対応付けるステップと、
を含み、
前記埋め込みモデルは、第1埋め込みサブネットワークおよび第2埋め込みサブネットワークを含む、トレーニングされたシャムニューラルネットワークから得られる変換方法。
続きを表示(約 1,500 文字)
【請求項2】
前記SDTMフィールド名のサブセットに事前にマッピングされた前記EDCフィールド名のサブセットに基づいて、前記シャムニューラルネットワークをトレーニングするステップをさらに含む請求項1に記載の変換方法。
【請求項3】
前記EDCフィールド名のサブセットを、マニュアルでキュレートする請求項2に記載の変換方法。
【請求項4】
前記第1埋め込みサブネットワークおよび前記第2埋め込みサブネットワークにそれぞれ入力される、次元数n1のベクトルのペアを生成するステップをさらに含む、請求項2に記載の変換方法。
【請求項5】
前記第1埋め込みサブネットワークおよび前記第2埋め込みサブネットワークによって、前記埋め込みベクトルを生成するために長短期記憶ニューラルネットワークで次元数n1のベクトルを処理するステップをさらに含む、請求項4に記載の変換方法。
【請求項6】
前記シャム型ニューラルネットワークの外部レイヤにおいて、前記第1埋め込みサブネットワークおよび前記第2埋め込みサブネットワークによってそれぞれ生成された埋め込みベクトルの各ペア間の距離を決定するステップをさらに含む請求項4に記載の変換方法。
【請求項7】
前記SDTMフィールド名のサブセットに事前にマッピングされたメタデータのサブセットを使用して、分類モデルをトレーニングするステップと、
トレーニングされた分類モデルを予測モデルとして使用するステップと、
をさらに含み、
前記メタデータのサブセットは、分類モデルに入力される前に埋め込みモデルによって処理される請求項2に記載の変換方法。
【請求項8】
前記マッピングに少なくとも部分的に基づいて、前記EDCデータセットをSDTMデータセットに変換するステップをさらに含む、請求項1に記載の方法。
【請求項9】
電子データ収集(EDC)データセットを標準データ集計モデル(SDTM)データセットに変換する変換システムであって、
前記1つまたは複数のプロセッサが実行可能な命令を記憶するメモリとの間で通信可能な1つまたは複数のプロセッサを有するコンピュータを含み、
前記命令は、
EDC データセットのEDCフィールド名を含むメタデータを処理して、次元数n1のベクトルを生成する(n1は整数)ステップと、
埋め込みモデルにおいて次元数n1のベクトルを処理して、次元数n2の埋め込みベクトルを生成する(n2は整数であり、n1よりも小さい)ステップと、
前記埋め込みベクトルを予測モデルで処理し、SDTMフィールド名に対応する、前記EDCフィールド名のクラス予測を生成するステップと、
前記EDCフィールド名のクラス予測に少なくとも部分的に基づいて、EDCフィールド名のそれぞれを前記SDTMフィールド名に対応付けるステップと、
を実行する命令であり、
前記埋め込みモデルは、第1埋め込みサブネットワークおよび第2埋め込みサブネットワークを含む、訓練されたシャムニューラルネットワークから得られる変換システム。
【請求項10】
前記SDTMフィールド名のサブセットに事前にマッピングされた前記EDCフィールド名のサブセットに基づいて、前記シャムニューラルネットワークをトレーニングするステップをさらに含む請求項9に記載の変換システム。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は一般に、臨床試験データのEDC(Electronic Data Capture)フィールドをSDTM(Study Data Tabulation Model)にマッピングすること、およびEDCデータセットをSDTMデータセットに変換することに関する。
続きを表示(約 2,500 文字)
【背景技術】
【0002】
臨床試験は、高度に洗練されたプロトコルと複数の多様なデータソース、大量のデータ、分散化、複雑化する適応デザインによって膨大化している。ある試算によると、第III相試験で収集されたデータポイントは、過去10年間で3倍に増加し、平均360万に達しており、試験の複雑化が、ますます広範なソースから発生するデータ量の拡大を促している。
【0003】
電子データ収集(Electronic Data Capture:EDC)システムは、データの収集と管理のために臨床試験で広く使用されている。EDCシステムには、従来の紙ベースのデータ収集方法に代わって、データ収集の時点で直接データ入力ができるソフトウェアアプリケーションが含まれる。臨床試験開始前に、臨床試験プロトコルはEDCシステム内の電子症例報告書(eCRF)を設計するために使用される。eCRFには、治験データを入力するための構造化されたフォーマットが含まれている。この設計には、患者の人口統計、病歴、治療割り当て、検査結果、有害事象、転帰など、治験実施計画書で指定されたデータを収集するために必要な全てのフィールドが含まれている。
【0004】
臨床データ管理における重要な進歩は、標準データ集計モデル(Standard Data Tabulation Model:SDTM)に臨床データをマッピングすることによる標準化である。SDTMは、米国食品医薬品局(FDA)などの規制当局に製品申請の一部として提出されるヒト臨床試験データ集計および非臨床試験データ集計の標準構造を定義している。これにより、異なる臨床試験間の臨床データの取り扱いや比較が効率化された。
【発明の概要】
【発明が解決しようとする課題】
【0005】
EDCのフィールドをSDTMにマッピングすることは、いくつかの理由から困難な技術的問題となる可能性がある。EDCシステムは主にデータ収集用に設計されており、フィールドは臨床データ入力や施設管理のニーズに合わせて編成されている。有害事象、人口統計、その他の臨床エンドポイントの収集に関連するフィールドなどのEDCフィールドは、試験または企業特有の方法で指定されることがあるため、SDTM標準に容易にマッピングすることはできない。一方、SDTMはFDAなどの規制当局にデータを提出するために設計されており、Clinical Data Interchange Standards Consortium(CDISC)によって設定された標準的な構造と用語に従っている。構造と用語の違いにより、EDCとSDTMの直接的なマッピングは困難である。さらに、異なるEDCシステムの設計と使用方法には大きなばらつきがある。同じ種類のデータであっても、システムによって取り込み方が異なったり、同じ治療薬であっても試験が異なったりすることがある。このばらつきがマッピングプロセスを複雑にしている。
【0006】
そのため、電子データ収集(EDC)システムからSDTMにデータをマッピングする従来のプロセスでは、一般に、注釈付き症例報告書(CRF)を読み取り、データをSDTM形式に変換するスクリプトを作成するプログラマーが関与する必要がある。さらに、臨床試験で使用されるEDCシステムは、多くの場合、試験の実施を容易にするために設計されており、SDTMへのマッピングは二次的な優先事項となっている。したがって、このような従来のアプローチでは、EDCシステムのデータをSDTMにマッピングするプロセスは非常に手間がかかり、多くの場合、再現性がない。
【0007】
このような問題に対処するため、EDCを標準化する試みが行われてきた。一旦、ある試験のマッピングが存在すれば、将来の全ての試験は基本的に同じパターンに従うことになる。しかし、EDCの標準化には、柔軟性の喪失、一般的な標準の確立の難しさ、そして最も重要な点として、SDTM形式で提出されたことのないレガシー試験のマッピングには適用できないなどの欠点がある。
【0008】
EDCのフィールドをSDTMにマッピングするための実用的な機械学習(ML)ソリューションを構築する際の障壁の1つは、トレーニングデータが相対的に不足していることである。最大手の製薬会社でさえ、アルゴリズムの学習に利用できる臨床試験は数千件に過ぎない。
【課題を解決するための手段】
【0009】
開示された実施形態では、シャムネットワークを使用して、電子データキャプチャ(EDC)メタデータベースの埋め込みを生成することができ、機械学習(ML)分類器をこれらの埋め込みに使用して、関連する標準データ集計モデル(SDTM)フィールドを予測することができる。シャムニューラルネットワーク(Siamese neural network)は、類似のデータポイントが、非類似のデータポイントよりも、ユークリッド距離のような距離メトリックに基づいて近い、より低次元の埋め込みを持つように訓練される。これにより、各フィールドの低次元埋め込みを他の全てのフィールドと比較できるサブネットワークを学習することができる。開示された実施形態では、これにより、N個のデータ点をO(N2)組に拡張し、そこから分類器ニューラルネットワークを訓練することができる。この埋め込みを取得した後、低次元表現を使用して最終的な予測モデルを生成し、EDCフォームのフィールドをSDTMドメインに分類することができる。
【0010】
開示された実施形態では、レガシー臨床試験をSDTM形式に大規模にマッピングすることが可能である。これにより、解析前にデータセットをマニュアルで整合させるオーバーヘッドを必要とせずに、臨床試験を横断的に解析できるようになり、レガシーデータの価値が大幅に向上する。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
裁判のAI化
1か月前
個人
フラワーコートA
20日前
個人
工程設計支援装置
12日前
個人
情報処理システム
1か月前
個人
記入設定プラグイン
2か月前
個人
検査システム
1か月前
個人
介護情報提供システム
27日前
個人
設計支援システム
1か月前
個人
設計支援システム
1か月前
個人
携帯情報端末装置
13日前
キヤノン電子株式会社
携帯装置
1か月前
株式会社サタケ
籾摺・調製設備
1か月前
個人
結婚相手紹介支援システム
9日前
個人
不動産売買システム
1か月前
株式会社カクシン
支援装置
1か月前
個人
アンケート支援システム
22日前
個人
備蓄品の管理方法
1か月前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
1か月前
個人
ジェスチャーパッドのガイド部材
26日前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
23日前
株式会社BONNOU
管理装置
2か月前
大阪瓦斯株式会社
住宅設備機器
6日前
アスエネ株式会社
排水量管理方法
1か月前
株式会社アジラ
移動方向推定装置
21日前
キヤノン電子株式会社
名刺管理システム
1か月前
ホシデン株式会社
タッチ入力装置
1か月前
株式会社村田製作所
ラック
8日前
株式会社寺岡精工
システム
26日前
東洋電装株式会社
操作装置
1か月前
株式会社東芝
電子機器
1か月前
株式会社ワコム
電子消去具
1か月前
個人
リテールレボリューションAIタグ
19日前
東洋電装株式会社
操作装置
1か月前
株式会社やよい
美容支援システム
2日前
続きを見る
他の特許を見る