
クリーンで一貫性があり、高品質なデータは、臨床試験の生命線です。
臨床データマネジメント(CDM)とは、臨床データを収集、検証、品質管理、統合、そして提供するプロセスであり、統計解析、規制遵守および申請、医療上の意思決定、さらには将来の臨床研究に向けて、高品質で信頼できるデータを提供することを目的としています。
もともとCDMは手作業・紙ベースで行われており、エラーが発生しやすいものでした。1990年代になると、紙の症例報告書(CRF)がCDMデータベースにデジタルで転記されるようになりましたが、重複入力や誤入力による高いエラー率は依然として課題でした。しかし過去数十年にわたる進歩により、CDMは大きく変貌を遂げ、現在では以下のような発展が見られます。
- 技術の進歩:クラウドソリューション、臨床試験プラットフォーム、集中管理されたデータ、人工知能(AI)・機械学習(ML)、ウェアラブルデバイスなど。
- 品質管理とCDMの高度化:QbD(Quality by Design)、RBQM(リスクベース品質管理)、CDISCなどの原則・基準・手法の普及。
- 臨床研究プロセスと方法論の進歩:アダプティブ試験、分散型臨床試験(DCT)の拡大。
- 規制環境の変化:技術や手法の進歩に合わせて、規制の運用も進化。
- データ相互運用性の標準と取り組み:前例のない量と速度でデータが生成されるようになり、CDMの役割は他の臨床研究活動を支援する領域へと拡大。
その結果として直面するリスクや課題には、次のようなものがあります。
-
データ過多とシステム互換性の問題
-
各国・各地域で進化し続ける規制要件への対応
-
多施設試験・グローバル試験における一貫性の確保
-
新興市場におけるCDM人材・専門知識の不足
-
異なるシステム間の相互運用性の確保
-
サイバーセキュリティおよび患者プライバシーへの脅威
データは患者、医療機関、検査機関、電子カルテ、センサー、画像診断など、さまざまな異なるソースから収集されます。そこには半構造化データや非構造化データも含まれ、一貫性に欠ける場合があります。例えば、医師の記録、患者が入力したデータ、誤ったデータ入力などです。異なるEHRシステムは、同一患者に関して異なるデータを保持していることもあり、診療記録の不整合や、患者安全性に関わるリスクにつながる可能性があります。
データ収集、照合、標準化、品質チェック、メディカルコーディングといった作業は、手作業または半自動化プロセスに依存しており、多大なリソースを必要とし、時間がかかるうえに、エラーも発生しやすいという課題があります。
データ量の増加は臨床研究において貴重な利点をもたらす一方で、それらのデータを管理し、患者安全を確保し、規制要件を満たすという点において大きな課題も生じています。
これらの課題を克服するためには、業界は従来の古いサイロ化されたアプローチから脱却し、AIを活用したソリューションと自動化を取り入れ、試験のワークフロー全体を統合するプラットフォーム型アプローチへ移行する必要があります。臨床試験ライフサイクル全体でのデータ統合とワークフローの簡素化は、スポンサー、CRO、医療機関、患者間の協働を大幅に向上させ、迅速かつ的確な意思決定を促し、規制要件の順守も強化します。
メディデータは、この変革をMedidata Platformを通じてリードしています。自動化とAIによって強化された Medidata Patient Experience、Study Experience、Data Experience は、デジタル技術を通じて患者エンゲージメントを向上させ、実用的なインサイトによってデータ品質を高め、予測分析により試験デザインを最適化します。特に Medidata Data Experience は、試験設計からデータ取得、データ統合、データレビュー、そしてデータベースロックに至るまで、臨床データマネジメントのワークフローを簡素化し加速させます。
本記事では、CDMの包括的な概要を紹介します。データマネジメントプロセスのライフサイクル、活用されるツールとテクノロジー、規制遵守、データ標準、ユースケース、そしてCDMの未来像までを網羅します。
臨床データマネジメントのライフサイクルとベストプラクティス
臨床データマネジメント協会(ACDM)および臨床データマネジメント学会(SCDM)は、重要なガイダンスを提供する団体です。4,5 以下に示す各ステージとステップは、彼らのガイダンスに基づき、ベストプラクティスやデータマネジメント計画の参考としてまとめたものです。
臨床データマネジメントの各段階
戦略と計画
試験におけるデータ戦略およびデータ品質管理の方法論が策定され、試験の各側面に応じたフレームワークが合意されます。
臨床研究チームは、従来のサイロ化された業務慣行から、RBQM(リスクベース品質管理)などの協働フレームワークへと移行しつつあり、同時に集中管理型のデータマネジメントリソースやシステムを活用しています。統合的な品質管理計画(Integrated Quality Management Plan)とデータマネジメント計画が作成され、それらは臨床データマネジメント、リスク管理、中央モニタリング、メディカルモニタリング、その他の関係者・参加者によって活用されます。CDMライフサイクルには、大きく3つの主要なステージがあります。
-
試験開始準備(Study Set Up)
-
試験実施(Study Conduct)
-
試験終了処理(Close Out)
これらのステージの中で、さらに以下のステップに分かれます。
1. 試験開始準備 | 2. 試験実施 | 3. 試験終了処理 |
---|---|---|
|
|
|
1. 試験開始準備
このステージでは、臨床試験の基盤が築かれます。
データマネジメントチームはプロトコルを精査し、臨床試験プロトコルの要約を作成します。試験チームからのインプットを基に、試験のタイムラインも作成されます。また、データマネジメントチームは、主要な連絡先、試験文書、使用するデータマネジメントツールやシステム、システム間の統合、メディカルコーディング辞書などを含む記録を作成します。
文書管理については、電子治験マスターファイル(eTMF)が設定されます。
さらに、EDCシステムやグローバルライブラリを含むシステム・ライブラリ・統合について、妥当性確認とコンプライアンスが行われます。ベンダーのコンプライアンスも同様にチェックされます。
このステージにおけるその他の準備作業には、以下が含まれます。
-
ランダム化(オープンラベル試験を除く):ランダム化は、臨床データベースと統合されたRTSM/IRT(Randomization and Trial Supply Management/Integrated Randomization Tool)によって実施されます。すべてのデータマネジメント業務はランダム化データを盲検化した状態で行われ、その後、稼働開始前に試験チームがレビューを行い、アンブラインド計画に記録されます。
-
システム統合:臨床試験で一般的に使用されるシステム統合には、CTMS(臨床試験管理システム)、コーディングツール、EDC、統計解析環境(SCE)などがあります。技術面についての詳細は、本記事の後半で説明します。
-
メディカルコーディング:医学用語を標準化する際には、正確性・一貫性を維持し、文脈を損なわないことが極めて重要です。また、メディカルコーダーは、複雑で時間のかかるコーディング作業を効率化するために、独自のシノニム(同義語)リストを作成・維持しています。
-
データ検証仕様(DVS):DVS(Data Validation Specification)文書には、実施すべきすべてのデータクリーニング作業が記載されます。これは「データハンドリング計画」あるいは「エディットチェック仕様」とも呼ばれます。目的は、統計解析に備えて重要なデータを正確かつクリーンな状態にすることです。
-
症例報告書(CRF)の設計と記入:eCRF(電子症例報告書)は、患者からプロトコルや試験のエンドポイントに沿った試験特有のデータを収集するように設計されます。患者が直接利用するため、資料の明確さとフォーム設計の論理的な流れが重要です。
eCRF記入に関するガイダンスへのリンクが、データマネジメントチームに提供されます。
- データ移転契約(非CRFデータ):サードパーティベンダーが非CRFデータを「どのように・何を・いつ」移転するかに関する契約や仕様がファイルされます。非CRFデータには、ラボ、ePRO/eCOA、画像、センサーなどのソースからのデータが含まれます。
- 臨床データベースの設計・初期リリース・変更管理:臨床データベースはCRFのロジックを反映し、規制基準を満たすように設計・構築されます。その後、EDCやコーディング辞書と統合されます。
統合ツールのバリデーションやユーザー受け入れテスト(UAT)を含む「ゴーライブ」初期リリースチェックリストに従うことが推奨されます。臨床データベースの初期リリース後に行われるすべての変更については、変更ログを作成し、承認を受ける必要があります。
2. 試験実施段階
実施段階は、臨床試験データベースの承認後に開始されます。
ステップは以下のとおりです:
- 臨床データベースへのユーザーアクセス:データマネージャー、生物統計担当者、臨床データコーダーなどの関連ステークホルダーに対して、システム固有のユーザーアクセス権限が付与されます。
- データ抽出:臨床データベースからの自動または手動によるデータ抽出が、臨時または定期的に実施されます。これは分析、品質チェック、検証、コンプライアンス対応のために行われます。
- データクリーニング:監査証跡の確保と透明性・コンプライアンス対応のため、臨床データの完全性と整合性を保証する目的で検証とクリーニングが求められます。この段階では、エディットチェック、不整合管理、クエリ解決が行われます。
- 継続的なデータレビュー:データレビューは、ソースデータ検証(SDV)の最中や終了後、各コホート・パート終了時、そして試験終了時に継続的に実施されます。データマネージャーはシステムチェックやプログラム可能なチェックも確認します。この過程でデータの照合や検証が行われ、クエリ率の高い領域が特定されます。
- メトリクス:標準的なレポート、メトリクス、主要業績評価指標(KPI)は、チームが試験の進捗状況を把握し、問題を特定・管理し、効率と品質を測定するのに役立ちます。KPIの例には以下が含まれます:
-
CRFページごとのクエリ率
-
クエリ解決までの時間
-
データ入力エラー数
-
中間/最終データベースロック時のクリーンデータ割合
-
大量のクエリを生じたデータポイント
- メディカルコーディングレビュー:メディカルコーダーは MedDRA、WHODrug などの辞書を用いてコーディングを確認し、必要に応じて臨床データベース内で直接クエリを発行し、施設に確認を求めます。すべての確定済み用語・適用済み用語は、中間または最終データベースロック前に承認・文書化され、eTMF にファイルされます。
- 重篤有害事象(SAE)の照合:臨床データベースと安全性データベース間で SAE データおよび関連対応の照合が行われます。
- 非CRFデータの照合:非CRFデータは、試験実施段階を通じて定期的に照合されます。
- リスク評価とアクション/意思決定ログ:リスク評価は実施され、レビューされ、リスク評価ログに記録されます。
- 中間ロック:試験実施中に中間解析が行われることがあります。これは通常、手作業で時間のかかるプロセスであり、解析期間中は施設がデータ入力を継続できない場合もあります。
- プロトコル改訂や試験途中でのデザイン変更:試験の途中でのデザイン変更やプロトコル改訂は非常によく発生します。特に第II相および第III相試験において頻繁に見られます。変更の影響やその管理方法については後半で解説します。
3. 試験終了処理
- データベースロック:データベースロックは、臨床試験における重要なマイルストーンです。ロック前に最終確認が行われます。一部のデータベースには2段階ロックがあり、ソフトロック(クエリや編集がまだ可能な状態)と、ハードロック(編集やアクセスが一切できない状態)に分かれます。
- 規制当局への申請に向けたデータ準備:データは、システム・アナリスト・組織間での相互運用性を確保するために標準化されます。これは規制要件でもあります。申請準備として、データベースロック後に SDTM データセットを適用し、データを整理・フォーマットします(一部はロック前に実施可能)。SAS プログラミングやツールを用いて、SDTM データセット、Define.xml ファイル、データ検証、レビュアーズガイドが生成されます。ADaM(Analysis Data Model)数値データセットは、SDTM データセットと最終統計解析の間をつなぎ、TLF(Tables, Listings, Figures)データセットはデータを見やすい形式に要約します。
- データベースアンロック:データベースロック後に解析へ影響する修正が必要となった場合、データベースをアンロックするために承認を得る必要があります。これは文書化され、すべてのステークホルダーの承認が必要です。修正が行われた後、データは品質チェックを受け、再ロックされます。
ロック後のステップには、データの抽出と転送、データのアーカイブ、そしてシステムの廃止が含まれます。
データベースがロックされると、統計解析環境(SCE)において最終解析のためにデータが安全に抽出されます。試験データに関するすべての文書はアーカイブされます。申請準備が整った被験者データは、eTMF または指定されたリポジトリにアップロードされます。臨床試験データベースは、申請準備済みの被験者データファイルが作成され、QC チェックされ、臨床試験サイトで受領された後に廃止されます。
臨床データマネジメントにおけるツールと技術
テクノロジーは、CDM(臨床データマネジメント)のライフサイクル全体において、ステークホルダーを支援し、力を与える上で不可欠な役割を果たしています。人為的エラーやデータの重複、そして膨大なデータ量を扱えないというリスクから、可能な限り手作業のプロセスは排除されます。電子的な収集・管理ツールは、多様なソースからのリアルタイムデータ収集、主要システムへの直接入力、検証・クリーニング・解析といった自動化されたデータマネジメント機能を可能にします。
理想的なCDMシステムとは、以下に挙げるテクノロジーやラボで使用されるその他のシステムとの統合・データ相互運用性を備え、すべてのデータを集中管理型システムに集約できるものです。9 最も一般的に利用されるツールとシステムは(アルファベット順):
- 臨床データマネジメントシステム(CDMS):データの集中管理、レビュー、照合、解析を行うシステム。例:Medidata Clinical Data Studio。
- 臨床/医療用辞書と関連テクノロジー:Medidata Rave Coder+ のような技術は、自動化されたメディカルコーディングを提供し、業界標準辞書を検索・参照するツールと連携します。また、独自のシノニムリストを作成・維持し、AIを用いて逐語的な用語に対するコードを予測します。
- eConsent:eConsentは紙の同意書を置き換えるもので、患者の登録やオンボーディングを簡素化し、患者エンゲージメントを改善します。加えて、同意取得の追跡管理を行い、事務負担やインフォームドコンセントのエラーを軽減します。
- 電子カルテ(EHRs):治験患者のEHRへのアクセスは、臨床研究者への情報提供や患者安全に不可欠です。EHRには、eCRFで必要となる検査結果、バイタルサイン、投薬歴、病歴といったソースデータが記録されています。Medidata Rave Companion のようなEHR-EDCソリューションは、このプロセスを自動化できます。
- 電子的臨床アウトカム評価(eCOA)/電子的患者報告アウトカム(ePRO):標準化された質問票を用い、患者・医師・介護者から電子的にデータを収集するシステム。例:myMedidata。
- EDC システム: 施設、患者、ラボから報告されるデータを収集、管理、クリーニング、レポート化します。Medidata Rave EDC のような高度なEDCは、ワークフローを効率化し、手作業のデータ照合を排除し、インサイトを提供します。
- 医用画像: スキャンやX線などの医用画像は、重要かつ複雑なデータソースです。Medidata Rave Imaging のようなシステムは、画像の管理とレビューをサポートします。
- RTSM/IRT: 患者/被験者のランダム化割り付け、在庫管理、治験薬や医療機器の配送ロジスティクスに用いられる技術。例:Medidata Rave RTSM。
- センサーとウェアラブルデバイス: センサー技術の進歩により、ウェアラブルデバイスを活用して、断続的または継続的なリアルワールドデータ収集・モニタリングが可能になりました。Medidata Platform 上でも利用されています。
- 統計解析環境(SCE): データ取り込み、複雑かつ予測的なデータモデリングと解析、データの可視化を含む高度な解析システム。
臨床データテクノロジープラットフォーム
臨床試験において、バラバラのスタンドアロン型ソフトウェアやサービスを導入すると、実装の遅延や統合上の問題を引き起こすリスクが高いことが知られています。
最も成功しているアプローチは、実績があり、サードパーティとの統合やデータ相互運用性の機能が証明されている統合型プラットフォームを導入することです。
規制遵守とデータ標準
データの正確性、一貫性、完全性は、規制当局への申請を成功させるために極めて重要です。
導入されるあらゆる技術ソリューションも、バリデーション、セキュリティ、監査証跡など、厳格な規制要件を満たす必要があります。10
CDMは、グローバルおよび各国レベルで多くの規制要件やデータ標準の対象となります。これには、以下が含まれます(ただし、これらに限定されません):11,12,13,14
-
ICH E6(R3)/E8:近代化されたガイドラインとリスクベースのアプローチ
-
FDA 21 CFR Part 11:電子署名のバリデーションと監査証跡
-
GDPR & HIPAA:多国籍治験におけるデータプライバシー要件
ユースケースと事例
メディデータは、2,300社以上の顧客、36,000件を超える臨床試験、1,100万人以上の参加者を支援してきた実績があり、数多くのデータマネジメントの事例や導入事例(テスティモニアル)を有しています。
.Medidata Big Book of CDM Case Studies では、その一部が紹介されています。その中の一例として、バイオメトリクス系CROであるPHASTARとの変革的プロジェクトがあります。このプロジェクトでは、データ収集の可視性とオーバーサイトを改善し、試験実施のスピードを向上させ、患者エンゲージメントを強化することを目的にメディデータと協業しました。
ICON plc のシニアディレクター(Clinical Systems)である Luke Gregory 氏は、Medidata Clinical Data Studio が ICON 社内で臨床データサイエンスのビジョンを調和させるのにどのように役立ったかについて語っています。
また、Corcept Therapeutics のアソシエイトディレクター(Clinical Data Management)である Swathi Vasireddy 氏は、リアルタイムデータと異常値の可視化、データトレンドの追跡、問題解決、データクリーニング、そしてデータベースロックまでの時間短縮についての経験を自身のテスティモニアルで紹介しています。
その他の臨床データマネジメントに関する事例紹介も、こちらでご覧いただけます。
これからの臨床データマネジメント
「臨床データマネジメントチームの焦点は、徹底的かつ反応的なデータクリーニングから、プロアクティブでリスクベースの臨床データサイエンスへとシフトしています。」
Medidata の記事 Clinical Data Science 101: The New Clinical Data Management と、SCDM(臨床データマネジメント学会)との共同ウェビナーは、業界がデータマネジメントからデータサイエンスへ移行しつつある流れについてのインサイトを提供しています。15
この進化を支援するために、SCDM は2019年以来16、CDM から臨床データサイエンス(CDS)への移行に関するリフレクションペーパーを発表しており、次の4つの主要テーマが進化の原動力となっています:
-
臨床試験デザインの複雑化(例:適応的デザイン、マスタープロトコル、シンセティックコントロールアーム)
-
臨床試験の分散化(DCT)
-
QbD(Quality by Design)を推進し、重要な点に焦点を当てるリスクベースCDMアプローチの採用
-
CDM業務の自動化
その他の要因としては、リアルワールドデータやウェアラブル技術の統合、そしてグローバルなスポンサー間でのデータ標準化(例:CDISC)が挙げられます。
SCDM は CDS を次のように定義しています:
「臨床データサイエンス(CDS)は、臨床データマネジメント(CDM)の進化形です。CDS は、臨床研究のライフサイクル全体にわたり迅速な意思決定を可能にするために不可欠な、領域知識、プロセスおよびテクノロジーの専門性、データ解析スキル、そして良好な臨床データマネジメントの実践を包含します。臨床データサイエンスとは、患者中心・データ駆動型・リスクベースのアプローチによって複雑なプロトコルデザインを実行し、被験者保護と「試験結果の信頼性・妥当性」を確保するための戦略的な学問領域であると定義できます。」
臨床データの「5つのV」(Volume=量、Variety=多様性、Velocity=速度、Veracity=正確性、Value=価値)は、臨床データマネージャーが臨床データサイエンティストへと移行する際に活用しているフレームワークの一部を構成しています。このテーマに関する優れたリソースとして、無料で入手可能な eBook Driving Data Quality 5Vs があります。
2019年以降、CDMにおける課題は増大しており、集中型データマネジメントや自動化されたインテリジェントなワークフロー・解析と組み合わせた、プロアクティブかつターゲット型、リスクベースのアプローチへとシフトする必要性が明確になっています。
データマネージャーはすでに、異常検知、コーディング、監査証跡レビュー、データ照合といった複雑なタスクにAIや先進技術を活用できるようになっています。まもなく、その活用はプロトコル設計から規制当局への申請データ準備に至る試験全体に広がり、データベースロックまでの時間を大幅に短縮することになるでしょう。
まとめ
テクノロジーは、臨床研究に変革的なメリットをもたらしています。データの量と速度が増大しているため、そのデータを効果的に管理・活用するには、高度なテクノロジー、ターゲット型のリスクベース手法、そして集中型データマネジメントが必要とされています。
現時点でも、テクノロジーはCDMの多くの重要領域においてデータマネージャーを支援しています。やがては、データマネジメントライフサイクルのあらゆる領域をサポートできるようになるでしょう。
データマネジメントはデータサイエンスへと進化しました。データマネージャーはスキルを磨き、臨床データサイエンティスト、そして戦略的アドバイザーへと変革を遂げつつあります。
Medidata Data Experienceは、臨床データマネジメントプロセスのすべての部分をつなぎます。
試験構築からデータ収集、データベースロックに至るまで、組み込みのAIと自動化を活用してワークフローを簡素化し、手作業を削減し、データ品質を向上させ、試験期間を短縮します。これにより、生データを迅速に実用的なインサイトへと変換します。
臨床データマネジメントの高度化をどのように支援できるかについて、ぜひこちらから専門家にご相談ください。
参考文献:
- Quality by design | European Medicines Agency (EMA)
- RBQM - The Role of Source Data Verification (SDV) and Source Data Review (SDR) in Driving Clinical Trial Data Quality
- CDISC
- ACDM. Guides and Templates
- Journal for the Society for Clinical Data Management. Data Management Plan
- ibid., RBQM - The Role of Source Data Verification (SDV) and Source Data Review (SDR) in Driving Clinical Trial Data Quality
- MedDRA
- UMC's Drug Dictionary WHODrug Global (UMCDD)
- Interoperability in Healthcare - Everything You Need to Know
- Guideline on computerised systems and electronic data in clinical trials | EMA
- ICH E6 Good clinical practice - Scientific guideline | European Medicines Agency (EMA)
- FDA Part 11, Electronic Records; Electronic Signatures - Scope and Application
- GDPR - Regulation - 2016/679 - EN - gdpr - EUR-Lex
- Summary of the HIPAA Privacy Rule | HHS.gov
- Clinical Data Science 101: The New Clinical Data Management
- The Evolution of Clinical Data Management into Clinical Data Science An SCDM Position Paper on how to create a Clinical Data Science Organization
Contact Us
