ライフサイエンス業界で最高のデータ分析プラットフォームを構築するためには、どのような質問をするべきかを知る必要があります。分析がなぜ機能するのか、あるいはなぜ機能しないのかを理解するには、長年の経験が必要とされました。でもAcorn AIにはその経験が備わっています。成功する分析プラットフォームのコアは、単一の真実の情報源でなければならないことを私たちは知っていました。分析を誰が実施しても、その結果は一貫していなければならないのです。
私たちは、単一の真実のソースを作成するためには、基礎となるデータが包括的かつ具体的でなければならないことを知っていました。また、基礎となるデータはクリーンで信頼できるものでなければなりませんでした。それは、利用可能なすべてのソースから取り出せるものであり、審査のために簡単にアクセスできるようにしなければなりませんでした。そもそもデータは通常バラバラで、様々な形で現れます。そのため、優れた分析プラットフォームを構築するためには、標準化が必要であると考えていました。さらに自動化された高速で手間のかからないデータ検証プロトコルを開発しなければならないことも理解していました。
私たちはセントラルエンジンが必要だと考えていました。システム内のどこにでも現れるデータを収集し、それを取り込み、マッピングできるようなものが必要だと考えていました。他社では、静的で柔軟性に欠ける傾向のある情報のデータウェアハウス、つまり労働集約型のデータの倉庫を構築しています。長年の経験からメディータは、パラメータにデータをマッピングするシステムを求めていました。なぜならそれは医薬品マーケティング担当者が製品の発売準備に必要なものとなるからです。しかし、途中でパラメータが変更される可能性があることもあるため、私たちは応答性が高く、センシティブかつ柔軟性のあるものを生み出さなければなりませんでした。
柔軟性とは、その場で適応できることを意味しますが、企業がデータの上に独自の分析ツールを重ねることを望むかもしれないことを洞察していくことも意味するのです。各企業にはそれぞれ異なるレポート要件と望む様式があり、同じような分析でも異なるパッケージとなる可能性があります。煩雑なデータウェアハウスを構築し、それぞれにデータを入力しなければならないのではなく、私たちは、そのタスクに対応できるようなフレームワークを求めていました。基本的なアーキテクチャを変えずに、2つ、3つの製品をお客様にご提供できるモデルが欲しかったのです。 そして、私たちは集約されたエンジンをデータにとらわれないものにしたいと考えていました。私たちはどんなデータでも対応できるように機能して欲しかったのです。マッピングが確立された後は、入力された情報をクリーンにするためのデータ検証を開発しました。それによって、データセットは、あらゆる質問を分析するための基準となり得ます。
私たちが構築したのは、Acorn AI Commercial Data Model (CDM)です。Acorn CDMは、サーバー上にデータが表示されてから数分以内にすべてのソースからのデータを検証し、プロジェクト期間中のデータ品質を向上させます。Acorn CDMは、データをマッピングし、スピードと柔軟性を実現します。そして、企業全体のための唯一の正しいデータソースを作成します。
この記事は2020年10月20日にMedidata Blogでの英文投稿の抄訳となります。原文はこちらをご参照ください。