Medidata Blog

[NEXT+] 메디데이터의 빅데이터 분석을 통한 합성 대조군 (Synthetic Control Arms) 활용 사례

Reading Time: 3 minutes

Darshan Dala(Global Clinical Program Leader, Novartis)

 

합성대조군의 적절한 사용

합성대조군은 어떤 경우에 사용하는 것이 좋을까요? 먼저, 대조군이 임상시험 계획서에 맞지 않을 때 또는, 어떤 이유에서 질병에 적합하지 않아졌을 때 사용하는 것이 적절합니다. 희귀 질병의 경우 완전 무작위 배정된 대조군을 구성하는 것 자체가 불가능하기도 합니다. 환자 수가 충분하지 않아서 대조군을 구성하지 못할 수 있습니다. 이때 합성대조군이 유용할 수 있습니다. 또 한 가지는 역시 희귀 질병의 경우로, 표준 치료가 확립되어 있지 않으면 환자 무작위 배정에 윤리 문제가 발생할 수 있습니다. 특히 위약과 관련해서 그렇습니다. 이때도 합성대조군을 사용하는 것이 적합합니다.  

종양학의 경우 표적치료 개발에 정밀 의료가 점점 보편화되면서 환자들이 바이오마커에 따라 세분화됩니다. 그리고 각 세그먼트 규모가 상대적으로 작아지면서 특정 세그먼트는 대조군이 확실한 강력한 임상시험을 개발하기 어려워집니다. 수가 문제가 아닌 경우도 있습니다. 치료제를 표준 치료와 비교하는 임상시험을 시작했는데 새로운 치료제가 계속 나오면서 표준치료법이 연구 도중에 바뀌는 경우도 발생합니다. 이 경우, 연구 설계는 올바른 대조군으로 이뤄졌지만 표준치료법의 변화로 합성대조군이 필요할 수도 있습니다. 마지막으로 흔한 경우는 아니지만 어떤 이유에서 무작위 배정 시 대조군과 균형이 맞지 않을 수도 있는데, 이런 때도 합성대조군을 이용하면 임상시험에 도움이 될 수 있습니다. 

 

좋은 합성대조군을 만드는 방법

무작위 배정시험에서 무작위 배정이 중요한 이유는 치료군과 대조군 간의 균형을 이루기 위해서입니다. 환자 무작위 배정이 끝난 후 follow-up 일정이나 assessment 일정을 잡기 때문에 먼저 합성대조군에 들어갈 환자들이 치료군과 동일할 수 없다면 최대한 유사해야 합니다. 여기서 유사하다는 것은 기저 특성, 질병 특성, 지리 등 몇 가지가 있을 수 있습니다. 어쨌든 목표는 치료군과 최대한 유사한 구성을 만드는 것입니다. 

방법은 여러가지가 있으며, 가장 흔히 사용되는 것은 성향 점수 매칭입니다. 외부에 있는 데이터셋을 가지고 성향 점수 매칭을 진행하여 매우 유사한 환자군을 만듭니다. 여기에 환자군이 전체적으로 임상시험 치료군과 유사하도록 만들어주는 방법도 있습니다. 임상시험 치료군과 합성대조군 간에 이 같은 특성 매칭을 해야 합니다. 

한편, 무작위 배정 시험의 약물 시작일(index date)은 보통, 무작위 배정을 실시하는 날짜입니다. 대조군 출처에 따라 무작위 배정 시험이 아닐 경우, 약물 시작일이 무작위 배정 시험에서 무작위 배정이 이뤄진 날과 동일하게 맞추는 것이 중요합니다. 특히 결과가 단기간에 나온 것이라면 두 데이터셋의 약물 시작일이 조금만 차이가 나도 영향이 있을 수 있습니다.  

assessment 일정과 툴도 중요합니다. assessment 일정이 생존과 같은 평가 변수라면 assessment의 일정이나 툴의 영향을 크게 받지 않습니다. 하지만 대리 평가 변수라면, 예를 들면 질병 진행은 환자 assessment의 빈도에 따라 좌우되기 때문에, 이때는 적절한 assessment 일정을 임상시험군과 합성대조군 모두에 적용해야 합니다. 마찬가지로 assessment 툴도 비슷해야 합니다. 

결론적으로, 기본적으로 지금 문제가 무엇인지를 먼저 잘 이해하고, 목적에 가장 부합하는 대조군을 구성해야 하는 것이 중요합니다. 물론 앞서 언급한 다양한 특성과도 전부 매칭이 되어야 합니다.

 

합성대조군 데이터셋 평가 방법

합성대조군에 활용되는 데이터셋의 출처는 크게 세 가지 유형으로 나눌 수 있습니다. 첫째, 임상시험으로부터 가져오는 합성대조군이 있습니다. 둘째, 실제 세계의 데이터셋으로부터 가져오는 합성대조군이 있습니다. 이 실제 세계의 데이터셋은 잘 설계된 형식의 코호트 연구나 레지스트리로부터 가져오는 경우가 흔해지고 있습니다. 셋째, 전자건강기록처럼 좀 더 즉흥적으로 수집된 실제 세계의 데이터가 있습니다. 

첫 번째 유형인, 임상시험으로부터 가져오는 데이터는 가장 엄격하게 수집된 데이터입니다. 약물 시작일이, 특히 과거 무작위 배정시험에서 가져온 것이라면 확실할 것입니다. 과거 데이터나 assessment가 변경된 경우가 아니라면 assessment 툴도 통일되어 있을 것입니다. 여러 시험에서 follow up 스케줄이 비슷합니다. 따라서 데이터 품질이 꽤 좋습니다. 다만 앞서 언급한 요인들이 모두 잘 맞는 임상시험을 찾기는 어렵습니다. 데이터 품질은 훌륭하지만 데이터 접근성이나 특히 대량의 데이터를 찾기는 쉽지 않습니다. 

두 번째 유형은 레지스트리나 관찰 데이터셋으로부터 오는 대조군으로, 약물 시작일은 추측이 좀 필요합니다. 하지만 데이터 품질은 레지스트리나 코호트 연구 설계가 잘 되었다면 품질이 좋을 것입니다. 분명 고려할 가치가 있는 데이터셋입니다. 

세 번째 유형 즉, 즉흥적으로 수집한 전자건강기록 등은 가장 흔하면서 풍부한 데이터입니다. 데이터 수집이 엄격하게 진행됐는지 여부는 관행 등에 크게 영향을 받기 때문에 품질과 엄격한 수집 면에서는 좀 뒤떨어지고, 클리닝 작업도 많이 필요합니다. 하지만 수천 명의 환자로부터 고를 수 있고 대량의 데이터가 있기 때문에, 어느 데이터셋을 쓸지는 접근 가능성과 무엇을 어떻게 활용해서 매칭을 할 수 있는지에 따라 선택을 잘 하는 수밖에 없습니다. 

 

합성대조군 활용의 미래 

합성대조를 합성 코호트로 단어를 바꾼다면 사용 사례가 크게 늘어날 수 있습니다. 합성대조 또는 외부 코호트를 임상시험 개발 단계 전부터 벤치마킹용으로 사용한다면, 집중하고 싶은 환자 집단이 명확해질 수 있습니다. 또 외부 코호트를 사용할 수 있게 되면 연구 설계, 표본 크기 등을 결정하는 데 활용할 수 있습니다. 앞으로는 규제로 인해 점점 더 대조 시험이 어려워질 것이므로 규제를 위한 합성대조 사용 사례도 많아질 것입니다. 

합성대조 사용은 치료 관련 논의에도 중요한 역할을 할 수 있습니다. 예를 들어, 대조군을 사용한 대조시험을 설계했다고 할 경우, 어느 지역에서는 가능할지라도 다른 곳에서는 다른 표준 치료가 존재하기 때문에 치료법이 그 표준 치료와 비교했을 때 어떤지 보고 싶을 수 있습니다. 이때 임상시험 외적으로 대조군을 가지고 있으면 도움이 됩니다. 

표적 치료가 점점 더 많이 개발되면서, 특정 환자 세그먼트에서는 합성대조군의 필요가 증가할 것입니다. 과거의 임상 개발처럼 아주 쉽게 시험 설계를 하지는 못하겠지만, 반대로 더 넓은 범위의 환자를 치료할 수 있는 넓은 범위의 치료법을 개발할 확률은 줄고, 의약품이 점점 더 좁은 범위의 바이오마커나 돌연변이를 표적으로 하게 될 것입니다. 표적 치료와 정밀 치료의 인기가 올라가면서 합성대조군의 사용은 증가할 것입니다. 물론 전 세계적으로 이런 트렌드가 어떻게 받아들여질지 지켜봐야 합니다.

Jannie Myung-In Jung Image

Jannie Myung-In Jung