탄력 붙은 ‘AI신약’ 세계는 넓고 할 일은 많다

News

AI(Artificial Intelligence)를 활용한 면접, 자동차, 보일러 등은 요즘 우리 주변에서 흔히 볼 수 있는 것이 됐다.
이렇듯 4차산업 혁명의 가장 핵심이라고 할 수 있는 AI는 보안, 기술, 의학 등 다양한 분야에서 우리 삶 속으로 다가왔다. 약학 분야도 예외는 아니다.

인공지능은 신경망 계층구조를 이용하여 심층 기계 학습방법이 가능하고, 데이터를 이용하여 학습시키는 과정에서 알고리즘에 따라 다양한 변형을 주어 스스로 패턴을 추출한다. 따라서 기존방식보다 높은 수준의 예측력이 가능하다. 이를 활용하여 약물의 표적 선정이나 후보 물질 최적화가 가능하기 때문에 신약개발 분야에 AI를 적극 도입하려는 움직임이 활발하다. AI는 신약개발의 패러다임을 획기적으로 변화시킬 것으로 기대되고 있다.

이러한 변화에 발맞춰 여러 제약사들이 AI를 활용한 신약 개발을 모색하고 있다.
해외에서는 90년대 중반부터 AI 활용 신약개발에 적극적으로 뛰어들고 있고, 특히 미국은 이와 관련한 AI 기업들이 포진돼 있기에 가장 왕성한 움직임을 보이고 있다. 미국은 제약회사보다는 AI 기업을 중심으로 신약개발에 나서고 있다.

미국·유럽과 달리, 국내에서는 제약회사가 직접 AI 기술을 신약 개발에 접목하거나 AI 기업을 발굴해 협업한다. SK바이오팜은 AI기반 약물설계(Drug Design) 플랫폼을 업계 최초로 개발하는 데 성공했다. 또한 유한양행, JW중외제약,HK이노엔 (구 CJ헬스케어)등이 유전체 빅데이터 기반 AI 기업인 신테카바이오와 신약 공동 개발을 위해 노력하고 있다. 앞으로 제약 업계가 AI를 중심으로 크게 변화하기에 현재 우리나라의 AI 신약개발의 현황과 한계점, 그리고 미래에 대해서 알아보고자 한다.

△AI 신약 개발?
AI를 통한 신약개발의 원리는 오랜 기간 쌓인 방대한 연구자료 · 병원 진료정보 등의 임상데이터와 신약개발에 최적화된 인공지능 알고리즘을 이용하는 것이다.
최첨단 기술에서는 ‘딥러닝’을 활용한 인공지능 플랫폼을 사용한다. ‘딥러닝’에 주로 사용되는 알고리즘은 CNN(Convolutional Neutral Network)이라는 심층 신경망이다. CNN은 여러 계층으로 이루어져 있는데 이 계층에서의 반복적인 작업으로 서로 다른 특징을 검출하도록 학습된다.

따라서 ‘딥러닝’은 기존의 ‘머신 러닝’과는 다르게 특징과 분류방법을 스스로 학습해서 새로운 결과물을 만들 수 있도록 설계가 된다. 이러한 기술을 활용한 인공지능 플랫폼은 신약개발 과정 중 계속해서 새로운 분자를 제시하여 후보물질 발굴에 도움을 준다. 그리고 최적의 임상 디자인, 전임상 시험 데이터를 분석하며 앞으로의 임상실험결과를 예측하는데 활용이 된다. 이러한 임상을 예측하는 능력은 환자의 진단과정에 있어서도 효율적으로 사용이 될 것이다.

신약개발에 드는 시간과 비용을 단축시켜 진입장벽을 낮춘다는 이점으로 AI의 효용성은 계속해서 커지고 있다.
기존에는 제약회사에서 신약 후보 물질을 찾아낼 때 한 해 동안 연구원 한 명당 평균적으로 200~300건의 연구자료를 분석한 후, 타겟 단백질을 결정하고 후보 물질을 합성했다. 이 시간만 평균적으로 1~5년 정도가 소요되었다.

그러나 인공지능을 활용하면 같은 시간에 논문 100만 건과 임상데이터 400만건을 분석할 수 있는 능력으로 새로운 약물의 설계, 합성 및 검증까지 50일 이내에 처리할 수 있다. 또한 1조 2000억원의 개발비용을 절반 수준인 6000억원대로 낮춰서 경쟁력을 갖출 수 있다. 앞으로 AI 신약개발에 활용할 수 있는 데이터가 많아짐에 따라 신약개발연구가 활발해 질 것으로 기대하고 있다.

△AI 신약개발 현황
이러한 AI를 이용한 신약개발을 다른 나라에선 어떻게 활용하고 있을까? 바이오제약 산업에서 인공지능(AI) 시장이 6년후 38억 달러를 넘을 것으로 전망되는 가운데, 데이터 경쟁, 인프라 확보, 윤리문제 등 도전과 기회요인이 있는 것으로 분석됐다.

딜로이트(Deloitte)의 ‘향후 바이오제약 산업 내 AI 도입에 따른 변화 전망’에 따르면, 바이오제약 산업 내 AI 시장이 2018년 1억 9,830만 달러에서 2025년 38억 8,000만 달러 규모로 성장할 것으로 예상되고 있다. 4대 권역 별 시장규모는 북미, 유럽, 아시아태평양, 남미, 아프리카 순으로 잠재력이 크게 나타났다. 특히 신약개발이 1억5,980만달러(2018년)에서 29억 9,970만달러(2025년)으로 그 폭이 가장 컸으며, 정밀의료와 의료 영상진단 분야 역시 50% 이상의 연평균 성장률이 예상되고 있다.

이미 전 세계적으로 90년대부터 AI를 활용한 신약개발을 시작했다.
그 중, 가장 많은 발전을 이룬 나라는 미국이다. 미국은 제약사보다는 AI 기업 중심으로 AI 활용 신약개발에 나서고 있다. IBM, 아톰와이즈(Atomwise), 버그(Berg), 오믹스(OMICS)등은 신약개발 및 약물 설계를 위한 프로그래밍을 통해 방대한 데이터를 바탕으로 질병, 유전자와 연관 있는 약물 후보를 탐색해 나가고 있다.

특히, IBM의 인공지능 컴퓨터 왓슨(Watson)은 방대한 데이터를 토대로 추론하고 학습과 분석도 해내고 있어 의료산업 분야에서 두드러지게 활용되고 있다. 2016년 화이자는 IBM의 인공지능 ‘Watson for Drug Discovery’를 이용해 면역 및 종양학 연구와 신약 개발을 추진한다고 발표했다.

화이자는 수년간의 신약 개발 자료를 바탕으로, 이를 인공지능으로 분석해 신약 개발과 병용 요법을 연구 중이다. 또한, AI 기반 신약개발 스타트업 ‘인실리코 메디슨(Insilico Medicine)’은 단 46일 만에 후보물질 발굴부터 검증까지 마치면서 업계의 주목을 받고 있다. 통상 2만개의 물질 중 1개를 발굴하는데 2~3년 이상의 시간이 걸린다는 점을 감안하면 시간을 획기적으로 단축한 셈이기 때문이다.

유럽의 경우, 전통 제약사들과 AI 기업의 협업을 통해 개발이 이루어지고 있다. 영국의 베네볼런트AI(BenevolentAI)는 얀센과 제휴를 맺고, 인공지능을 활용해 임상단계 후보물질들의 평가와 난치성 질환에 대한 타겟 신약 개발을 할 수 있을 것으로 내다보고 있다.

특히 베네볼런트AI는 논문 수백만 건을 분석해 루게릭병 치료제를 2건이나 발견해 화제를 모았다. 프랑스의 사노피는 스코틀랜드의 AI 기반 신약개발 기업 엑스사이언티아(Exscientia)와 계약을 맺어 당뇨와 심혈관질환 치료를 위한 신약 후보물질을 발굴하고 있다.

일본에서도 신약 개발을 위한 AI 활용 움직임이 시작되고 있다. 2017년 12월 IT컨설팅 대기업 액센추어의 나가타 미츠루 매니징 디렉터에 따르면 ‘일본 제약기업은 보수, 운용에 IT 부분의 인재, 예산의 80~90%를 투입하는 반면, 해외 제약기업은 이를 30~40%로 줄이고 나머지는 AI나, 빅데이터, 디지털 약 등 첨단기술 개발에 활용하고 있다’고 했다.

다른 나라들에 비해 늦긴 했지만, 2016년부터 제약기업과 IT관련기업, 대학 등 여러 기관이 참가하여 AI를 신약개발에 활용하기 위한 프로젝트로 공동 개발하고 있다. 일본 문부과학성은 2017년 예산 요구안에 25억엔(약 252억 원)을 책정했고 프로젝트가 성공하기까지 최종적으로 100억 엔 규모로 지원해갈 예정이다.

그렇다면 우리나라는 어떨까?

유한양행과 JW중외제약은 AI기술로 작년 기술특례상장을 승인 받은 신테카바이오와 MOU를 체결했다. 이 회사는 유전체 분석 빅데이터를 이용한 3가지의 플랫폼 기술을 가지고 있는데, 첫 번째는 합성신약 발굴용인 PHscan으로 신약개발 알고리즘을 통해 화합물 신약 후보물질을 발굴하는 역할을 한다. 두 번째는 항암백신 발굴용인 NEOscan으로 항암백신 및 신생항원을 발굴하는데 사용된다. 세 번째는 인실리코 기술로 가상실험 컴퓨터 프로그래밍을 말한다. 인실리코 기술로 약물과 표적물질 사이의 결합력과 해리상수를 예측하거나 항암제 바이오마커를 예상하고 약물 적응증을 예측하는 역할로 쓰이고 있다.

△우리나라 AI 신약개발을 위한 과제, 데이터 규제 완화
우리나라는 전 세계적으로 의료기관에 저장되어 있는 전자기록이 많은 나라에 속한다. 그럼에도 불구하고 전자기록을 이용한 다양한 기술들이 발전되고 있지 않은 것은 바로 법적인 규제 때문이다. 대한민국은 데이터의 활용과 공유가 막혀있는 이른바 ‘데이터 동맥 경화‘에 걸린 상태라고 할 수 있다. 인공지능을 이용한 신약 개발이 이루어지려면 먼저 데이터 규제를 과감히 풀을 필요가 있다. 지난 9일 데이터 3법 개정안이 국회를 통과함에 따라 데이터 규제가 완화되어 의료데이터 활용도 활성화될 것으로 보인다.

데이터 3법이란 데이터 이용을 활성화하는 <개인정보 보호법>, <정보통신망 이용촉진 및 정보보호 등에 관한 법률>, <신용정보의 이용 및 보호에 관한 법률> 등 3가지 법률을 말한다. 데이터 3법에 관련하여 제일 주목을 받고 있는 것은 개인 정보를 가명정보와 익명정보 등으로 체계화하는 것이다.

개인정보란 이름, 주민등록번호뿐만 아니라 신체정보나 생활 정보를 포함한 개인의 데이터를 말한다. 가명 정보는 ‘추가 정보의 사용 없이는 특정한 개인인지 알아볼 수 없도록 조치한 정보‘를 말한다. 일명 비식별 정보로 다른 정보와 결합하지 않는 이상 개인이 식별되지 않는다. 익명 정보 역시 통계나 분석 등으로 확인 되는 데이터로 특정한 개인정보처리자가 다른 정보를 결합하더라도 개인을 식별할 수 없다.

다시 말하면, 가명 정보나 익명 정보는 개인 정보로써의 기능이나 가치가 없다. 본회의에 통과된 개정안은 이 중 가명정보에 해당하는 빅데이터를 통계, 공익, 연구 목적 등으로 활용할 수 있도록 하였다. 이에 따라 한국제약바이오협회는 “데이터 3법의 국회 통과는 AI, 빅데이터를 활용한 신약개발과 맞춤형 정밀의료 시대를 앞당기는 헬스케어 혁신의 일대 전환점이 될 것”이라며 의약계의 밝은 전망을 기대 중이다.

하지만 데이터 3법의 통과에 밝은 전망만 존재하는 것은 아니다. 데이터 수집과 처리가 손쉬워지면 개인 정보 침해의 위험뿐만 아니라 2014년 카드사 대량 정보유출 사건과 같은 데이터 관련 각종 범죄도 증가할 수 있다는 문제점도 있다. 정부와 기업들은 데이터 주체인 국민들의 개인정보를 보호할 의무가 있다. 따라서 충분한 의견 수렴과 논의를 거쳐 법을 개정해나가고, 신중하고 차분하게 빅데이터 산업을 발전시켜야 한다.

△신뢰성 있는 의료 데이터 확보
임상 데이터 질 검증, 전임상 동물시험, 바이오마커나 타겟, 신약 후보물질 발굴 등에 인공지능을 활용하려면, 검증된 의료 데이터로 학습시켜야 한다. 인공지능은 머신러닝, 딥러닝이라 불리는 학습을 거치게 된다. 이는 기존에 주어진 방대한 양의 입력된 데이터를 통해 인공지능 스스로 알고리즘을 파악하여 새로운 데이터를 처리해나가는 방식이다. 신약개발에서도 인공지능을 활용하기에 앞서 인공지능을 학습시킬 의료 데이터가 필요하다.

이 때 중요한 것은 데이터의 양과 질이다. 먼저 방대한 양의 데이터가 확보되어야 하고, 그 데이터가 신뢰성 있는 자료여야 한다. 지난 2019년 12월, ‘인공지능 국가전략’에서 발표한 내용에 따르면, 정부는 2021년 신약개발플랫폼 구축을 목표로 하고 있다. 올해 2020년에는 의료데이터 중심병원을 5개 지정, 운영하여 병원 단위로 임상 빅데이터를 연구개발에 활용할 수 있도록 한다. 또한, 2021년까지 임상 검증용 표준 데이터를 마련하고 관련한 전문적인 심사체계를 구축하는 것을 목표로 한다.

△AI 아는 '인재'가 힘이다
인공지능을 신약개발에 활용하기 위해서는 이를 담당할, 약과 AI에 모두 능통한 전문가가 필요하다. 약학 전공인이 AI를 배우거나, IT 전공인이 약학을 공부해야 한다.
아직은 대학에서 이를 가르치는 교육과정은 미비하다. 앞으로는 약학대학에서도 AI 신약개발을 담당할 인재 양성을 위해 빅데이터 활용법, 머신 러닝, 딥러닝 등의 과목을 개설하는 것이 필요해 보인다.

국내에서는 2019년 5월 한국제약바이오협회와 보건산업진흥원이 인공지능신약개발지원센터를 설립했고, 심평원과 MOU를 체결하여 AI 신약개발 플랫폼 구축과 전문가 양성을 목표로 하고 있다. 회사 차원에서도 스탠다임, SK바이오팜, JW중외제약, 한미약품, 대웅제약, CJ헬스케어, 유한양행 등이 AI를 활용한 신약개발에 플랫폼을 구축하고 있다.

스탠다임과 CJ헬스케어는 항암 신약 파이프라인 공동 개발 을 담당하고 있다. JW중외제약은 AI기반 빅데이터 플랫폼 ‘클로버’를 통해 암 환자의 세포주를 이용한 약물 스크리닝과 약물 설계 프로그램을 데이터베이스화했다.

SK바이오팜은 그동안 축적된 신약 후보물질 데이터를 통해 화합물 데이터 보관소를 만들어, 새로운 화합물을 개발하는 데 활용하고 있다. 한미약품은 ‘메디데이터’를 통해 AI를 임상시험에 활용하고자 한다. 유한양행은 캐나다의 바이오테크 기업과 AI 플랫폼 확보를 위해 공동 연국 계약을 맺었다. 대웅제약은 울산과학기술원과 AI 신약개발 및 바이오메디컬 관련 공동연구를 추진 중이다. ‘인공지능 국가전략’에서 발표된 내용에 따르면, 정부는 신산업 분야와 관련한 학과를 새로 만들거나 증설하고, 의료 인력 양성을 목표로 미래사회 첨단분야 인재 양성을 추진할 예정이다.

AI는 4차 산업혁명의 도래와 함께 여러 분야에서 주목 받고 있는 주제이다.

기존의 신약개발 연구방식과 비교했을 때 신약개발에서 AI의 활용은 시간 및 비용 측면에 분명한 이점을 제공하고 있다.
전 세계적으로 제약산업 내에서 AI의 활용과 관련 시장의 성장은 가속화 되는 추세이고, 우리나라 또한 이러한 추세를 따라 2019년부터 향후 3년동안 AI 신약개발 플랫폼 구축 사업을 시작하겠다는 의사를 표명했을 만큼 AI의 중요성과 효용성을 분명히 인지하고 있다.

현재 국내 제약시장은 신약개발보다는 제네릭과 개량신약을 중심으로 돌아가고 있으나, IT 강국으로 저명한 한국이 AI 기술을 적극 활용한다면 세계 제약 산업을 주도하는 국가로 도약할 수 있을 것이다. 하지만 그 전에 데이터 규제 완화, 신뢰도 높은 의료데이터의 확보, 인력 양성 등의 과제를 해결하는 것이 우선이다.

신약개발에 필수 인력인 약사들 또한 변화하는 시류에 발맞춰, AI를 이용한 신약 개발 및 관련 지식에 적극적으로 관심을 갖고 약학 전문가로서 역할에 대해 고민하는 자세가 필요할 것이다.