보건의료이슈

의료 AI의 현재와 미래

 

글. 최병욱 교수(연세대학교 의과대학)

 

“멀지 않은 미래에 환자의 진료 현장에서, 즉시, 수많은 문헌과 데이터로부터 추출된 가장 뛰어난 지식과 경험을 사용하여 모든 환자에게 맞춤형 진단과 치료를 제공할 수 있고 공감하는 환자-의사 관계가 재정립될 것을 기대한다.”

 

 

인공지능(Artificial Intelligence, AI)의 발전이 가능했던 것은 컴퓨터 연산 능력의 발전과 AI를 학습할 수 있는 충분한 빅데이터의 형성 그리고 깊은 신경망을 이용한 학습 방법 때문이라고 한다. 의료에서도 인간의 인지능과 분석능으로 해결할 수 없는 막대한 양의 디지털 데이터가 형성되고 이를 효율적으로 다루는 AI의 등장으로 의료의 혁신이 기대되고 있다. 의료 AI 기술의 발전으로 기대되는 효과는 진단, 치료, 예후 예측에서의 정확성과 정밀성 향상, 의료 시스템의 효율성 향상, 신약 개발, 전문성의 대체 등으로 요약될 수 있다. 기대되는 효과 중 가장 혁신적인 것은 기술의 디지털 속성이다. AI는 컴퓨터 연산 성능에 비례하여 사람이 처리할 수 있는 능력의 수천 수만 배의 속도로 데이터 처리가 가능하여 전문가 수천 수만 명이 하는 일을 동시에 해낼 수 있다. 그리고 가장 경험이 많은 의사보다 훨씬 많은 경험을 학습한 AI는 장소와 시간의 제약 없이 무제한 복사와 실행이 가능하다. 그러나 의료 AI의 임상 적용은 성능과 안전성에 대한 임상 검증의 부족, 임상 환경에서의 활용성 혹은 적합성 부족, 임상 시스템의 적극적 변화와 적응 노력의 결핍 등의 이유로 성공적인 사례가 아직 드물다.

 

의료 AI 기술의 단점은 크게 3가지가 지적된다. 1) 심각한 데이터 의존성, 2) 설명 부족, 3) 단순 태스크만 가능한 알고리즘. 이러한 현 단계에서 AI 기술의 단점 혹은 한계를 극복하기 위한 연구가 관심을 끌고 있다. MD Anderson 암센터와 공동연구로 진행되던 IBM사의 Dr. Watson for Oncology 프로젝트가 좌초된 것은 현재 AI 연구에서 데이터의 이슈가 얼마나 큰지를 드러낸다. MD Anderson 암센터에서 프로젝트를 이끈 Dr. Lynda Chin은 ‘구조화되지 않고 표준화되지 않은 의무기록을 이용하여 AI 모델을 학습 시키는 것과 다양한 형태의 의료 데이터를 수집하고 통합하는 것이 매우 어렵다’ 고 하였다. 데이터를 수집, 정제, 통합, 가공하는 일은 많은 자원을 요구하며, 다양한 의료 데이터의 표준화를 위한 효율적인 방법이 없는 경우가 많다. AI 학습에서 입력데이터에 대한 표준화 및 정제의 필요성에 비하여 데이터의 양에 대한 요구가 더 크지만, 출력데이터는 표준화되고 불확실성이 제거된 양질의 데이터가 요구된다. AI의 검증을 위하여는 양질의 소수 데이터로도 충분한 경우가 많다. 의료 데이터의 신뢰성 확보를 위하여 디지털화, 형식의 통일, 임상적, 정량적 표준화를 이루어야 한다. 개인민감정보를 둘러싼 데이터 보안과 공유의 대치는 사회적 합의 및 공감대 형성을 기반으로 한 정책적 또는 기술적 대안을 마련해야 한다. AI의 제반 기술로서 데이터 관련 기반 기술의 포괄적이고 동시적인 연구개발이 필요하다.

 

설명이 가능한 AI 기술에 대한 관심도 매우 높다. 의학적 결정에 대한 근거나 결과 도출에 대한 논리적 설명이 있어야만 의사나 환자가 치료의 효과나 실패에 대해서 이해할 수 있고 또한 경험에서 배우고 개선할 수 있다. 그러나 깊은 AI 신경망 속 수많은 파라미터의 의미를 밝히는 일은 거의 불가능해 보인다. 빅데이터 분석에 탁월하지 않고, 개인적인 지식과 경험에 의존하는 의사나 환자에게, 인간 인지능력 밖의 빅데이터를 분석한 결과에 대하여 논리적 해설이 가능한지 의문이다. 기전은 정확히 밝혀지지 않았으나 임상시험에서 효과가 검증된 약물처럼, 설명이 가능하지 않지만 임상 검증이 충분하게 이루어진 AI 기술이 임상에 사용될 수 있을 것으로 전망된다. AI 기술이 결과 중심적이고 설명을 하지 않기 때문에 별도의 연구를 통해 의학 지식의 진보를 이루어야 하며 AI는 이러한 임상연구의 훌륭한 보조적 역할을 수행할 수 있을 것으로 기대된다.

 

의료 AI의 기술을 임상에 적용하기 위하여 충분한 임상 유용성 및 안전성이 검증되어야 한다. AI 모델의 학습에 이용한 데이터와 개발된 AI를 적용할 대상 데이터가 매우 이질적일 수 있고, 특정한 목적으로 개발된 AI가 다른 목적의 임상 시나리오에 적용될 수도 있다. 또한 특정 데이터로 검증된 AI 모델의 성능은 표준화된 검증 데이터 없이는 성능과 안전성의 객관적인 파악이 어렵다. 그러므로 개발된 AI가 다른 의료 환경에서 성능이 저하될 수 있음을 고려하여, 적용 전에 대상이 되는 의료 환경을 반영하는 로컬데이터로 AI를 재검증 하는 과정이 필요할 수 있다. 임상 검증을 위한 표준 검증 데이터 구축과 검증의 방법론은 AI 기술의 임상 적용을 위해 반드시 필요하다.

 

<그림 1. 다양한 의료 데이터를 이용한 AI의 연구 개발 예시>
(출처: Rajkomar et al. Machine Learning in Medicine. N Engl J Med 2019;380(14): 1347-1358.)

 

AI 적용 데이터에 인간이 인지하지 못 할 정도의 미세한 변화를 추가함으로써 잘못된 결론을 유도할 수 있는 적대적 공격(Adversarial attacks)은 컴퓨터 공학에서 잘 알려져 있는 사실이다. 최근 하바드대학교의 연구팀은 헬스케어 시장에는 경쟁적 갈등, 막대한 경제적 이득 등의 요소가 개입되어 있기 때문에 의료 AI 기술의 취약성이 악용되어 AI 기술의 활용을 저해할 수 있음을 경고하였다(Science 2019: 363, 6433). 또한 이 문제를 대처하기 위하여 의학, 공학, 법학, 윤리 전문가들이 적극적으로 개입하여 정책을 만드는 것이 필요하다고 하였다.

 

의료 AI 기술 개발, 임상 적용, 상업화를 위해 넘어야 하는 많은 장애와 규제가 있다. 그러나 국내의 높은 의료수준, 양질의 의료데이터, 비판적이고 철저한 임상 검증 등의 긍정적 요소를 잘 활용해야 한다. 의료 AI 기술을 선도를 하기 위하여 기업이 수익모델을 쉽게 만들 수 있도록 해야만 재투자의 선순환이 가동될 수 있을 것으로 기대한다. 현재의 단순 태스크 해결형 AI에서 다중모달(multi-modal), 복합질환(multi-disease), 다병변(multi-lesion)을 다루는 연구 개발로 이행되어야 한다. 아울러 앞으로 변화될 미래환경인 5G 환경에서 라이프로그 데이터, 원격진료, 인터넷 병원 등에 적용될 신기술을 개발, 적용, 검증하는 고수준의 연구 개발을 지향해야 한다.

 

※ 본 기고문은 저자 개인의 의견이므로 한국보건의료연구원의 공식 입장과 다를 수 있습니다.

 

 

댓글을 달아 주세요