본문 바로가기

생생이슈/보건의료이슈

[Vol.43 12월호] 보건의료이슈 :: 보건의료 빅데이터의 개인정보보호와 개인정보활성화의 필요성




글. 지선하 교수 (연세대학교 보건대학원)


ⓒpixabay


개인정보를 이용한 연구의 쾌거 “흡연과 폐암의 관련성” 


1942년 콜럼버스가 아메리카 대륙에서 담배를 발견하였다. 담배는 유럽에 소개되면서 두 차례 흡연의 대유행으로 이어졌다. 첫 번째 유행은 1914년 1차 세계대전 전후이고, 두 번째 유행은 1939년대 2차 세계대전 전후이다. 흡연의 유행과 함께 일부 흡연자들은 건강에 이상소견을 호소하기 시작하였고, 이에 담배회사들은 담배 속의 독성을 줄이기 위해서 1935년부터 필터담배를 생산하기 시작하였다. 그러나 지금도 그렇지만 필터담배는 흡연의 폐해를 막지는 못하였다. 흡연의 폐해를 학술적으로 밝혀낸 최초 연구는 1950년 영국의사로 구성된 대규모 코호트연구이다. 이 연구는 4,000 여명의 대상자를 20년 추적한 연구결과를 1974년에 발표하였고, 50년 추적한 결과를 2004년에 발표하면서 비흡연자 대비 흡연자의 폐암 발생률이 14배 높다고 보고했다. 이는 대규모 인구집단의 개인정보를 추적하여 폐암사망을 관찰한 연구이다.

 

담배 속의 어떤 물질이 암을 일으키는지에 대한 동물실험이나 발암 기전이 분명하게 밝혀지기 전이었고, 오직 대규모 인구집단 정보를 활용하여 밝혀진 사실이다. 인구집단 연구가 중요한 것은 연구결과의 충격효과가 매우 크다는 점이다. 동물실험에서 밝혀진 연구는 사람을 대상으로 하는 인구집단에서 연구내용이 재현되고 입증되어야 비로써 실제 적용이 되지만, 인구집단 연구는 사람자료를 토대로 한 연구이므로 일반적으로 그대로 적용되기 때문이다. 그러기에 흡연이 폐암에 미치는 인구집단 연구결과에 따라 국가적으로 강력한 금연정책이 수립되었고 공공장소에서의 흡연을 제한한 결과 수백만 명의 생명을 구하게 되었으며, 역사적으로는 보건학 연구의 쾌거로 기록되고 있다. 연구대상의 개인정보는 당연히 잘 보호 되어야 하겠지만, 이를 잘 활용하면 개인과 국가에게 큰 이득으로 돌아간다. 


우리나라 보건의료 빅데이터의 상호연계부족으로 인한 부정확한 연구결과 생산   


개인정보란 성명, 주민등록번호 등 개인을 파악할 수 있는 자료를 의미한다. 2011년 제정된 개인정보보호법이 일반법에 해당하므로 타 법률에 특별한 규정이 없는 한 해당법의 원칙이 준수되고 있는 상황이다. 현재는 민감정보 및 고유식별정보 처리 시 동의를 받거나, 법령에서 허용하는 경우만 가능하고 고유식별정보 암호화 등 안정성 확보가 필요한 상황이다. 국내 공공기관이 보유하고 있는 보건의료 빅데이터는 <표1>과 같다.


<표1> 국내 공공기관이 보유하고 있는 보건의료 빅데이터

구 분

생물학적요인

의료제도

생활습관

환경

국민건강보험공단/건강보험심사평가원

건강검진자료

건강보험

청구 지급자료

건강검진자료

수급자 자격DB

질병관리본부

유전체데이터

코호트자료

인체자원자료

퇴원손상심층

조사자료

국민건강영양조사/지역사회건강조사

-

보건사회연구원

-

한국의료패널

한국의료패널

-

국림암센터

암등록자료

-

암등록자료

-

통계청

사망원인자료

-

-

사회경제통계

기상청

-

-

-

기상 및 환경관련자료

의료기관

EMR자료

EMR자료

-

-

SNS

-

-

SNS 데이터

-

웨어러블 디바이스

생체자료

-

생활습관, 운동량 데이터

환경관련 데이터


위 자료들은 각 기관에서 대부분 공개되어 연구사업에 사용되고 있다. 문제는 자료간의 연계가 제한적이라는 것이다. 대표적인 예로 국민건강보험공단의 건강검진자료와 국립암센터의 암등록자료는 연계가 되지 않고 있다. 


국민건강보험공단은 전 국민 건강검진자료를 보유하고 있고 이를 통해 세계최대규모의 코호트를 구축하고 있다. 그러나 코호트 연구에서 질병자료에 해당하는 암 발생자료는 정확성이 부족한 청구 자료를 활용할 뿐 국립암센터의 암등록자료와 연계가 되지 않고 있다. 이런 상황에서 흡연여부에 따른 폐암발생 관련성을 보면 비흡연자대비 현재흡연자가 갖는 폐암의 비교위험도는 3배 정도를 보인다. 이는 미국이나 영국에서 보고되는 10배와 차이가 난다. 이래서 smoking paradox 라는 새로운 용어까지 학계에 대두되고 있다. 


개인정보보호를 이유로 자료 연계가 되지 않음으로써 우리나라는 흡연의 폐해가 과도하게 저 추계되고 있다. 국립암센터에서 2009년에서 발표한 흡연에 의한 폐암의 비교위험도 2.6과 기여위험도 22.8% 역시 외국의 자료와 비교하면 턱없이 낮은 수치이다. 이러한 자료는 담배소송에서 담배의 폐해를 줄이려는 담배회사의 변론에 사용되고 있고, 국민들은 잘못된 정보를 접하고 있다. 즉, 개인정보보호만을 지나치게 강조하면, 국민의 건강과 예방에 필요한 정보의 정확한 생산이 저해되고 이로 인해 개인적으로나 국가적으로 상당한 피해를 입을 수도 있다. 이를 방지하게 위해서 보건의료빅데이터 관련 개인정보보호의 Best Practice의 모색이 필요하다.  


첫째, 개인정보 수집에 대한 규제를 위해서는 먼저 건강에 관한 개인정보의 역할과 정보보호의 범위를 확립해야 한다. 기존의 개인정보와 관련된 법률은 보호의 측면만을 너무 강조한 나머지 활용의 측면이 무시되고 있음을 지적하고 있다. 


둘째, 보건의료 빅데이터의 보안과 관련해서 어떻게 자격을 부여하고 접근권한을 관리할 것인지를 고민해야 한다. 보건의료 빅데이터의 연계 및 활용을 위해 가장 필요한 기술은 주민등록번호를 암호화하여 비식별화하는 것이다. 


셋째, 개인정보의 비식별화에 대한 법률적 해석, 제 3자 제공에 대한 규정을 보다 구체화해야 한다. 또한 정보주체에게 충분한 권리를 제공하며 정보주체와 충분히 의사소통을 해야 한다.


넷째, 보건의료 빅데이터의 연계 및 활용에 관한 지침을 확립해야 한다. 


의와 같은 조치를 통해 공익적 목적의 연구를 활성화할 필요가 있다. 각국의 개인정보 정책은 정보주체의 사전 동의를 전제로 하지만, 공익적 연구에 대해서는 예외적 허용을 적용하고 있다. 공익적 의학연구의 보호를 위한 입법적 조치가 시급한 실정이다. 

 

※ 본고는 외부 필자의 원고로서 한국보건의료연구원의 의견과 다를 수 있습니다.