본문 바로가기

연구수첩/보건의료근거연구

[Vol.3 7월호] 알기 쉬운 EBM :: 메타분석



   글. 박동아(한국보건의료연구원 의료기술분석실)



메타분석이란 개별 결과들을 통합할 목적으로 각 개별 결과들을 결합한 값을 산출하는 통계적 분석방법을 의미한다. 치료적 맥락에서 접근할 때, 치료 효과의 평균을 산출하는 복잡한 통계적 분석방법을 의미한다. 


일차 자료들에서는 메타분석이라는 용어 이외에도 pooled effect, pooled analysis, overall effect, summary effect, combination of estimates, quantitative synthesis 등의 다양한 용어가 혼재되어 비슷한 의미로 통용되고 있다.

 


| 메타분석을 왜 수행하는가?


메타분석을 수행하는 목적은 첫째, 효과 크기 및 그 불확실성을 정량화하기 위해서라고 할 수 있다. 어떤 기술의 치료 효과를 한 마디로 얘기해주고자 할 때 여러 결과들은 표본 변동 등 단일하게 접근할 수 없을 때 메타분석을 통해 불확실성을 검증하면서 효과크기를 단일한 값의 정량화된 수치로 언급할 수 있게 된다.  


둘째, 메타분석은 정확성과 검정력을 높이기 때문에 일차연구들이 확보할 수 없었던 검정력과 정확성을 증대시킬 수 있다. 


셋째, 메타분석을 통해 연구들간의 이질성을 검토하여 결과의 일관성(일반화가능성)을 평가할 수 있다. 


넷째, 메타분석을 통해 일차 연구들에서 제시하지 않는 문제에 답할 수 있게 된다. 이는 연구들 마다 고려한 요인이 다를 수 있고 다른 목적으로 시행되더라도 단일 결과 변수를 언급하는 결과들의 결합을 통해 일차연구들에서 간과했던 중요한 다른 결과변수에 대한 효과 추정치를 산출할 수 있게 된다.  


다섯째, 연구들마다 결과를 달리 보고할 경우 이에 대한 단일의 결과를 산출하기 위해서 시행할 수 있으며 새로운 가설을 생성할 수도 있다.   



| 메타분석은 언제 수행가능한가? 언제 수행을 자제해야 하는가?


메타분석은 하나 이상의 일차 연구결과가 존재할 때 수행가능 하며, 일차 연구들의 일반적인 특성이 다르지만 이들이 효과 추정치에 미치는 영향이 크지 않을 경우 수행가능하다. 


아울러 결과변수 및 효과추정치 측정의 방법이 비슷해야 하며 자료들이 이용가능할 정도의 정보로 보고되어 추출가능할 때 실제적으로 메타분석이나 체계적 문헌고찰에서 분석에 이용될 수 있다.

 

메타분석을 수행하면 안될 때를 크게 두 가지로 표현한다.


1) 'Garbage in - Garbage out'

메타분석은 사용되는 정보가 바르고 좋아야 좋은 결과를 산출할 수 있다. 메타분석과 체계적 문헌고찰을 통한 결과는 사용되는 일차연구 수준 만큼이라는 말이 있다. 이 의미는 사용되는 일차연구가 좋아야 메타분석을 통해 산출되는 결과값도 좋을 수 있다는 의미이다. 


앞서 언급하였듯이 메타분석은 검정력과 정확성이 증가되는 특성을 가지는 통계 방법이므로 사용재료에 상관없이 통합함으로써 비뚤어진 일차연구에 비해 신뢰구간이 더 좁은 결과 추정치가 산출되는 점을 명심해야 한다. 즉, 위와 상황은 개별연구들이 심각한 바이어스를 가지고 있을 때 나타날 수 있다.


2) ‘Mixing apples with oranges'

체계적 문헌고찰과 메타분석은 일차 연구를 사용하여 이차적인 분석을 통해 새로운 결과를 도출하는 연구방법이기 때문에 사용되는 재료가 비교적 일관적이고 비슷할 경우 이들이 나타낸 결과들을 합성함으로써 단일의 믿을 만한 효과를 추정하는 것이 바람직하다. 


따라서 개별연구들이 임상적으로 너무 특성이 다를 경우나 합성할 수 없는 자료들을 강제적으로 합성할 경우 아무런 답변도 줄 수 없는 결과를 낳게 될 수도 있음을 주의해야 한다.



| 메타분석 수행의 세부절차


체계적 문헌고찰 수행 과정 중 분석단계에 해당하는 메타분석을 수행할 때 실질적으로 고려하거나 시행하게 되는 세부적인 절차는 다음과 같다.


1) 자료형태에 따른 요약 통계량 유형을 검토하고 어떤 요약 통계량으로 산출할지를 사전에 결정한다. 

결과변수의 자료는 이분형 자료, 연속형 자료, 순서형 자료 및 생존형 자료들로 구분될 수 있으며 이들과 관련된 요약통계량 유형을 세부적으로 검토하여 사전에 어떤 요약 통계량(예; OR, RR, MD etc)으로 결과들을 산출할지를 정하도록 한다.


2) 통계 모형을 결정한다.

고정효과모형으로 메타분석을 시행하여 평균 효과 추정치를 산출할지 랜덤효과모형으로 일반화 가능성을 고려한 효과 추정치를 검토할지를 정한다. 물론 통계적 이질성이 나타날 경우, 랜덤효과모형을 적용하게 되며 사전에 그럴 예정임을 정하면 된다.


3) 이질성을 검토한다.

자료형태 및 요약 통계량, 모형을 선정하여 분석을 수행한 후 산출된 결과에 대한 통계적 이질성을 검토해야 한다. 대표적인 방법으로는 forest plot에 포함된 일차 연구들의 신뢰구간의 겹침정도 등을 시각적으로 평가하는 방법과 통계적 검정 및 이질성 측정치를 고려하는 방법으로 시행된다. 통계적 검정에는 카이제곱 검정이 일반적인 방법으로 사용되며, 이때의 Q-검정은 포함되는 문헌의 양이 적어 대체적으로 검정력이 낮은 점을 감안하여 p<1.0을 통계적 유의수준으로 사용할 것이 권고된다. I2 통계량(Higgins 등, 2003)은 효과 추정치에서의 변이성에 대해 퍼센트로 표현되는 이질성에 대한 통계량으로 보통 50% 이상일 때 실제적인 이질성이 있는 것으로 해석한다.


4) 이질성 문제가 크지 않을 때 메타분석은 수행할 수 있다.


5) 이질성이 확인될 경우, 원인을 파악해야 한다.

이질성의 원인을 탐색하는 방법은 하위군 분석, 메타-회귀분석, 민감도 분석 등이다. 하위군 분석의 경우 사전에 효과 추정치에 영향을 미칠만한 요인들을 선정한 후 탐색해야 연구 수행에서의 비뚤림 위험을 최소화할 수 있다.


6) 이질성의 원인을 설명하지 못한 경우 일반적으로 메타분석은 권고되지 않으며 질적으로 검토하게 된다. 다만, 통계적 이질성이 나타나더라도 다른(일반화 가능성 및 탐색적인) 목적으로 효과 추정치 산출을 요구할 경우, 반드시 연구간 이질성을 전제로 하는 랜덤효과모형으로 수행되어야 한다.


7) 메타분석에서는 효과 추정치 산출과 함께 funnel plot을 통한 보고 비뚤림(reporting bias)의 영향을 확인할 수 있으며 결과에 미치는 다양한 영향을 탐색하면서 연구결과의 신뢰성을 검토하기 위하여 민감도 분석을 수행한다. 일반적으로 질평가 결과를 접목하여 연구의 질이 연구결과에 미치는 영향이 어떠한지 등을 검토한다.



| 메타분석의 통계모형


메타분석의 통계 모형에는 고정효과모형(fixed effect model)과 랜덤효과모형(random effect model)이 대표적이다. 고정효과모형은 각 연구에서 가정하는 실제 효과(true effect)가 공통적이라고 가정하는 모형으로 모든 연구들에서 추정하는 이 'single true effect'를 산출하기 위해 적용되는 가장 일반적으로 사용되는 모형이다. 랜덤효과모형은 각 연구가 가정하고 있는 실제 효과 크기가 고정되어 있는 않다(다르다)고 가정하는 모형으로 우리는 이때 효과들은 어떤 분포(일반적으로 정규분포)를 따르는 것으로 추정한다.


랜덤효과모형에서의 각 연구들은 평균 치료효과를 중심으로 퍼져있는 모집단내 연구들로부터 무작위로 추출된 연구들인 것으로 치료효과들간 변동은 표본추출 변동과 더불어 연구들간 변동이 함께 나타난 것이다. 따라서 랜덤효과모형으로 수행된 메타분석의 효과추정치는 치료효과 분포의 평균을 추정한 것이며 다른 대상자들에 이 추론을 일반화하고자 할 때 권장할 수 있는 모형이다. 위에서 언급되었듯이 이 모형은 설명되지 않은 연구들간 이질성의 영향도 포함되어 연구내 변동과 연구간 변동 모두에 대한 보정된 가중치가 사용되는 특징을 가지며, 일반적으로 신뢰구간이 고정효과모형 보다 더 넓게 나타나 보수적인 접근법으로 간주된다.  

 



 


아래 Forest plot은 RevMan 프로그램을 통해 나타나는 고정효과모형의 이분형 결과변수에 대한 메타분석 결과이다. Forest plot에는 각 개별연구의 결과들 및 이들이 가지는 각각의 가중치와 함께 통합 결과가 제시되며 이질성 검정에 대한 상세 결과도 제시된다.

 




그림 2 Forest plot using RevMan program  

 

 


| 이분형 결과변수에 대한 메타분석


이분형 결과변수에는 사망/생존, 통증있음/통증없음과 같이 이분적으로 구분되어 보고되는 자료형태를 의미한다. 일반적으로 필요한 자료는 각 치료군별 전체 대상자 수(N)와 사건 발생 대상자 수(n)이다. 다만, generic inverse variance method를 사용할 때 더 많은 연구 수가 포함될 경우 각 연구에서의 효과 측정치(OR, RR 등)의 로그 변환값과 이 값의 표준오차(standard error, SE)나 측정치의 95% 신뢰구간 혹은 P-value를 활용할 수 있다.


이분형 결과변수의 요약 통계량에는 OR(odds ratio), RR(relative risk, risk ratio), RD(risk difference) 등이 있다. 유일하게 강력히 권고할 만한 추정치는 없으며 일반적으로 OR, RR로 메타분석을 수행할 것을 권하며 결과를 임상적으로 더 의미있는 측정치(예, number needed to treat, NNT)로 전환하여 해석할 것을 권한다. 


   [이분형 결과 추정치와 그 해석] : Treatment group vs. Control group


 

  

 

| 연속형 결과변수에 대한 메타분석


연속형 결과변수는 체중, 키, 검사 수치 등의 연속형 값으로 제시되는 자료를 의미한다. 가끔은 척도로 표현되는 측정값들도 해당된다(예, quality of life, visual analogue scales 등). 연속형 자료들이 나타내는 통계량은 위치를 요약하기 위하여 평균(mean), 중앙값(median), 최소/최빈값(mode), 분위수(quantiles) 등으로 표현되며, 분포를 요약하기 위하여 표준 편차(standard deviation, SD), 범위(range), 사분위간 범위(interquantile range) 등으로 기술된다. 연속형 자료의 메타분석은 현재 평균값과 표준편차를 이용하는 분석이 대표적이므로 자료의 치우침(skewed)에 따라 보고된 다양한 통계량들에 주의하여 수행하고 검토할 필요가 있다.


연속형 결과변수의 효과 추정치는 모든 연구에서의 자료가 동일한 척도로 보고된 경우 평균의 차이(mean difference, MD)를 구하며, 연구에서 각기 다른 척도를 사용하였을 때는 표준화된 평균의 차이(standardized mean difference, SMD=MD/Pooled SD)로 표현한다. 메타분석이 필요한 자료는 일반적으로 각 군의 결과 측정에 참여한 대상자 수(N), 측정 변수의 평균값, 표준편차이며, 평균, 표준편차를 보고하지 않고 MD, SMD와 같은 효과 추정치만 보고된 경우, generic inverse variance 방법을 사용할 수 있으며 이때는 MD, SMD의 표준오차(SE)나 95% 신뢰구간 및 P-value 값이 활용될 수 있으므로 자료추출시엔 일차연구에서 보고하는 모든 측정치들을 추출하는 것이 유용하다.


연속형 결과변수의 메타분석에서는 endpoint 결과값 이외 변화값(change score)을 사용할 수 있다. 연속형 결과변수에 대한 자료추출을 시행해 보면, 일부 문헌에서는 최종값을 어떤 문헌에서는 변화값만을 보고하는 등의 결과값의 자료 형태뿐 아니라 그 시기도 다양하다. 우선, 변화값들이 그 값의 표준편차를 보고하고 있다면 메타분석에 사용할 수 있지만, 대부분의 문헌에서 변화값의 SD를 보고하지는 않고 있다. 따라서 코크란 핸드북 등에서는 일반적으로 최종값으로 메타분석하는 것을 권하고 있으며 다만, 변화값과 최종값이 동일한 변수를 추정하는 값일 경우, 통합할 수 있다고는 언급하고 있다.


연속형 결과변수의 해석은 어느 정도의 평균 차이가 임상적으로 중요한 차이(clinically important difference)인지를 알아야 하지만, 실제 이 차이가 규명된 임상 영역은 드문 것이 현실이다. 따라서 아래와 같이 통계적인 측면의 해석은 가능하지만, 임상적인 의미에 바탕을 둔 해석이 뒷받침 되어야 함을 명심해야 한다.