의료 빅데이터를 이용한 신약 후보군 탐색 – 알츠하이머 치매 치료제 2편

라인웍스는 복잡하게 얽힌 대량의 의료보건데이터에서 시그널을 탐지할 좋은 방법을 고심해왔습니다.

빠르고 광범위하게 탐색할 수 있는 빅데이터 분석 기법과 사례를 소개합니다. 분석에 대한 자세한 문의는 여기로 해주십시오.


지난 글에서는 신약 개발의 비용과 시간 효율성 향상을 위한 방법 중 하나인 신약재창출에 대해 소개하고, 성공적인 신약재창출을 위한  빠른 개념증명의 중요성을 살펴보았습니다. 이번 글에서는 건강보험심사평가원 빅데이터 분석 사례를 살펴보고자 합니다.비스테로이드 소염제의 복용 여부에 따른 치매 발생 여부를 확인하고, 이 약물을 신약 후보군의 시그널로 활용할 수 있는지 확인해보겠습니다. 본 사례는 건강보험심사평가원의 오픈R&D 센터[2]를 통해 분석하였습니다.  

 

후향적 코호트와 상대위험도

후향적 코호트는 연구시점보다 과거 기록을 이용하여 원인과 결과의 관련성을 추적하는 방법입니다[1]. 건강보험청구자료 등 대규모 데이터베이스를 이용하기 때문에, 이 방법은 전향적 코호트에 비해 짧은 시간과 적은 비용으로 연구를 수행할 수 있다는 장점이 있습니다. 특정 인구집단을 선정하고 여러 위험 인자들을 미리 조사해둔 뒤 장기간의 추적하는 전향적 코호트와 반대로 이미 수집된 데이터를 이용한 연구를 진행하므로 시간을 효율적으로 단축할 수 있습니다.

<그림 1. 후향적 코호트 설계>

본 사례의 후향적 코호트는 그림 1과 같이 선정했습니다. 6년간(2010년~2015년)의 건강심사평가원 빅데이터에서 전국 소재 요양기관에 방문한 55세~60세 환자 (5,624,859명) 를 대상으로 하였습니다. 6년 간의 데이터를 사용한 이유는 치매가 장기적인 관찰 기간이 필요한 만성질환이기 때문입니다. 치매가 아닌 다른 질병을 분석한다면 관찰 기간은 달라질 수 있습니다. 예를 들어, 알레르기 반응을 관찰한다면 5일, NSAIDs 복용에 의한 심근경색증의 발생을 관찰한다면 1년 이상을 적절한 관찰 기간으로 볼 수 있습니다.[1]

이 환자들을 환자 별로 과거 약물 처방기록을 분석해 위험요인 노출군과 비노출군으로 나누었습니다. 일반적으로 약물에 대한 노출을 위험요인으로 보기 때문에, 특정 약물을 복용한 그룹을 위험요인 노출군, 복용하지 않은 그룹을 위험요인 비노출군으로 나누고 각각의 그룹에서 해당기간동안 치매를 진단받은 환자 수를 구했습니다. 이를 통해, 코호트 연구에서 주요 지표로 사용되는 누적발생률을 분석했습니다. 누적발생률은 그룹에 포함된 전체 환자수에서, 관찰 기간동안 질병을 진단받은 환자 수의 비율을 말합니다.[1]  

그렇다면 특정 약물의 복용이 치매 발생에 영향을 주는지, 준다면 얼마나 큰 영향인지 알수 있을까요? 이는 상대위험도(relative risk)로 나타낼 수 있습니다. 상대위험도는 위험요인에 노출된 집단(약물복용 집단)에서 발생률을 C1 이라고 하고, 비노출집단(약물비복용 집단)에서의 발생률을 C0 라고 하면, C1/C0 로 계산합니다(표 1 참조). 상대위험도를 이용해서 요인 노출의 위험도를 해석하는데, 1보다 작으면 위험도가 낮고, 1과 같으면 위험도가 같으며, 1보다 크면 위험도가 높다고 해석할 수 있습니다.

<표 1> 코호트 연구에서의 상대위험도 산출 방법

다음 글에서 건강보험심사평가원의 오픈R&D 센터를 통해 NSAIDs 복용 여부와 치매발생 상대 위험도를 실제로 분석한 내용을 살펴보겠습니다.

 

참고문헌

[1] 박병주 외, 약물역학 제 2판, 서울대학교출판부, 2011 pp. 192-203.
[2] 보건의료빅데이터센터, http://opendata.hira.or.kr/or/orb/bigInfo.do

No comments yet.

Leave a comment

Your email address will not be published.