들어가며

평균 기대 수명이 늘어나면서 건강한 삶의 중요성이 강조되는 가운데, 보건의료 분야의 목적이 치료 중심에서 정밀, 예방, 예측 의료 중심으로 옮겨가고 있다. 보건의료 빅데이터는 이러한 의료산업 재편에 중요한 역할을 하고 있다. 보건의료 빅데이터의 대표적인 예로 전자건강기록(EHR), 임상 시험 데이터, 의료명세서가 있다. 우리는 이 글에서 의료명세서를 다양한 시각으로 조명할 것이다.

환자 개인의 부상

인구집단 기반의 의료가 개인에게 집중되기 시작하면서 보건의료 관계자, 제약사 등이 의료 서비스를 제공하는 방향에도 변화가 나타났다. 환자 개개인에 집중하며 전체적인 시각에서 의료 서비스를 개편하려는 움직임이 생겨났다. 예로는, 흑색종 환자마다 암의 진행 단계에 따라 서로 다른 화학 요법을 받는 사례나[1], 다발성경화증 치료에서 질병조절치료 선택에 따라 총 의료비용을 경감시키는 사례[2], 그리고 유방암 수술 이후의 유방재건술 시 환자에게 주어지는 제품 선택권[3] 등이 있다.

의료 명세서(청구 명세서)의 가치

우리나라는 전국민 건강보험을 시행 중이고, 건강보험심사평가원이 축적한 전국민의 의료명세서 데이터를 비식별화 처리 후 공개하고 있다. 의료명세서는 환자가 의료전문기관에서 지출한 치료비의 정확한 추적을 위한 것이지만, 질병-의료행위-의약품-치료재료에 관한 정보를 담고 있기 때문에 전체 의료 시스템과 개별 환자에게 중요한 문제 해결에 큰 잠재력을 가지고 있다[4]. 우리나라의 경우 전국민이 국민건강보험에 가입했다는 점에서 의료명세서는 매우 가치 있는 데이터이다. 무엇보다도 건강 관리와 관련된 비용을 보여주는 유일한 자료이다.

의료 명세서의 시간 정보

의료 명세서로 단순히 총 의료비용, 평균 내원일수 등을 분석한다면 개인 및 전체 환자와 치료 변화에 따른 중요한 정보를 놓치게 된다. 왜냐하면 환자의 건강상태는 어떤 질병을 갖고 있는가, 어떤 치료를 받았는가에 따라 계속 변화하고, 그에 따라 어떤 의료서비스를 이용하는지, 얼마만큼의 의료비를 지출하는지도 달라지기 때문이다. 의료 명세서는 이러한 시간 정보를 담고 있고, 우리는 시간 데이터 분석(temporal data analysis)으로 개인의 의료비용 추이와 향후의 의료수요를 파악할 수 있다.

시간 데이터 분석의 적용

우리는 건강보험심사평가원 청구명세서에서 시간 정보를 추출하고, 데이터 마이닝과 기계학습 기법을 적용하여 의료 패턴을 분석하고자 한다. 이 기법을 담낭암 환자군에게 적용하여 환자의 질병 부담률 추이와 진단, 처방, 수술 등의 의료행위 전개를 분석하리라 기대한다. 분석 결과는 총 두 편으로 구성될 것이다. 1편은 시계열 분석을 적용한 결과이고, 2편은 시퀀스 분석을 적용한 결과이다.

나가며

두 편의 포스팅은 의료행위와 질병 부담률의 추이를 분석한 결과를 공유하기 위한 목적으로 작성될 것이며, 분석 결과는 다양한 의료 관계자와 심평원의 의료명세서를 분석하고자 하는 사람들에게 유용할 수 있다. 예컨대, 의료서비스 제공자는 질병 진행 패턴에서 치료에 대한 지식을 얻을 수 있고, 보건 정책 결정자는 특정 질병군에서 질병 부담률의 추이를 관찰할 수 있다.

  1. Ipsos, The Patient Journey in High Resolution, 2013
  2. Milliman, Multiple sclerosis: New perspectives on the patient journey, 2016
  3. Liu, C., Zhuang, Y., Momeni, A., Luan, J., Chung, M. T., Wright, E., & Lee, G. K. (2014). Quality of life and patient satisfaction after microsurgical abdominal flap versus staged expander/implant breast reconstruction: A critical study of unilateral immediate breast reconstruction using patient-reported outcomes instrument BREAST-Q. Breast Cancer Research and Treatment, 146(1), 117–126. https://doi.org/10.1007/s10549-014-2981-z
  4. Chandola, V., Sukumar, S. R., & Schryver, J. C. (2013). Knowledge discovery from massive healthcare claims data. In Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining – KDD ’13 (p. 1312). New York, New York, USA: ACM Press. https://doi.org/10.1145/2487575.2488205