의료빅데이터분석

라인웍스는  Electronic Health Record (전자의무기록, 이하 EHR) 데이터를 이용하여 다양한 데이터 분석, 머신러닝 프로젝트를 진행하고 있습니다. 두 편에 걸쳐 순차 패턴 마이닝(Sequential Pattern Mining)을 EHR에 적용하여 분석한 사례를 소개합니다. 지난 글(바로가기)에서는 EHR 데이터를 정제하는 방법에 대해 설명했습니다. 이번 글은 순차 패턴 마이닝을 간략히 설명하고 분석 결과를 소개합니다.  순차 패턴 마이닝이란? 순차 패턴 마이닝(sequential pattern mining)은 대량의 데이터에 숨겨진 “순차적 패턴”을 찾는 분석방법입니다. 연속하여 일어나는 패턴을 찾는데 유용한 방법으로, 커머스 분야에서 고객이 어떤 순서로 제품을 구매하는지 분석하는데 자주 활용합니다.  예를 들어 대형 슈퍼마켓에서 고객들의

라인웍스는  Electronic Health Record (전자의무기록, 이하 EHR) 데이터를 이용하여 다양한 데이터 분석, 머신러닝 프로젝트를 진행하고 있습니다. 이번 글에서는 순차 패턴 마이닝(Sequential Pattern Mining)을 EHR에 적용하여 분석한 사례를 소개합니다. “순차 패턴 마이닝” 분석은 다양한 산업 분야에서 활용하고 있으며 특히 온라인 커머스 분야가 적극적으로 활용하고 있습니다. 고객이 상품을 구매한 순서를 파악할 수 있다면, 다음에 구매할 상품을 예측해볼 수 있습니다. 예측한 상품의 광고나 쿠폰을 제공하여 고객이 추천한 상품을 구매하게 되면 이는 매출증가로 이어질 것입니다. 대량의 구매 기록에서 이런 정보를 찾아내는 방법이 순차 패턴 마이닝입니다.  라인웍스는

지난 글(바로가기)에서 2010년부터 2017년까지 한국인의 만성 두드러기(Chronic urticaria; 이하 CU)/만성 자발성 두드러기(Chronic spontaneous urticaria; 이하 CSU)의 유병률 추세에 대해서 알아보았습니다. HIRA 데이터를 이용한 연구 2편에서는 HIRA 표본환자데이터를 이용하여 CU와 CSU의 합병증에 대한 로지스틱 회귀분석 결과를 살펴보겠습니다. 합병증 정의 이전 연구를 참고하여4,5,6,7, CU/CSU와 관련이 있는 질병을 아래와 같이 정의하였습니다. 알레르기성 비염(Allergic rhinitis)천식(Asthma)셀리악 병(Celiac disease)갑상선 질환(Disorders of thyroid gland)약물 또는 기타 알레르기(Drug or other allergy)염증성 장 질환(Inflammatory bowel disease)혈액학적 신생물(Hematological neoplasms)비혈액학적 신생물(Non-hematological neoplasms)악성 빈혈(Pernicious anemia)레이노 증후군(Raynaud’s phenomenon)혈청검사 양성 류마티스 관절염(Rheumatoid arthritis)쉐그린 증후군(Sjogren’s syndrome)a전신 홍반

지난 글(바로가기)에서 HIRA 데이터를 활용한 연구의 대표적 통계분석방법론을 소개했습니다. 통계분석방법론 연구를 토대로 라인웍스가 HIRA 데이터를 활용해 분석 연구를 수행한 결과를 두 편의 글로 소개합니다. 1편에서는 추세 분석을 통해 만성 두드러기(Chronic urticaria; CU)와 만성 자발성 두드러기(Chronic spontaneous urticaria; CSU) 환자의 연도별 유병률에 대해 알아보겠습니다. 2편에서는 로지스틱 회귀 분석을 사용해 만성 두드러기(CU)와 만성 자발성 두드러기(CSU)의 합병증 분석 결과를 소개하겠습니다. 연구에는 건강보험심사평가원에서 제공하는 의료명세서 데이터(Health Insurance Review & Assessment Service; 이하  HIRA 데이터)를 사용했습니다. 이번 글에서는 연도별 유병률 추세에 대해 자세히 알아보도록 하겠습니다. 정의 만성 두드러기(CU)는 6주

MDwalks(엠디웍스)는 헬스케어 비즈니스와 의료데이터 분석 서비스를 제공합니다. 라인웍스는 MDwalks를 다양하고 깊이 있는 의료데이터 분석 서비스로 발전시키기 위해 여러 가지 연구를 진행 중입니다. 최근에는 건강보험심사평가원에서 제공하는 의료명세서 데이터(Health Insurance Review & Assessment Service; 이하  HIRA 데이터)를 이용한 논문의 통계분석 방법론 동향 연구를 진행했습니다. 이 연구가 후향적 연구를 계획하고 있는 연구자에게 HIRA 데이터 활용의 길잡이가 될 것으로 기대합니다. 이번 글에서는 분석 진행 과정을 먼저 소개하고, HIRA 데이터 연구의 대표적인 분석 방법론을 3가지로 분류하여 소개하도록 하겠습니다. 이번 연구는 분석방법론 범주화와 군집화의 두 단계로 나누어

라인웍스는 복잡하게 얽힌 대량의 의료보건데이터에서 시그널을 탐지할 좋은 방법을 고심해왔습니다. 빠르고 광범위하게 탐색할 수 있는 빅데이터 분석 기법과 사례를 소개합니다. 분석에 대한 자세한 문의는 여기로 해주십시오. 지난 글에서 후향적 코호트 설계와 상대위험도를 살펴보았고, 이번 글은 비스테로이드 소염제(NSAIDs) 복용 여부와 치매발생의 상대위험도를 소개합니다. 본 사례는 치매와 비스테로이드 소염제의 연관성을 찾았던 기존 연구들을 바탕으로 합니다.   항염증약물과 치매 항염증약물이 치매의 발병과 진행에 영향을 준다는 내용으로 많은 연구가 있었습니다. 특히 뇌에 축적되는 이상 단백질이 치매의 원인 중 하나라는 연구들,

라인웍스는 복잡하게 얽힌 대량의 의료보건데이터에서 시그널을 탐지할 좋은 방법을 고심해왔습니다. 빠르고 광범위하게 탐색할 수 있는 빅데이터 분석 기법과 사례를 소개합니다. 분석에 대한 자세한 문의는 여기로 해주십시오. 지난 글에서는 신약 개발의 비용과 시간 효율성 향상을 위한 방법 중 하나인 신약재창출에 대해 소개하고, 성공적인 신약재창출을 위한  빠른 개념증명의 중요성을 살펴보았습니다. 이번 글에서는 건강보험심사평가원 빅데이터 분석 사례를 살펴보고자 합니다.비스테로이드 소염제의 복용 여부에 따른 치매 발생 여부를 확인하고, 이 약물을 신약 후보군의

라인웍스는 복잡하게 얽힌 대량의 의료보건데이터에서 시그널을 탐지할 좋은 방법을 고심해왔습니다. 빠르고 광범위하게 탐색할 수 있는 빅데이터 분석 기법과 사례를 소개합니다.   들어가는 글 고령화로 만성질환자가 증가하고 있습니다. 특히 치매는 노년의 삶을 위협하는 심각한 질병입니다. 치매 치료를 위하여 치매의 원인 규명, 치매의 진행속도를 늦추는 신약 개발 등 다각도로 연구가 진행 중이지만, 다국적 초대형 제약회사들도 알츠하이머 치료제 개발에 번번이 실패했습니다. 지난 1월에는 화이자가 알츠하이머병 치료제 개발 중단을 선언하기도 했습니다[2]. 시간과 노력, 무엇보다 많은 비용이 드는 신약 개발의 특성상, 진전없는 연구에서는 손을 떼겠다는