Our Blog

라인웍스는 지난 9월 20일부터 22일까지 국가임상시험지원재단(KONECT)에서 주최한 Korea Clinical Datathon 2019에 참가했습니다. 라인웍스 4인은 각기 다른 팀에서 다양한 역할로 Datathon에 참가했는데요. 다채로운 관점의 후기를 릴레이로 공유합니다. 0. INTRO → 바로가기1. 임정, SQL 전문가(팀9) → 바로가기2. 허신영, 데이터 사이언티스트(팀7) → 현재 글3. 박근우, SQL 전문가(팀7) → 예정4. 송치오, IT 전문가(팀14) → 예정 두번째로 Tech그룹의 Lead Data Engineer인 허신영 님의 후기를 공유합니다. 제가 참가한 팀7은 아주대학병원의 CDM ECGViEW을사용하여 “당뇨환자의 신장 기능 감소 예측”을 하였습니다. 최근 신부전이나 투석으로 이어지는 합병증

라인웍스는 지난 9월 20일부터 22일까지 국가임상시험지원재단(KONECT)에서 주최한 Korea Clinical Datathon 2019에 참가했습니다. 라인웍스 4인은 각기 다른 팀에서 다양한 역할로 Datathon에 참가했는데요. 다채로운 관점의 후기를 릴레이로 공유합니다. 0. INTRO → 바로가기1. 임정, SQL 전문가(팀9) → 현재 글2. 허신영, 데이터 사이언티스트(팀7) → 바로가기3. 박근우, SQL 전문가(팀7) → 예정 4. 송치오, IT 전문가(팀14) → 예정 첫번째로 데이터분석그룹의 Data Analyst 임정 님의 후기를 공유합니다. 참여자 임정 (역할: SQL 전문가) 주제 B형간염 환자에서 약제에 따른 간암발생비교와 간암 및 합병증 발생 예측 코호트(Cohort) 정의 처음 B형간염 약을

라인웍스는 지난 9월 20일부터 22일까지 국가임상시험지원재단(KONECT)에서 주최한 Korea Clinical Datathon 2019에 참가했습니다. 라인웍스 4인은 각기 다른 팀에서 다양한 역할로 Datathon에 참가했는데요. 다채로운 관점의 후기를 릴레이로 공유합니다. 0. INTRO → 현재 글1. 임정, SQL 전문가(팀9) → 바로가기 2. 허신영, 데이터 사이언티스트(팀7) → 바로가기 3. 박근우, SQL 전문가(팀7) → 예정4. 송치오, IT 전문가(팀14) → 예정 최근 대형 의료기관을 중심으로 환자 데이터를 대규모로 축적하는 움직임이 활발했습니다. 축적한 환자 데이터를 비식별화 한 후 공개하여 임상 연구를 촉진하려는 시도가 이뤄지고 있습니다. 이런 시도에

라인웍스는  Electronic Health Record (전자의무기록, 이하 EHR) 데이터를 이용하여 다양한 데이터 분석, 머신러닝 프로젝트를 진행하고 있습니다. 두 편에 걸쳐 순차 패턴 마이닝(Sequential Pattern Mining)을 EHR에 적용하여 분석한 사례를 소개합니다. 지난 글(바로가기)에서는 EHR 데이터를 정제하는 방법에 대해 설명했습니다. 이번 글은 순차 패턴 마이닝을 간략히 설명하고 분석 결과를 소개합니다.  순차 패턴 마이닝이란? 순차 패턴 마이닝(sequential pattern mining)은 대량의 데이터에 숨겨진 “순차적 패턴”을 찾는 분석방법입니다. 연속하여 일어나는 패턴을 찾는데 유용한 방법으로, 커머스 분야에서 고객이 어떤 순서로 제품을 구매하는지 분석하는데 자주 활용합니다.  예를 들어 대형 슈퍼마켓에서 고객들의

라인웍스는  Electronic Health Record (전자의무기록, 이하 EHR) 데이터를 이용하여 다양한 데이터 분석, 머신러닝 프로젝트를 진행하고 있습니다. 이번 글에서는 순차 패턴 마이닝(Sequential Pattern Mining)을 EHR에 적용하여 분석한 사례를 소개합니다. “순차 패턴 마이닝” 분석은 다양한 산업 분야에서 활용하고 있으며 특히 온라인 커머스 분야가 적극적으로 활용하고 있습니다. 고객이 상품을 구매한 순서를 파악할 수 있다면, 다음에 구매할 상품을 예측해볼 수 있습니다. 예측한 상품의 광고나 쿠폰을 제공하여 고객이 추천한 상품을 구매하게 되면 이는 매출증가로 이어질 것입니다. 대량의 구매 기록에서 이런 정보를 찾아내는 방법이 순차 패턴 마이닝입니다.  라인웍스는

라인웍스는 지난 달 코엑스에서 열린 K-Hospital Fair 2019(국제병원의료산업박람회)에 참가했습니다. 이번 박람회에는 의료 인공지능 특별전이 함께 개최되었는데요. 의료 인공지능 특별전은 한국형 AI정밀의료 서비스 ‘닥터앤서(Dr.Answer)’를 홍보하는 자리로, 라인웍스는 심혈관질환 환자 관리 의료 인공지능 MDwalks EXI(Extensible Intelligence)를 소개했습니다. 올 해 박람회에서는 지난 해 보다 발전한 MDwalks EXI의 새로운 모습을 방문객들에게 선보일 수 있었습니다.  지난 해에는 “입원 환자가 퇴원 후 30일 이내에 다시 입원할 확률”을 예측하는 인공지능을 소개했습니다. 의료진에 유용한 정보를 줄 수 있었지만, 모니터링 하는 환자의 범위가 넓어 실제 진료 현장에 적용이 어려운 단점이 있었습니다.

라인웍스에서는 Electronic Health Record (이하 EHR) 데이터를 이용하여 다양한 머신러닝 프로젝트를 진행하고 있습니다.  이번 글에서는 의료 인공지능 개발 프로젝트의 성능 개선을 위해 사용한 임베딩을 소개합니다. 또, MDwalks EXI에서 선보였던 MIMIC-III 30일 이내 재입원 예측 모델(https://linewalks.com/archives/6142)에 임베딩을 적용해 이를 적용하지 않았던 이전 모델과 성능을 비교해보았습니다. 이 글이 임베딩의 개념과 EHR 데이터에서 임베딩의 필요성을 이해하는데 도움이 되기를 바랍니다. 임베딩(Embedding)이란? 임베딩이란 범주형(Categorical) 자료를 연속형 벡터로 치환하는 것을 말합니다. 예를 들어 A, B, C, D라는 카테고리가 있다고 할 때, 이를 다음과 같이 변환하는 것입니다. 이 변환이 왜 필요할까요?

지난 글(바로가기)에서 2010년부터 2017년까지 한국인의 만성 두드러기(Chronic urticaria; 이하 CU)/만성 자발성 두드러기(Chronic spontaneous urticaria; 이하 CSU)의 유병률 추세에 대해서 알아보았습니다. HIRA 데이터를 이용한 연구 2편에서는 HIRA 표본환자데이터를 이용하여 CU와 CSU의 합병증에 대한 로지스틱 회귀분석 결과를 살펴보겠습니다. 합병증 정의 이전 연구를 참고하여4,5,6,7, CU/CSU와 관련이 있는 질병을 아래와 같이 정의하였습니다. 알레르기성 비염(Allergic rhinitis)천식(Asthma)셀리악 병(Celiac disease)갑상선 질환(Disorders of thyroid gland)약물 또는 기타 알레르기(Drug or other allergy)염증성 장 질환(Inflammatory bowel disease)혈액학적 신생물(Hematological neoplasms)비혈액학적 신생물(Non-hematological neoplasms)악성 빈혈(Pernicious anemia)레이노 증후군(Raynaud’s phenomenon)혈청검사 양성 류마티스 관절염(Rheumatoid arthritis)쉐그린 증후군(Sjogren’s syndrome)a전신 홍반

지난 글(바로가기)에서 HIRA 데이터를 활용한 연구의 대표적 통계분석방법론을 소개했습니다. 통계분석방법론 연구를 토대로 라인웍스가 HIRA 데이터를 활용해 분석 연구를 수행한 결과를 두 편의 글로 소개합니다. 1편에서는 추세 분석을 통해 만성 두드러기(Chronic urticaria; CU)와 만성 자발성 두드러기(Chronic spontaneous urticaria; CSU) 환자의 연도별 유병률에 대해 알아보겠습니다. 2편에서는 로지스틱 회귀 분석을 사용해 만성 두드러기(CU)와 만성 자발성 두드러기(CSU)의 합병증 분석 결과를 소개하겠습니다. 연구에는 건강보험심사평가원에서 제공하는 의료명세서 데이터(Health Insurance Review & Assessment Service; 이하  HIRA 데이터)를 사용했습니다. 이번 글에서는 연도별 유병률 추세에 대해 자세히 알아보도록 하겠습니다. 정의 만성 두드러기(CU)는 6주

MDwalks(엠디웍스)는 헬스케어 비즈니스와 의료데이터 분석 서비스를 제공합니다. 라인웍스는 MDwalks를 다양하고 깊이 있는 의료데이터 분석 서비스로 발전시키기 위해 여러 가지 연구를 진행 중입니다. 최근에는 건강보험심사평가원에서 제공하는 의료명세서 데이터(Health Insurance Review & Assessment Service; 이하  HIRA 데이터)를 이용한 논문의 통계분석 방법론 동향 연구를 진행했습니다. 이 연구가 후향적 연구를 계획하고 있는 연구자에게 HIRA 데이터 활용의 길잡이가 될 것으로 기대합니다. 이번 글에서는 분석 진행 과정을 먼저 소개하고, HIRA 데이터 연구의 대표적인 분석 방법론을 3가지로 분류하여 소개하도록 하겠습니다. 이번 연구는 분석방법론 범주화와 군집화의 두 단계로 나누어