EHR

라인웍스는  Electronic Health Record (전자의무기록, 이하 EHR) 데이터를 이용하여 다양한 데이터 분석, 머신러닝 프로젝트를 진행하고 있습니다. 두 편에 걸쳐 순차 패턴 마이닝(Sequential Pattern Mining)을 EHR에 적용하여 분석한 사례를 소개합니다. 지난 글(바로가기)에서는 EHR 데이터를 정제하는 방법에 대해 설명했습니다. 이번 글은 순차 패턴 마이닝을 간략히 설명하고 분석 결과를 소개합니다.  순차 패턴 마이닝이란? 순차 패턴 마이닝(sequential pattern mining)은 대량의 데이터에 숨겨진 “순차적 패턴”을 찾는 분석방법입니다. 연속하여 일어나는 패턴을 찾는데 유용한 방법으로, 커머스 분야에서 고객이 어떤 순서로 제품을 구매하는지 분석하는데 자주 활용합니다.  예를 들어 대형 슈퍼마켓에서 고객들의

라인웍스는  Electronic Health Record (전자의무기록, 이하 EHR) 데이터를 이용하여 다양한 데이터 분석, 머신러닝 프로젝트를 진행하고 있습니다. 이번 글에서는 순차 패턴 마이닝(Sequential Pattern Mining)을 EHR에 적용하여 분석한 사례를 소개합니다. “순차 패턴 마이닝” 분석은 다양한 산업 분야에서 활용하고 있으며 특히 온라인 커머스 분야가 적극적으로 활용하고 있습니다. 고객이 상품을 구매한 순서를 파악할 수 있다면, 다음에 구매할 상품을 예측해볼 수 있습니다. 예측한 상품의 광고나 쿠폰을 제공하여 고객이 추천한 상품을 구매하게 되면 이는 매출증가로 이어질 것입니다. 대량의 구매 기록에서 이런 정보를 찾아내는 방법이 순차 패턴 마이닝입니다.  라인웍스는

라인웍스에서는 Electronic Health Record (이하 EHR) 데이터를 이용하여 다양한 머신러닝 프로젝트를 진행하고 있습니다.  이번 글에서는 의료 인공지능 개발 프로젝트의 성능 개선을 위해 사용한 임베딩을 소개합니다. 또, MDwalks EXI에서 선보였던 MIMIC-III 30일 이내 재입원 예측 모델(https://linewalks.com/archives/6142)에 임베딩을 적용해 이를 적용하지 않았던 이전 모델과 성능을 비교해보았습니다. 이 글이 임베딩의 개념과 EHR 데이터에서 임베딩의 필요성을 이해하는데 도움이 되기를 바랍니다. 임베딩(Embedding)이란? 임베딩이란 범주형(Categorical) 자료를 연속형 벡터로 치환하는 것을 말합니다. 예를 들어 A, B, C, D라는 카테고리가 있다고 할 때, 이를 다음과 같이 변환하는 것입니다. 이 변환이 왜 필요할까요?

MIMIC-III 데이터베이스는 무료로 공개된 다년간의 중환자입원 기록으로, 다양한 의료정보 분석에 활용되고 있습니다.본 글은 Docker로 Postgres 설치하고 MIMIC-III 데이터베이스 세팅한 방법에 대해 작성한 글로서, Docker로 테스트용 데이터베이스를 설치하는 사례를 소개합니다.이 문서의 내용을 참조하였으며, 누구나 쉽게 mimic 데이터베이스를 설치할 수 있도록 정리하였습니다.MIMIC-III 데이터는 교육을 이수한 후에 접근이 가능합니다. 자세한 정보는 여기를 참고하세요. 1단계. mimic-code 리포지토리를 클론Workspace 폴더에 mimic-code 리포지토리를 클론합니다. git clone https://github.com/MIT-LCP/mimic-code 2단계. MIMIC-III 데이터를 얻기MIMIC csv 파일은 Workspace 폴더에 하위 폴더 ‘mimic’을 생성하고 mimic에 하위 폴더 ‘data’를 생성하고 이

지난 글에서 의료 인공지능 MDwalks EXI의 기능을 간략히 소개했습니다. MDwalks EXI는 입원환자가 퇴원 후 30일 이내에 다시 재입원할 확률을 예측합니다. 환자 별로 전체 의무기록을 바탕으로 생성된 예측 모델을 활용해, 모의 처방을 내릴 수 있습니다. 이 모의 처방은 환자의 재입원확률을 낮출 수 있도록 의료진이 더 나은 치료, 처방을 제공하는데 도움이 될 수 있을 것입니다. 이렇게 MDwalks EXI를 개발하면서 라인웍스는 의료 인공지능에 대해 두 가지를 고려하였습니다. 환자와 의료진에게 실질적 가치를 제공 신뢰할 수 있는 인공지능 기술 수준 달성 이 두 가지 중에서 이번 글에서는

최근 라인웍스는 AI기반 정밀의료 서비스 개발 과제 ‘닥터앤서(Dr. Answer)‘에 참여하였습니다. 이 과제에서 라인웍스는 서울아산병원과 협력하여 환자의 응급 내원을 예측하는 모델을 개발하고 있습니다. 의료 인공지능은 딥러닝 기술로 전자의무기록을 학습하여, 심뇌혈관질환자의 진단, 예방, 처방과 같이 실제 의료 수요를 충족시키는 서비스를 제공합니다. 이 개발의 과정의 중간 결과물인 MDwalks EXI를 소개합니다. MDwalks EXI는 EXtensible Intelligence의 줄임말로 “사용자의 필요에 따라 확장이 가능한 형태의 인공지능”을 표방하고 있습니다. 이번 버전의 MDwalks EXI는 “입원 환자가 퇴원 후 30일 이내에 다시 입원할 확률”을 예측합니다. 이번

  라인웍스는 지난 6월 15일 서울아산병원에서 주최하는 2018년 아산국제의학심포지엄(AIMS)에 참가하여 “의료 데이터 탐색 엔진”을 주제로 발표하였습니다.   2018년 아산국제의학심포지엄은 “Future Medicine in Digital Healthcare Innovation”을 주제로 최첨단 과학기술과 의료의 융복합을 통해 더 효율적이고 우수한 의료서비스에 대한 논의의 장이었습니다. 라인웍스는 루닛, Vuno, 휴레이지포지티브, 메디픽셀 등이 발표를 진행했던 Digital Technology 세션에서 마지막 순서인 다섯번 째로 발표를 하였습니다. EHR 데이터 탐색 엔진(Data Exploring Engine for Electronic Health Records)을 주제로 발표한 라인웍스 조용현 대표는 헬스케어 데이터 서비스를 만들기 위해 꼭 필요한 것들에 대해서