s-2017-06-27_18:40:35
6월 26

의료명세서의 시계열 분석 – (2)

Posted by Cinyoung Hur

들어가며 이전 글에서 예방과 예측 중심으로 재편되는 의료산업에서 보건의료 빅데이터, 그 중에서도 의료명세서의 가치와 역할을 언급하였다. 그리고 건강보험심사평가원의 의료명세서(청구명세서)가 시간의 흐름에 따라 환자별 의료비용의 변화를 보여줄 수 있다는 점에 주목하였다. 이러한 배경에서, 우리는 의료명세서에서 시간 정보를 추출하여 유사한 패턴의 환자들 시계열 군집화를 적용하였다. 이 작업은 특정 질병의 의료비용 추산를 위한 탐색적 연구로서 의의가…

Read More

Medical Claim Temporal Data Analysis
6월 16

의료명세서의 시간 분석을 시작하며- (1)

Posted by Cinyoung Hur

들어가며 평균 기대 수명이 늘어나면서 건강한 삶의 중요성이 강조되는 가운데, 보건의료 분야의 목적이 치료 중심에서 정밀, 예방, 예측 의료 중심으로 옮겨가고 있다. 보건의료 빅데이터는 이러한 의료산업 재편에 중요한 역할을 하고 있다. 보건의료 빅데이터의 대표적인 예로 전자건강기록(EHR), 임상 시험 데이터, 의료명세서가 있다. 우리는 이 글에서 의료명세서를 다양한 시각으로 조명할 것이다. 환자 개인의 부상 인구집단…

Read More

Data Machines
2월 1

Python 에서 Tajo 사용하기 #2 Query 결과값 중 숫자를 연산에 사용하기

Posted by Wonjun Hong

이전 포스팅 에 이어서 Python 에서 TAJO 를 사용하는데 필요한 몇 가지 사항을 정리해본다. Query 를 실행했다 그리고 이전 포스팅 마지막에 실행한 쿼리를 보자. query = "select * from table1" cur.execute(query) result = cur.fetchall() 결과를 python 에서 사용해보자. for each in result: print each[0] / each[1] 이런 경우 아래와 같은 Error 문구를 볼…

Read More

http://www.analyticsvidhya.com/blog/2015/11/infographic-rise-machine-learning-year-2015/
1월 30

데이터와 관련하여 기업들이 공개한 기술은 어떤게 있을까?

Posted by Wonjun Hong

작년에는 필요한 알고리즘은 직접 개발하여 사용했었는데 회사가 발전해감에 따라서 점점 시스템을 구축할 필요를 느끼고 있어서 기존에 다른 기업들이 공개한 데이터와 관련된 기술들을 찾아보았다. 우선 트위터 에서는 2011년에 Bootstrap 외에도 실시간 분석 분산 시스템 인 Storm 을 공개했다. (2011.08.04)A Storm is coming: more details and plans for release (2013.09.06)트위터 Storm 소개 2013년에는 Storm 과…

Read More

Data Machines
1월 27

Python 에서 Tajo 사용하기

Posted by Wonjun Hong

라인웍스에서는 정적인 데이터를 분석하는 경우 데이터레이크(Data Lake) 로 TAJO 를 사용하고 있다. 회사 내에서 분석하고 서비스로 만들어내는 모든 데이터는 여기에서 시작된다. 우선 TAJO 에 Query 를 이용하여 데이터를 쪼개보고, 붙여보고, 나열해본 후에는 이를 csv 파일로 만든 후 에 Python 으로 load 하여 그래프를 그리거나 머신러닝 알고리즘을 수행하는 형식이다. (Python 의 경우 직접 실행하는…

Read More