Our Blog

Linewalks는 데이터가 질병을 이해하고 대응하는 법을 찾기 위한 중요한 근거가 된다고 믿습니다. Mediwalks는 수억건의 의료 명세서 데이터 속에서 사람, 질병, 의료행위와 의약품의 관계, 연결, 흐름을 찾습니다. 이를 통해 환자, 의사, 건강보험, 제약회사, 보험회사와 같은 우리의 고객이 필요로 하는 형태로 정보를 생성해냅니다. Mediwalks Paper는 질병을 중심으로 진단, 환자, 처방 의약품의 분석을 담았습니다. 혈관운동성 및 알레르기성 비염 (J30) 분석 혈관운동성 및 알레르기성 비염(J30)은 대표적인 계절성 질병이다. 최근 한국을 뒤덮은 미세먼지가 일으킬 수 있는 대표적인 질병 중 하나이다. 건강보험심사평가원의 의료통계정보에 따르면 2014년 한 해 혈관운동성

Linewalks는 데이터가 질병을 이해하고 대응하는 법을 찾기 위한 중요한 근거가 된다고 믿습니다. Mediwalks는 수억건의 의료 명세서 데이터 속에서 사람, 질병, 의료행위와 의약품의 관계, 연결, 흐름을 찾습니다. 이를 통해 환자, 의사, 건강보험, 제약회사, 보험회사와 같은 우리의 고객이 필요로 하는 형태로 정보를 생성해냅니다. Mediwalks Paper는 질병을 중심으로 진단, 환자, 처방 의약품의 분석을 담았습니다. 위염 및 십이지장염 (K29) 분석 건강보험심사평가원 의료통계정보에 따르면 2014년 위염 및 십이지장염 환자는 5,374,537명이다. (주상병 진단 기준) 2010년에는 543만 명이 위염 및 십이지장염으로 진단을 받았다. 이 후 2012년 579만 명으로 환자 수가

Linewalks는 데이터가 질병을 이해하고 대응하는 법을 찾기 위한 중요한 근거가 된다고 믿습니다. Mediwalks는 수억건의 의료 명세서 데이터 속에서 사람, 질병, 의료행위와 의약품의 관계, 연결, 흐름을 찾습니다. 이를 통해 환자, 의사, 건강보험, 제약회사, 보험회사와 같은 우리의 고객이 필요로 하는 형태로 정보를 생성해냅니다. Mediwalks Paper는 질병을 중심으로 진단, 환자, 처방 의약품의 분석을 담았습니다. 본태성 고혈압(I10) 분석 본태성 고혈압(I10)은 우리나라에서 대표적인 성인 만성 질환이다. 건강보험심사평가원의 의료통계정보에 따르면 2014년 한 해 본태성 고혈압으로 진단받은 환자는 5,291,147명이다. (주상병 기준) 2014년 본태성 고혈압(I10) 의료명세서 수 / 환자 수 –

Linewalks는 데이터가 질병을 이해하고 대응하는 법을 찾기 위한 중요한 근거가 된다고 믿습니다. Mediwalks는 수억건의 의료 명세서 데이터 속에서 사람, 질병, 의료행위와 의약품의 관계, 연결, 흐름을 찾습니다. 이를 통해 환자, 의사, 건강보험, 제약회사, 보험회사와 같은 우리의 고객이 필요로 하는 형태로 정보를 생성해냅니다. Mediwalks Paper는 질병을 중심으로 진단, 환자, 처방 의약품의 분석을 담았습니다. 질병 (2014) J20 – 급성 기관지염 2014년 기준으로 우리나라에서 가장 많이 발생한 질병은 급성 기관지염(J20)이다. 건강보험심사평가원의 의료통계정보에 따르면 2014년 한 해 급성기관지염으로 진단받은 환자는 15,105,296명이다. (주상병 기준, http://opendata.hira.or.kr/op/opc/olap3thDsInfo.do) 연도 별 환자 수

헬스케어 분야의 데이터 비즈니스 규모는 얼마나 클까? 라인웍스의 보건의료 데이터 레이크 플랫폼 메디웍스(MediWalks)를 활용하여 국내 헬스케어 애널리틱스 시장을 전망하였다. 유명 컨설팅 업체들은 글로벌 헬스케어 애널리틱스 시장이 2020년 최대 238억 달러 규모까지 성장할 것으로 전망하고 있다. 국내 헬스케어 애널리틱스 시장은 2015년 1,098억 원에서 2020년 2,911억원 수준으로 확대될 것으로 전망된다. 국내 헬스케어 애널리틱스 시장 2015-2020 from Kihoon Sung

이전 포스팅 에 이어서 Python 에서 TAJO 를 사용하는데 필요한 몇 가지 사항을 정리해본다. Query 를 실행했다 그리고 이전 포스팅 마지막에 실행한 쿼리를 보자. query = "select * from table1" cur.execute(query) result = cur.fetchall() 결과를 python 에서 사용해보자. for each in result: print each[0] / each[1] 이런 경우 아래와 같은 Error 문구를 볼 수 있다. TypeError: unsupported operand type(s) for /: 'java.lang.Long' and 'java.lang.Long' 문제는 문제는 query 의 결과값이 숫자인 경우 아래와 같은 형식으로 리턴되기 때문이다. print type(each[2]) <class 'jpype._jclass.java.lang.Long'> 해결해보자 사실 해결책은 간단하다. 결국 TAJO 의 결과 값이 JDBC 를

작년에는 필요한 알고리즘은 직접 개발하여 사용했었는데 회사가 발전해감에 따라서 점점 시스템을 구축할 필요를 느끼고 있어서 기존에 다른 기업들이 공개한 데이터와 관련된 기술들을 찾아보았다. 우선 트위터 에서는 2011년에 Bootstrap 외에도 실시간 분석 분산 시스템 인 Storm 을 공개했다. (2011.08.04)A Storm is coming: more details and plans for release (2013.09.06)트위터 Storm 소개 2013년에는 StormHadoop 을 결합한 Summingbird 을 추가로 공개하였다. (2013.09.03)Streaming MapReduce with Summingbird 2014년에는 구글 에서 Mesa 라는 highly scalable analytic data warehousing system

라인웍스에서는 정적인 데이터를 분석하는 경우 데이터레이크(Data Lake) 로 TAJO 를 사용하고 있다. 회사 내에서 분석하고 서비스로 만들어내는 모든 데이터는 여기에서 시작된다. 우선 TAJO 에 Query 를 이용하여 데이터를 쪼개보고, 붙여보고, 나열해본 후에는 이를 csv 파일로 만든 후 에 Python 으로 load 하여 그래프를 그리거나 머신러닝 알고리즘을 수행하는 형식이다. (Python 의 경우 직접 실행하는 방법도 있고 IPython Notebook 을 사용하기도 한다.) 결국 Data – TAJO – CSV – Python – RESULTS 와 같은 단계를 거치게 되는데 이 단계를 단축시켜보자는게 이

  [모바일 시대의 사람들] (12) 빅데이터로 의료부터 금융까지…라인웍스 조용현 대표, 홍원준 CTO 라인웍스는 2016년부터 자사가 갖고 있는 데이터 정제, 분석 역량을 더욱 강화할 계획이다. 사회적으로 공익적인 가치를 줄 수 있는 의료 지표를 공유하는 것은 물론, 금융 데이터와 관련해서도 더욱 많은 사업을 할 계획이다. 국내 데이터 드리븐 비즈니스가 발전하고 있는 현장이 바로 여기에 있었다.