machine learning

목차 배경 Electron 사용 배경 개발화면 구성 및 기능 시행착오 개발 후기 1. 배경 라인웍스에서는 의료 데이터를 활용한 다양한 머신러닝 프로젝트를 진행하고 있습니다. 머신러닝에는 사용하는 접근 방법에 따라 다양한 방법론들이 있지만, 이번 글에서 다루는 내용은 지도 학습(supervised learning)을 이용한 진단보조시스템(Clinical Decision Supporting System 이하 CDSS) 개발을 주로 설명하고 있습니다. 의료 데이터를 활용한 CDSS를 개발하는 경우에는 생각보다 많은 걸림돌이 있습니다. 그중 대표적인 것은 양질의 데이터를 확보하는 것입니다. 일반적으로 많이 알려지고 많은 팀들이 시도하는 문제들은 충분히 양질의 데이터셋이 공개(Kaggle, Amazon AWS 등등)되어있는 경우가 많습니다만, 그렇지 않은 문제들은 직접 데이터셋을 준비해야된다는

작년에는 필요한 알고리즘은 직접 개발하여 사용했었는데 회사가 발전해감에 따라서 점점 시스템을 구축할 필요를 느끼고 있어서 기존에 다른 기업들이 공개한 데이터와 관련된 기술들을 찾아보았다. 우선 트위터 에서는 2011년에 Bootstrap 외에도 실시간 분석 분산 시스템 인 Storm 을 공개했다. (2011.08.04)A Storm is coming: more details and plans for release (2013.09.06)트위터 Storm 소개 2013년에는 StormHadoop 을 결합한 Summingbird 을 추가로 공개하였다. (2013.09.03)Streaming MapReduce with Summingbird 2014년에는 구글 에서 Mesa 라는 highly scalable analytic data warehousing system