1. Healthcare와 Analytics, 그 불편함에 관하여(3)

분야를 막론하고 데이터 분석이 적용되는 영역에서 보안은 중요한 문제로 거론되고 있다. 보안이 중요한 이유는 데이터에 포함되어 있는 정보의 파급력 때문이다. 일반적으로 데이터 분석이 효과적이기 위해서는 개체를 특정할 수 있는 정보가 포함되어야 한다. 취급되는 정보의 특성에 따라 개체를 특정하는 데이터의 형태가 다양하지만 이러한 형태의 정보는 기업의 중요한 기밀사항을 노출시킬 수 있으며 심할 경우 범죄에 악용될 소지도 존재한다. 당연히 중요한 정보일수록 파급력이 크고 보안을 더욱 강력하게 이루어져야 한다. 다른 분야보다도 헬스케어 분야에서의 보안 문제는 복잡하고 해결하기 어려운 상황에 놓여있다. 그 이유는 관련 규정이 복잡하게 얽혀있고, 데이터 분석의 특성상 해결하기가 쉽지 않기 때문이다.

우선 거시적인 문제를 살펴보자. 국내 보건의료 분야에서 보안과 관련된 규정은 생명연구자원의 확보․관리 및 활용에 관한 법률 시행령, 개인정보보호법, 과학기술기본법, 보건의료기본법 및 시행규칙 등에 명시되어 있다. 생명연구자원의 확보․관리 및 활용에 관한 법률 시행령 제3조(기탁등록보존기관의 지정기준) 제3항에서는 생명연구자원 정보시스템을 구축하고 운영하기 위한 보안시설 보유 및 관리 전단인력을 확보할 것을 규정하고 있다. 보건의료기본법 제3조(정의)에서는 보건의료정보를 정의하고 있으며, 과학기술기본법 제16조의 2(연구개발성과의 보호 및 보안)에서는 연구개발성과의 보안대책 수립․시행을 명시하고 있다. 무엇보다도 개인정보보호법에서는 개인을 특정할 수 있는 정보의 사용․유통․관리 등에 대한 전반적인 규정과 더불어 건강정보에 대한 수집을 금하고 있다. 법령에 근거하여 데이터를 활용할 수 있는 여지는 존재하지만 이미 언급한 다양한 법령과의 충돌 여부로 인해 법적 테두리 내에서 헬스케어의 보안 문제는 비전문가들에게는 복잡하고 난해한 모습이다.

미시적인 측면에서도 어려움이 존재한다. 헬스케어에서 특정 개인의 데이터를 트래킹하고 분석하는 것은 절대적으로 필요하다. 그렇기 때문에 개인정보의 비식별화를 통해 이 문제를 해결하고자 하고 있다. 비식별화란 개인을 특정할 수 있는 정보를 삭제하고 누구인지 알아볼 수 없도록 처리하는 것을 뜻한다. 이미 대부분의 보건의료 정보를 분석하고 있는 곳에서는 비식별화된 정보를 사용하고 있다. 건강심사평가원과 국민건강보험공단에서 제공하고 있는 보건의료 관련 빅데이터들은 비식별화를 거친 자료들이다. 아이러니하게도 이렇게 비식별화된 정보가 빅데이터 분석 과정을 거치면서 다시 재식별이 가능한 데이터가 될 가능성이 높다고 한다.1 빅데이터 분석의 결과로 인해 비식별화된 데이터가 다시 식별가능한 데이터가 되버릴 수 있다니 웃어야할지 울어야할지 모를 일이다.

ICT 산업이 고도화되면서 정보보호 및 보안 문제는 불가항력적인 것으로 존재해왔다. 애초부터 완벽한 보안 방법이란 존재하지 않는다. 빅데이터 분석도 마찬가지로 많은 보안 위협과 시련을 겪으며 성장 중이다. 헬스케어 분야에서의 보안 문제는 조금더 길게 논의되고 천천히 하나씩 변해갈 것으로 전망한다. 우리가 느끼는 불편함의 근원은 최근 부쩍 자주 발생하는 여느 보안사고와는 다른 면이 있다. 남에게 보여주기 싫은 치부를 드러내는 것과 같아서이다. 내 몸무게와 키, 체지방률, 병력 등을 내보이는 것은 주민등록번호 유출과 다른 문제이다. 진짜 프라이버시 문제이기 때문이다.

세 차례에 걸쳐서 ‘헬스케어와 애널리틱스, 그 불편함에 관하여’를 연재하면서 말로 설명하기 어려운 헬스케어 데이터 분석에서 느껴지는 답답함과 이질감을 논해보았다. 그럼에도 불구하고 헬스케어 분야에서 데이터 분석은 더욱 확대되고 고도화될 것임이 분명하다. 인류의 안녕과 행복을 기원하는데 있어서 건강만큼 중요한 것도 없으니 말이다.


  1. http://www.huffingtonpost.kr/pakghun/story_b_6504852.html