ⓒphoto Shutterstock
ⓒphoto Shutterstock

페이스북 개인정보 유출 사태의 후폭풍이 거세다. 미국 대선이 한창이던 2016년, 트럼프 캠프로부터 유권자 분석을 의뢰받은 ‘케임브리지 애널리티카’란 회사가 ‘성격분석 앱’을 페이스북에 올려 이용자들이 올린 게시물이나 ‘공유’ ‘좋아요’ 기능 등을 통해 정치적 성향을 파악하고 전략을 짜도록 협력한 것은 물론 페이스북 이용자 5000만명의 개인정보까지 트럼프 캠프로 유출했다는 사실이 최근 드러났다. 이 같은 사실이 알려지면서 빅데이터 활용에 따른 개인정보 유출 위험이 다시 도마에 오르고 있다.

동형암호가 4세대 방식

4차 산업혁명에서 빅데이터 활용은 대단히 중요하지만 빅데이터 시대에 개인정보 관리 체계가 바뀌지 않는 이상 이번과 유사한 사건은 언제든지 일어날 수 있다. 고객의 개인정보를 빼돌릴 수 있다는 것은 지금 쓰는 암호에 허점이 있기 때문이다.

보통의 경우 암호를 언급하면 대부분의 사람들은 패스워드를 떠올린다. 이는 1세대 암호이다. 좀 더 적극적인 의미에서 개인의 정보나 메시지를 보호하기 위한 암호는 대칭키 암호를 의미하는데 이것이 2세대 암호이다. 대칭키 암호는 잠그는 열쇠(암호화키)와 푸는 열쇠(복호화키)가 똑같다. 두 사람이 비밀리에 통신을 하려면 미리 같은 비밀키를 가지고 있어야 한다. 주로 군사, 안보를 목적으로 사용되었다. 반면 3세대 암호인 공개키 암호는 암호화키와 복호화키가 다르다. 암호화키를 공개하기 때문에 누구나 정보를 암호화해 보낼 수 있고, 암호를 푸는 복호화키는 개인만 갖고 있으므로 노출되지 않는다. 현재 가장 많이 사용하는 암호 시스템이다.

공개키 암호체계는 민감한 개인정보를 알아볼 수 없게 보호하고 있다. 가장 잘 알려진 것이 공인인증서나 e메일 등에 널리 쓰이고 있는 암호이다. 공개키 암호가 나오면서 전자인증, 전자결제, 전자화폐 같은 다양한 상업 서비스가 가능해졌다. 하지만 1세대부터 3세대까지의 암호는 모두 암호화하고 푸는 단계를 거쳐야 해서 개인정보가 노출될 위험이 있다.

예를 들어 개인의 소득·세금(국세청), 건강·의료(건강보험공단), 학력(NEIS) 정보 등을 저장하고 서비스하는 공공기관은 보안이 매우 중요하다. 이런 개인적 자료들이 서버 회사 직원이나 해커들에게 무방비로 노출되는 것을 막으려면 반드시 자료를 암호화해야 한다. 하지만 암호가 걸린 상태에서는 통계적 분석을 할 수가 없다. 사용자가 정보를 살펴보거나 간단한 통계처리를 위해 데이터를 활용하려면 어쩔 수 없이 암호를 풀어야 한다. 암호를 푸는 이 과정에서 보안담당자, 통계분석가 등 여러 사람에게 고객의 개인정보가 노출될 수밖에 없다. 그렇다면 암호가 걸린 상태에서 데이터를 분석할 수 있는 해결책이 없을까.

이 문제를 해결할 대안으로 떠오르는 기술이 서울대 수리과학부 천정희 교수팀이 개발한 4세대 암호체계인 ‘동형암호’이다. 사용자의 프라이버시를 침해하지 않고도 사용자의 데이터 처리가 가능한, 국제적으로 인정받은 기술이다. 교수팀의 동형암호는 기업이 고객 정보 등 다양한 데이터를 활용할 때, 암호화된 상태에서 통계 분석할 수 있는 수학 알고리즘이다. 수학 함수를 이용하여 개인정보를 건드리지 않고 자유롭게 데이터를 분석한 뒤 분석 결과만 뽑아낸다. 마치 금고 안에 사진 설명을 줄줄이 단 앨범을 넣고 잠근 뒤 금고를 열지 않은 채로 앨범을 분석해 사진 내용은 무엇이고 사진은 몇 개 들어 있는지 등을 아는 것과 비슷하다. 기존의 암호 시스템과 성격이 전혀 다른 기법이다.

동형암호는 2011년 미국 매사추세츠공대(MIT)가 뽑은 미래 10대 유망기술 중 하나다. 1970년대에 연구가 시작돼 2009년에서야 IBM 연구원인 크레이그 젠트리(Craig Gentry)에 의해 기술적 가능성이 증명되었다. 이후 여러 방면으로 동형암호의 연구들이 진행되어 왔지만 실제 응용 분야에서는 적용이 어렵다는 한계가 지적되어 왔다.

천정희 교수팀이 개발한 동형암호 프로그램의 이름은 ‘혜안(HEAAN)’. 교수팀은 지난 3월 15일 미국 보스턴에서 열린 ‘동형암호 표준화 국제회의’에서 세계 최초로 혜안을 시연해 높은 호응을 얻었다. 암호가 걸린 상태에서 대출과 연체 등 100가지가 넘는 명세가 포함된 가상 개인 신용정보 2만1000건을 만든 다음, 이를 분석해 연체 고객과 우량 고객의 신용점수 차를 평가하는 데 성공한 것. 시연을 지켜본 전문가들은 “빅데이터 활용에 날개를 달았다”며 감탄했다.

천 교수팀은 지난해 10월에는 미국 올랜도에서 열린 ‘게놈 데이터 보호 경연대회’에서 마이크로소프트 연구소, 스위스 로잔연방공대 등 세계 유수의 동형암호 연구팀들을 제치고 우승하며 기술력을 입증받기도 했다. 이때는 1500명의 유전자 해독 정보 수천 개를 암호화한 상태 그대로 분석해 유방암 발생 유전자의 변이 유무를 빠르게 판단해냈다.

4세대 암호 ‘혜안’ 개발자 천정희 서울대 교수. ⓒphoto 천정희
4세대 암호 ‘혜안’ 개발자 천정희 서울대 교수. ⓒphoto 천정희

의료·납세·군사 분야 활용 가능

동형암호 혜안을 이용하면 다양한 분야에서 빅데이터를 활용할 수 있다. 은행 전산시스템이나 의료·납세·교육 등의 정보시스템에 혜안이 실제로 적용될 것이라고 천 교수팀은 설명한다. 정보 유출 위험 없이 병원 진단기록과 보험료 지급, 은행이나 영화 데이터 처리 등이 가능하다.

예를 들어 온라인 비디오 서비스 분야의 최강자인 미국의 ‘넷플릭스’가 회원들이 선호하는 영화를 제공한다고 하자. 이때 혜안을 이용해 회원들이 특별히 좋아하는 영화와 드라마를 모아 분석한 후 개인별 맞춤형 서비스를 제공할 수 있다. 물론 민감한 개인정보는 안전하게 보호하면서 원하는 정보를 자유롭게 제공한다. 설사 데이터가 유출되더라도 개인정보가 암호화된 상태이기 때문에 문제가 없다.

군사 분야도 예외는 아니다. 특히 사이버 보안에서 중요한 역할을 담당하게 될 것이다. 인터넷전화(VoIP) 등을 통해 민감한 정보를 주고받을 때 동형암호가 강력한 수단이 될 수 있다. 철통 보안이 필요한 군사 정보에는 철벽 암호가 답이다.

천정희 교수팀은 현재 궁극의 개인정보인 DNA를 암호화된 상태에서 분석하는 연구를 혜안을 통해 진행하고 있다. 특정 질병의 발병 가능성까지 예측할 수 있는 기술 개발을 검토 중이다. 의료정보, 질병과 관련된 내용을 알아내는 의료 분야에서도 동형암호는 필수라는 이야기이다.

‘빅데이터 활용’과 ‘개인정보 보호’라는 두 마리 토끼를 잡을 수 있는 동형암호 혜안. 올해 말쯤이면 혜안이 상용화될 수 있을 것으로 보인다고 천정희 교수는 말한다. 오는 5월 25일부터 유럽연합(EU)이 대폭 강화된 ‘개인정보 보호규정(GDPR)’을 시행할 것이라고 예고하고 있어 동형암호 프로그램은 더욱 널리 활용될 전망이다.

키워드

#과학
김형자 과학칼럼니스트·전 ‘뉴턴(NEWTON)’ 편집장
저작권자 © 주간조선 무단전재 및 재배포 금지