UPDATED. 2024-04-24 14:55 (수)
‘소셜헬스’의 가능성을 엿보다
‘소셜헬스’의 가능성을 엿보다
  • 김재호 학술객원기자
  • 승인 2013.11.20 11:04
  • 댓글 0
이 기사를 공유합니다

키워드로 읽는 과학本色36_ SNS의 독감 예보

“당신의 SNS가 언제 독감에 걸릴지 예고한다면?” 최근 스미소니언박물관에서 발행하는 과학매거진(www.smithsonianmag.com)에 이와 관련된 내용이 실렸다.(「Your Tweets Can Predict When You’ll Get the Flu」11월 8일자. 이하 내용 참조) 트윗을 사용하는 사람은 일종의 센서로 작용한다. 연구진은 트윗 내용에 대한 분석으로 감기를 예보한다. 이에 대한 연구는 미국 로체스터대 연구진이 실시했다.

1854년 런던, 가공할 위력의 콜레라가 온도시를 뒤덮었다. 의사인 존 스노우는 공중 보건 영역에서 혁신적인 아이디어를 제공했다. 유행병 관련 지도를 만든 것이다. 콜레라가 발생한 곳을 환자 거주 지역 중심으로 지도에 표기했다. 이를 통해 그는 특정한 곳의 물펌프가 감염 진원지라는 걸 알아냈다. 스노우의 노력은 전염병이 나쁜 공기로 퍼져나간다는 비과학적인 이론을 물리쳤다. 위생 관리를 위한 패러다임의 전환이 이 시기에 일어났다.

매핑 기술로 유행병 예보

매핑 기술(위치정보를 근거로 병의 진원지를 파악하는 기술)은 질병에 따라 상이하다. 하지만 스노우가 시도했던 기술과 로체스터대 헨리 코츠 박사팀이 진행한 연구에는 유사성이 있다. 연구팀은 알고리즘을 통해 독감 트렌드를 예상한다. 특히 공적으로 접근가능한 위치정보 트윗들의 열쇳말들을 기반으로 해 언제 감기에 걸릴지 예보할 수 있다.

“사람은 우리 주위의 세상을 바라보는 일종의 센서다. 그들이 보고 겪는 반응들은 SNS를 통해 알려진다.” 코츠 박사는 “트윗 분석으로 인구 집단에 대한 구체적인 측정이 가능하다”면서 “트위터 유저들의 참여가 필요하지 않다”고 설명한다. 기침과 열병으로 감기에 걸렸다고 트윗을 날린다고 하자. 그러면 의도치 않게 주요 데이터를 광대한 공중 보건 실험에 제공하는 셈이다. 연구진들은 독감이 어디로 퍼져나갈지 고해상도와 실시간으로 파악하는 데 그러한 정보들을 활용할 수 있다.

이른바 ‘소셜헬스’라고 불리는 코츠의 연구는 트윗 등 SNS를 통해 공중 위생의 이슈들을 추적한다. 최근에는 뉴욕시 한 식당에서 발생한 식중독을 연구팀은 관찰했다. 식당에서 로그인한 사람들은 위치정보가 노출된 트윗들을 포스팅했다. 이들은 구토나 설사, 복통, 오한과 고열에 대해 트윗을 날렸다. 연구팀은 72시간 동안 이와 관련된 트윗을 분석했다. 이를 통해 식중독으로 보이는 480건의 사례를 감지할 수 있었다.

연구 결과에 따르면, 트윗을 분석해 독감이 걸릴 확률을 90%까지 맞출 수 있었다. 사진은 연구 논문에서 캡처

계절이 변하면서 연구팀은 눈에 띄는 인플루엔자 바이러스에 주목한다. 구글 트렌드는 이미 사용자들의 검색 행태를 분석해 독감의 이동 경로를 추적하고 있다. 하지만 구글 트렌드는 지난해 발생한 독감 발생을 과대평가하는 경향이 있다. 왜냐하면 구글의 독감트렌드 예보에 따라 사람들이 독감 관련 검색 및 질의를 하기 때문이다. 예전에 발생한 독감 유행에 대해 궁금해진 사람들이 관련 검색을 시도한다. 이렇게 되면 적확한 예보를 위한 데이터 추출에 영향을 미칠 수가 있는 것이다.

트위터 분석은 이보다 좀 더 나은 예보를 할 수 있다. 실시간 위치정보에 기반한 SNS를 활용하기 때문이다. 연구팀은 독감을 추적하기 위해, 3개월 동안 60만 명에 대한 1천6백만 위치정보 기반 트윗들을 수집했다. 지역은 뉴욕이다. 그 결과 각 지역별·시간차별로 발생 빈도에 따라 지도에 다른 색깔이 나타나도록 했다.

SNS로 전파되는 실시간 정보 분석

연구진은 각각의 트윗이 과연 독감과 같은 증상을 보여주는 것인지 결정하기 위해 알고리즘을 개발했다. 예전엔 단순히 아픈 의미를 나타내는 ‘sick’이라는 단어를 찾아냈다. 하지만 연구진은 이런 접근이 잘못된 결과를 나타낼 수 있다는 것을 파악했다. 왜냐하면 ‘sick’은‘아픈’의 의미 외에 ‘지겨운’(sick of~)이라는 뜻도 함께 가지고 있기 때문이다.

연구의 알고리즘은 한 단어만 보는 게 아니라, 세 단어의 연속성에 착안했다. 그들은 수작업으로 표식한 트윗들의 집합에 기반해, 과연 연속된 세 단어가 얼마나 종종 정말‘아픔’을 의미하는지 파악한 것이다. ‘sick of flu’는분명독감에 걸려아픈 것을 의미한다. 하지만 ‘sick and tired’는 지겨움을 뜻하기 때문에 독감에 걸렸다는 데이터는 아니다. 두통, 기침, 고열은 아픔과 직접 결부된다. 연속된 세 단어의 배열 중 어디에 있든지 상관없이 말이다.

연구진은 수백만 건의 트윗들을 코딩해 몇 가지 흥미로운 사실을 발견할 수 있었다. 독감 관련 트윗들의 변화를 계속 주시하면서 연구진은 미국 질병통제예방센터가 발표하는 독감 수위와 비교했다. 결국 트윗들에 대한 분석은 정확하게 독감 트렌드를 밝혀냈다. 그것도 질병통제예방센터보다 더욱 빠르게 실시간으로 독감 유행 파악이 가능했다.

연구진은 결과를 좀 더 깊이 파헤쳤다. 서로 트윗을 주고받는 각각의 유저들 사이에 발생할 수 있는 상호 영향을 살펴본 것이다. 반 블록 정도 떨어진 장소에서 건강했던 사람이 독감에 걸린 사람들과 접촉했을 때 어떤 일이 벌어질까? 방대한 양의 데이터를 분석한 연구 결과에 따라 독감에 걸릴 확률을 분석했다. 만약 건강한 사람이 독감 증세가 있다고 트윗을 날린 40명의 사용자들을 만나면 그 다음날 감기에 걸릴 확률은 1%미만에서 20%정도로 높아진다. 60명을 만나면 수치가 50%까지 올라간다. 특히 트위터상 절친으로 10명이 등록돼 있는 경우에는 그 다음날 독감에 걸릴 확률이 28%까지 상승한다. 온라인상 친구를 실제 생활에서도 종종 만나기 때문이다. 이러한 분석들을 통해 연구진은 90% 정도의 정확도로 독감 예보를 할 수 있게 됐다.

물론 한계가 존재한다. 우선 트위터를 사용하지 않는 사람들이 많다. 또한 사용한다고 치더라도 아픈 가운데 트위터에 그 소식을 전달하지 않을 수 있다. 그러나 이러한 분석과 연구가 정교해진다면 스마트폰은 특정 지역에 머물지 말라고 알려줄 수 있다. 독감에 대한 경보를 해주는 것이다. 아직은 정교하지 못하지만 ‘소셜헬스’의 가능성을 엿볼 수 있는 대목이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.