공공 이슈 이해 돕는 최적의 접근
관심과 참여 유도하는 양방향성 경험 특징
시각화 기술 앞서 저널리즘 원칙 수렴해야
안팎의 소통 등 커뮤니케이션 과정 중요하다
데이터(data). 21세기에 가장 빈번히 언급된 미디어 생태계의 단어일 것이다. 오랜 전 인류가 기록을 남김과 동시에 시작된 데이터는 디지털 시대에 빠르게 축적되기 시작했다. 컴퓨팅 파워 등 인프라 구축으로 방대한 데이터 접근 및 활용 가능성이 높아지면서 중요성도 크게 부각됐다.
저널리즘 영역은 더욱 명확하게 호응했다. 2010년 월드와이드웹(www) 창시자 팀 버너스 리(Tim Berners Lee)의 “데이터 분석이 저널리즘의 미래”라는 언급 이후 ‘데이터 저널리즘(data journalism)’은 빼놓을 수 없는 언론계 화두로 자리잡았다. 뉴욕타임스, 워싱턴포스트 등 세계 주요 언론사들은 데이터 저널리즘을 앞세우며 디지털 전환을 전개하고 있다고 해도 과언은 아니다.
데이터 저널리즘은 현상과 정보 전달에 심층적이고 과학적 맥락을 제공한다. 복잡·다변화된 현대사회를 풀어 쓰기엔 한계가 있는 기존 저널리즘을 보완하는 것이다. 언론사들의 의미있는 도전도 계속 이어지고 있다. 하지만 아직도 데이터 저널리즘이 어렵다거나 별개의 영역으로 생각하는 경우도 많다. 이같은 인식의 장벽을 넘어서는 훌륭한 국내외 데이터 저널리즘 사례를 소개한다.
맥락적이고 심층적인 접근에 활용
상황의 전모를 파악하는 시각화
2023년 2월 튀르키예와 시리아에서 발생한 강진을 전하는 재난보도는 피해 상황을 다각도로 확산시키면서 전 세계의 지원을 이끌어냈다. 우리나라를 포함한 세계 각국에서 도움의 손길을 이끌어냈다. 재난은 국지적일지 모르나 대응은 세계적이라는 이야기가 나오는 배경이다.
현장 정보를 단순히 전달하는 것으로는 재해 재난 보도에 한계가 따른다. 첫째, 반복하는 스케치 보도의 피로감이다. 새로운 이미지와 영상을 공급하며 화제를 모을 수도 있지만 현장 여건으로 유사한 내용을 재연해 수용자를 점점 무뎌지게 할 수 있다.
둘째는 현장감 결여다. 기술의 발전으로 미디어에 생동감이 더해졌지만 결국 현장에서 전하지 못한다면 일정 수준 이상의 공감과 이해를 불러모으는 것은 어렵다.
셋째는 상황의 복잡성이다. 재난은 한 단어로 명명되지만 재난 상황은 한 마디로 정의되기 어렵다. 원인, 과정, 피해, 후속 처리 등 모든 것이 복잡해서 기존 보도 형태로는 전모를 알기는 쉽지 않다.
이런 문제를 극복할 수 있는 건 맥락적이고 심층적인 보도다. 데이터 저널리즘은 이에 적합한 도구다. 뉴욕타임스에서 지진 피해 상황을 매핑(mapping)한 보도는 대표적인 사례다. 위성사진 분석으로 이번 강진 피해의 중심에 있는 튀르키예 도시 ‘마라시(Kahramanmaras)’의 건축물 손상 및 파괴 상황을 일목요연하게 표현했다.
다양한 외부 기관 데이터 수집
뉴욕타임스는 여러 정보 원천으로부터 필요한 데이터를 수집했다. 보도의 핵심인 위성사진은 지구 이미지를 다각도로 제공하는 플래닛랩스(Planet Labs), 매핑을 위한 건물 지도(building footprint)는 마이크로소프트의 인공지능 기술로부터, 구체적 피해 전달을 위한 지진 전후 사진은 각각 구글 맵과 현장을 촬영한 매체들로부터 가져왔다.
이를 통해 현장(ground level)에서 하늘 위에 눈(위성사진)까지 피해 현장을 둘러싼 다채로운 데이터를 모았다. 중요한 건 흩어져 있는 파편들을 모아 하나의 그림을 만든다는 점이다. 즉, 데이터들을 맥락에 맞춰 조합해 지진이 파괴한 것들에 대한 심층적인 이해를 제공할 수 있도록 하는 것이다. 여러 종류의 데이터에 접근성을 높이는 기술 활용이 뉴욕타임스 보도를 가능케 했다고 할 수 있다.
위성사진 매핑에 딥러닝 기술 동원
데이터 수집도 중요하지만 데이터 저널리즘을 구현하는 방법론에 주목해야 한다. 즉, 데이터에 대한 접근과 분석이다. 이 방법론엔 신과 구가 모두 있다. 먼저 거시적인 접근을 위해 새로운 기술 활용으로 고해상도의 위성사진과 딥러닝 기반의 지형 매핑을 들 수 있다.
지상의 곳곳을 고해상도로 촬영한 위성사진은 어떤 건물들이 피해를 입고 파괴됐는지 육안으로 파악할 수 있게 해준다. 이를 통해 사람의 눈으로 현장을 한눈에 들여다 보고 피해를 분석한다.
그리고 피해 상황을 보다 쉽게 표현하는 도구로 인공지능 기반 매핑을 적용한다. 딥러닝으로 지도 위에 건물의 크기와 모양을 표기해주는 매핑 기술은 분석한 피해 상황을 그릴 도화지가 된다. 피해를 입은 건물들을 매핑된 지도 위에 붉은 윤곽선으로 표기해 누구나 한눈에 알아 볼 수 있는 피해 지도를 구현한다.
여기에 지진 전과 후 현장 사진들을 비교해 구체적 상황에 대한 맥락을 제공했다. 마치 구글 맵이 위성사진에서 우리가 사는 거리까지 확대 가능한 것처럼, 피해 지역에 대한 거시적인 이해에 현장의 구체성을 더했다. 독자들에게 상황을 숲부터 나무까지 이해할 창을 마련해준 것이다.
일관된 데이터저널리즘 대응 역량 중요
언론사가 데이터 저널리즘을 구현할 때 중요한 지점은 일회적인 보도가 아니라 지속적으로 대응하는 부분이다. 뉴욕타임스는 튀르키예, 시리아 지역의 지진 피해에 대해 입체적인 보도를 이어가고 있다. 데이터 저널리즘 사례들은 연관 보도에서 발생하는 궁금증에 대한 해답이자 또 다른 취재물의 연결점으로 기능한다.
뉴욕타임스는 지진 피해 보도(What the Quake destroyed)와 더불어 튀르키예, 시리아 지진에 대해 우리가 알고 있는 정보(What we know), 지진 피해의 지리적 정보(Maps), 현장 사진과 영상(Photos and videos), 그리고 지원 방법(How to help)이라는 솔루션까지 함께 제시했다.
다각도의 정보 전달은 독자의 이해도 돕지만 정부와 관련 기관들의 대응, 다른 지역들의 재난 및 피해 예방에도 좋은 정보 기능을 한다. 같은 도시에 있던 건물들이지만 어떤 유형의 건물들이 큰 피해를 입었고, 피해의 경향이 어떻게 진행됐는지 등을 쉽게 파악할 수 있기 때문이다[1].
공공 데이터 활용은 필요 아닌 필수
'데이터 저널리즘'하면 공공데이터(public data)다. 주로 정부나 공공기관에서 공개한 데이터인데 정치·사회적 문제를 조명할 때 쓰인다. 저널리즘의 주요 가치인 공공성을 담고 있어 많은 기자들이 데이터 저널리즘을 구현할 때 활용한다.
공공데이터 활용은 국내외 모두 활발한 편이다. 미국의 ‘코로나 이후 사라진 공립학교 학생들(Thousands of kids are missing from school. Where did they go?)’과 국내의 ‘전국 기초의원 의정감시 데이터 구축 대작전!(내가 뽑은 의원님도 수상한 투잡중?)’ 사례를 소개한다.
(사례1) 대학과 언론의 협업으로 코로나19 그늘 조명
AP(Associated Press)는 스탠포드대(Stanford University’s Big Local News project)와 함께 접근 가능한 공공 데이터가 존재하는 21개 주와 워싱턴, D.C.를 대상으로 분석을 진행했다. 이를 바탕으로 코로나 이후 공립, 사립 그리고 홈 스쿨링 등 교육 서비스 가운데 어떤 것도 받지 않는 학생들이 많다는 사실을 다뤘다.
공공 이슈를 다루는 보도
AP와 스탠포드대 연구진은 교육으로부터 소외된 학생들을 찾기 위해 접근 가능한 공립 및 사립 그리고 인구 통계 조사에서 학생 연령 구간에 대한 최신 데이터를 수집했다[2]. 수집 데이터를 분석해 나가며 코로나로 공립학교가 문을 닫은 이후 그 어떤 교육과정에도 등록되지 않은 학생 수가 약 23만 명에 이른다는 것을 포착했다. 사립학교나 홈스쿨링을 받는 학생 비율이 대폭 늘어난 것과 대비되는 결과다.
코로나 이후 공립학교에 등록하지 않은 학생 약 70만 명에서 사립학교와 홈스쿨링을 받고 있는 학생들, 그리고 본래 살고 있는 주에서 벗어난 학생들을 순차적으로 제외하며 그 어느 곳에도 포함되지 않은 ‘실종’된 학생들을 찾아내는 과정을 데이터 기반의 간단 명료한 시각화로 풀어냈다. 코로나 이전 데이터와 비교해 코로나19가 주요 원인이라는 점도 검증했다.
이후 취재 역량을 활용해 실제로 교육 소외를 겪고 있는 아이들을 취재한 내용들과 전문가의 의견을 덧붙였다. 현재 환경에서 방치하는 교육 현장의 그늘을 구체적으로 지목하는 절차다. 현상 발견에 그치지 않고 기존의 방식으로 맥락을 제공한 것이다.
구체적인 질문에 답변하는 도구
이 프로젝트는 많은 사람들이 공립학교 등록 학생 수 감소를 언급하지만, 그 누구도 어떤 아이들이 왜 시스템을 벗어나는지는 질문하지 않는다는 점에서 시작됐다. 또한, 코로나19 이후 학생 현황을 보여주는 다른 자료들이 주로 시험점수와 퍼포먼스 데이터에 치우쳐 회복 현상만을 논의하는 문제 의식에서 접근했다.
AP는 실제로 교육 소외를 겪고 있는 학생들을 심층 취재했다. 일부 학생들은 성장과 교육 측면에서 한참 뒤쳐져 학교에서 어떻게 행동하고 학습해야 하는지 알지 못하는 심각한 수준이라는 것을 밝혀냈다. 또 이러한 학생들 가운데 다수가 공식적으론 학교 '로스터'에 포함돼 교육 소외자인지조차 파악하기 어려운 현실을 담았다.
하나의 사건을 보도하기 위해 데이터, 전문가, 취재기법을 잘 조합한 사례이다. 공공데이터 분석과 이해를 돕는 단순 명료한 시각화로 우리가 쉽게 알아차리기 힘든 현상(사실)을 발견해냈고, 전문가와 협력을 통해 현상이 의미하는 바가 무엇인지 그리고 어떠한 문제가 도출되는지 분석하고, 문제 해결의 방향성도 제시했다.
(사례2) 통합 데이터셋을 기반으로 문제점 발견
시민단체인 정보공개센터와 한국일보는 기존 공공 데이터와 정보공개청구로 기초의원데이터를 수집 및 분석했다. 이를 통해 '기초의원 의정감시' 통합 데이터셋을 구축하고 겸직에 있어 위법소지가 있는 기초의원을 가려냈다.
수많은 데이터 더미에서 의미를 발굴
정보공개센터와 한국일보 사회부 탐사팀은 ‘기초의원 의정감시 데이터 구축’ 작업을 위해 다음과 같은 데이터를 수집하는 과정을 거쳤다.
1) 관련된 기존 청구자료나 선행 데이터 수집 및 참조
2) 기초의회에 신고된 겸직 신고서류 등을 정보공개 청구
3) 각 기초의회 홈페이지에서 정당명 및 의원 프로필 정보를 전수조사
4) 행정안전부가 발간한 ‘제8기 후반기 지방의회 현황 보고서’ 분석
5) 정보공개청구와 기사 탐색을 통한 징계내역 수집
6) 전국 광역시도 관보의 개인별 재산 신고서류에서 기초의원 재산신고 정보 수집
수집된 데이터들의 분석은 행정법 전문가들의 도움을 받았다. 지방자치법 및 ‘행정안전부 지방의회 운영 가이드북’이 정한 기준과 유권해석 사례에 따라 의원별 겸직신고의 ‘사임권고 대상’ 여부를 분석해 위법 여지를 면밀히 파악했다. 또한, 겸직을 신고하지 않은 기초의원들을 별도로 분류해 ‘신고해야 할 겸직을 신고하지 않은 기초의원’을 가려냈다.
외부 민간 영역 참여로 전문성 높여
데이터를 통한 사회문제 조명, 새로운 데이터셋 구축, 그리고 언론·전문가·민간 영역의 협력 등에서 의미있는 접근이었다. 개개인이 알기 어렵지만 우리의 삶에 많은 영향을 미치는 문제를 조명하고 단번에 이해하기 어려운 법적 내용을 데이터 분석과 직관적인 시각화로 잘 풀어냈다.
기존 데이터를 활용함과 동시에 데이터 확장으로 새로운 공공데이터를 만들어 냈다. 데이터를 이용해 의미있는 결과를 도출하는 게 데이터 저널리즘의 본질이지만, 새로운 데이터셋 구축 또한 향후 데이터 저널리즘을 위한 밑거름으로 매우 중요하다.
가장 중요한 시사점은 협력이다. 언론은 본연의 업을, 시민은 자신의 권리를, 전문가들은 전문성을 보태 협력했다. 점차 복잡하고 깊어지는 현대사회 속에서 언론과 민간 그리고 전문가 간 협력은 저널리즘 구현의 매우 중요한 요소이기 때문이다.
시민의 참여는 알 권리에 대한 주체성을 확보하고 언론의 단독 보도보다 독자들에게 현실감을 부여한다. 전문가의 참여는 법이라는 복잡한 영역에서 오도의 가능성을 줄이고 결과에 대한 신뢰를 확보한다. 협력을 통해 언론 홀로는 그동안 제대로 보지 못했고, 건드리지 못했던 부분들을 전달할 수 있다.
1차원 정보를 뛰어넘는 시각화가 핵심
데이터 저널리즘에서 빠질 수 없는 요소는 바로 시각화다. 같은 데이터라도 어떻게 표현하느냐가 독자의 이해와 몰입도를 결정한다. 다채로운 시각화와 함께 웹페이지의 상호작용을 덧붙여 이를 실천한 두 사례를 소개한다.
(사례1) 메시지 전달에는 입체적인 표현 능력이 좌우
KBS ‘소멸의 땅, 지방은 어떻게 사라지나’는 다큐멘터리 형식으로도 제작 및 방영돼 상당히 알려진 데이터 저널리즘 프로젝트다. 수개월에 걸쳐 직접 취재 및 수집한 데이터들을 다채롭게 시각화 했다. 데이터 기반의 분석은 물론이고 시각과 상호작용을 확보한 ‘비주얼(visual)’ 저널리즘이다.
이 프로젝트도 인구주택총조사를 비롯한 각종 공공데이터를 근간으로 했다. 여기에 국내 현장 취재를 통한 수집 자료, 해외 사례 조사 등 지방에서 인구가 사라지는 ‘지방소멸’을 조명하기 위해 여러 데이터를 수집 및 활용했다.
문제의 심각성을 온전히 전달하기 위해 영상 포맷을 넘어 인터랙티브 페이지를 함께 구성했다. 제작된 인터랙티브 페이지는 1차원적인 텍스트와 이미지에서 벗어나 각종 영상, 그래픽, 데이터 지도 등을 활용해 분석한 데이터 시각화로 완성됐다.
다채로운 시각화를 부각한 것은 웹페이지의 상호작용성이다. 자료들을 단순 나열이 아니라 독자의 행동에 반응하도록 구성함으로써 몰입도를 높였다. 전국 빈집율(2019)과 지방소멸지수를 표현한 인터랙티브 지도, 인구 대비 지도 면적을 표현하는 카토그램[3], 수도권으로의 청년 인구 이동(2019)를 나타내는 3D 그래픽 등 여러 시각화 도구와 상호작용 가능한 웹페이지를 동시에 활용했다.
독자가 쉽게 이해할 수 있는 장치 마련
KBS의 소멸의 땅 프로젝트는 자칫 자극적일 수도 있는 '지방소멸'이라는 주제를 데이터 기반으로 전달했다. 인구 감소 주제는 한국사회의 오래된 화두다. 신생아·출산율 감소, 인구절벽, 고령화 등으로 다뤄지고 있다.
하지만 일반인들이 체감하기엔 한계가 있었다. 수도권 시청자들의 경우는 먼 미래일 수도 있는 주제였다. 지방소멸을 얘기하지만 지방이 아닌 곳(약 11.8%)에 국민의 절반이 살고 있기 때문이다. 이를 인터랙티브한 형태로 구현한 것은 이해도와 몰입도를 높이는 데 훌륭한 기법이라고 할 수 있다.
아무리 중요한 주제라도 공감할 수 없다면 개개인에게 제대로 전달되기 어렵다. 이번 프로젝트는 다방면의 데이터 수집과 분석, 전문가 자문을 활용한 데이터 저널리즘 구현으로 확실한 '근거'를 마련했다.
주목할 점은 일방적 보도가 아닌 독자가 참여하고 몰입할 수 있는 포맷 구성이다. 기존에도 통계와 데이터가 없던 것은 아니지만 이를 어떻게 정리하고 덧붙이고 그리고 표현하는 지가 왜 중요한지 보여주고 있다.
(사례2) 사실 그 이면의 진실을 들춰내는 도구
2천 톤의 물과 백만 명의 사람들. 1톤의 희토류를 채취하기 위한 소모품들이다. 편의와 친환경의 명목 아래 미얀마의 환경이 파괴되고 있다. 콘티넨탈리스트(Kontinentalist)가 데이터 저널리즘으로 조명한 현실이다.
희토류는 우리의 필수품인 스마트폰, 컴퓨터 그리고 친환경을 위한 풍력 터빈, 전기차 등에 사용된다. 희토류의 주요 생산국인 중국, 미국, 미얀마 그리고 호주 가운데 미얀마는 최근 쿠데타 등 정치적·경제적 혼란으로 인해 착취에 놓여있다. 콘티넨탈리스트는 '기술 금속'으로도 불리우는 희토류 생산 이면에 숨겨진 환경과 지역 커뮤니티 파괴를 데이터에 기반한 시각화와 인터랙티브 웹페이지로 풀어냈다.
콘티넨탈리스트는 문제 제기에 앞서 아직 생소할 수 있는 희토류의 종류와 역사 그리고 사용처를 풀어냈다. 다음으로 스마트폰, 전기차 등에 사용되는 희토류의 양, 앞으로 파리 기후협약 기준에 따른 친환경 제품 생산이 2040년까지 증폭할 희토류 사용량을 데이터 기반 시각화로 제시했다.
결국 희토류 생산이 아이러니하게도 친환경과 거리가 먼 삼림 벌채와 각종 오염 그리고 심지어 방사성 원소 등을 포함한다는 점을 지적했다.
인터랙티브 지도를 활용해 희토류 최대 생산지를 그려가며 미얀마의 상황까지 맥락적으로 정보를 전달한다. 미국을 비롯 희토류의 최대 생산, 가공 그리고 소비 국가인 중국의 상황을 데이터로 설명했다.
특히 미얀마의 지형을 기반으로 정치적·경제적 혼란을 풀어내며 관심과 규제의 사각 속에 놓여 있는 노동 착취와 생태계 파괴를 짚었다.
상호작용이 가능한 시각화를 통해 희토류 생산과정에서 유발되는 독성 가스 그리고 수자원 및 토양 오염, 주변 지역의 오염 실태를 다뤘다. 무엇보다 이 과정에서 주민들과 노동자의 건강에 미치는 영향을 살폈다. 희토류 채취부터 제품 생산까지의 사이클을 보여준 방식도 희토류에 대한 전반적인 이해를 도왔다.
독자 호응 경험을 제공하는 웹페이지
이 보도는 인간 편의와 기업의 친환경 주장 구호 아래에 놓인 어두운 그림자를 잘 밝혀낸 수작이다. 일반 독자는 희토류 뉴스를 접하고 있지만 실제 채취 및 활용 과정에서 일어나는 피해를 인지하지 못하는 만큼 의미 있는 접근이라고 할 수 있다.
특히 희토류 재활용을 포함하는 대안과 규제 움직임을 소개하는 등 향후 방향성을 제시해 완성도를 높였다. 이 과정에서 독자의 관심과 참여의 기제를 반영한 것은 데이터 저널리즘의 특성을 잘 녹여낸 것이다.
데이터 저널리즘은 어렵고 생소한 사안을 직관적이고 구체적으로 이해할 수 있도록 돕는 활동으로 독자의 호기심을 끌어내고 직접 스토리에 가담하는 장치다. 이를 위해 텍스트 위에 데이터 시각화 자료로 적절히 배치하고 양방향성을 배가했다. 이를 통해 웹페이지를 방문한 독자는 마치 현장에 온 듯한 경험을 갖는다.
데이터 저널리즘의 본질은 진실 찾기
소개한 사례들로 데이터 저널리즘에 대해 배울 수 있는 세 가지 포인트는 다음과 같다.
- 연속적/맥락적 보도: 데이터 시각화 그리고 이를 활용하는 적절한 기술이 우선이지만 아무리 훌륭한 데이터 저널리즘을 구현하더라도 담을 수 있는 내용에 한계가 있다. 시간이 흐르면 정보는 문제가 생기기 마련이다. 지속적으로 관련 내용을 업데이트하는 것은 물론 이해관계자나 상황 변화를 다각도로 다루는 접근이 중요하다.
- 시민사회와 전문가 협력: 복잡한 이슈를 포착하고 수면 위로 끌어내려면 시민사회와 전문가의 협력은 필수적이다. 뉴스룸 외부의 전문가들과 커뮤니티와의 협력은 데이터 저널리즘 구현에 가장 중요한 역량 가운데 하나이다.
- 입체적인 표현기법: 데이터 접근성을 낮추고 시각화와 상호작용성 구현에 필요한 기술 사용은 점점 보편화 되고 있다. 고화질 위성사진, 딥러닝 기반 매핑 등 테크 기업의 원천 기술이 대표적이다. 같은 데이터라도 어떻게 표현하느냐에 따라 이해의 정도가 달라지고, 어떤 경험을 제공할 수 있느냐도 좌우한다. 결과물을 어떻게 드러낼지는 데이터 저널리즘의 의제라고 할 것이다.
이번에 소개하는 데이터 저널리즘의 최신 사례들은 모두 공공 이슈를 짚은 것들이다. 데이터 저널리즘이 일반적으로 주목하는 아이템이다. 뉴스룸과 기자가 어떤 사안을 다룰지 선택하는 것부터 어떤 진실을 파헤치느냐의 과정에서 데이터 저널리즘은 현대 뉴스룸의 공공 저널리즘에 결정적 기여를 한다.
확실한 것은 데이터 저널리즘도 '정보 전달'과 '진실 발견'이라는 저널리즘의 본질을 추구할 때 진가를 발휘한다는 점이다. 훌륭한 데이터 저널리즘은 취재 윤리와 독자 이해, 안팎의 소통 같은 원칙 강조와 투명한 커뮤니케이션에 힘을 싣는다는 점을 유의해야 한다.
-
1
이미 각국 정부나 구글과 같은 기술 기업에선 관련 기술들을 활용해 재난 경보 및 예방 시스템을 구축해 제공하는 프로젝트를 수행하고 있다.
-
2
코로나로 학교들이 폐쇄에 들어갔던 2020년을 제외한 2019-2020, 2021-2022년 데이터
-
3
카토그램은 특정 주제를 나타내는 통계 수치를 바탕으로 하여 일반 지도를 왜곡하여 표현한 지도이다. 인구나 GDP 등 특정한 통계 수치에 따라 면적이 표현되기에 만약 어떤 지역의 통계 수치가 크면 실제 면적이 작더라도 지도상에서는 크게 표현되고, 반대로 통계 수치가 작으면 실제 면적이 크더라도 지도상에서는 작게 표현된다.