인공 지능(AI)은 이미 언론과 기자들에게 광범위하게 적용되고 있다. AI는 콘텐츠 추천 및 배열, 딥 페이크 탐지 및 구독 모델 최적화 등 저널리즘과 오디언스 대상 서비스를 향상하는 데 요긴하게 쓰이는 기술이다. 언론사는 AI를 활용하여 데이터 감지, 추출 및 확인, 기사 및 그래픽 생성, 출판(정렬, 선택 및 우선 순위 지정 포함)을 포함하여 저널리즘 활동 전반에서 수많은 작업을 자동화 하고 있다.
먼저 대용량 데이터를 처리하는 복잡한 절차를 신속하게 마무리하고, 대강의 초안 텍스트를 제공할 수 있는 등 일상적인 업무를 개선한다. 로봇 기자에 의해 실시간 뉴스 보도를 제공하고, 위치나 선호도에 따라 맞춤 정보를 체계적으로 구현할 수 있다. 이 과정에서 뉴스 조직은 그간 잘 다루지 않았던 주제로 콘텐츠를 제작하는 자신감을 가질 수 있다.
런던 스쿨(London School of Economics and Political Science) 미디어 커뮤니케이션학과는 2017년 8월 이후 2022년 11월까지 전 세계 주요 언론사의 저널리즘AI 프로젝트 가운데 총 112개를 수집, 분류했다. 2022년 10월말 통계에 따르면 뉴스 생산 23건, 탐사 보도 8건 등 콘텐츠 생산에 활용한 AI 사례가 두드러졌다. 이어서 연구 및 혁신 13건, AI 전략 12건, 뉴스 수집 10건, 구독모델과 컴퓨팅 기반 미디어 합성(Synthetic Media) 각각 9건으로 다양한 분야에 쓰였다. 이밖에도 교육 및 훈련 7건, 독자 참여 5건, 편향 및 다양성 4건, 팩트체킹 4건, 개인화 3건, 댓글 중재 3건, AI 책임성 2건[1] 등 업무 전반에 AI를 사용했다.
미국 나이트 재단(Knight Foundation)이 지난해 5월까지 분류한 세계 주요 언론사 130개 프로젝트의 절반 가까이는 소셜미디어에서 이슈 파악, 공공기관의 코로나 데이터 수집 등 '보도 역량 강화'에 활용됐다. 이미지 및 비디오 태깅, 스토리 생성 프로세스 자동화 도구 등 '비용 절감' 영역 그리고 페이월, 추천 알고리즘, 아카이빙 등 '수익 최적화'에 AI 프로젝트를 추진했다. 이들 가운데 몇 가지 사례를 살펴보면 다음과 같다.
뉴스 생산 여건 개선하는 토대 마련[2]
매력적인 이미지는 온라인 저널리즘의 필수 부분이다. BBC는 비주얼에 초점을 둔 뉴스 서비스와 제품(앱)을 강조해 왔다. BBC '오리엘(Oriel) 프로젝트'는 기자가 기사에 가장 적합한 이미지를 더 쉽게 찾을 수 있도록 돕는 솔루션이다.
BBC 뉴스랩(News Labs)이 개발하는 프로토 타입은 각 이미지에 추가 데이터를 확보해 검색 도구에서 검색 결과에 연관성을 높이는 것에 초점을 맞췄다. 기사를 빠르게 게시해야 한다는 압박을 받는 기자에게 유용하다.
메타 데이터 추가는 아마존 웹 서비스의 기계 학습 모델[3]인 '인식(Rekognition) 기술'을 사용했다. 각 이미지의 내용을 분석하여 검색 색인에 추가 특성을 만들 수 있다. 이후 기자는 프로토 타입 이용자 인터페이스에서 검색 쿼리에 필드를 추가할 수 있다.
이 결과 감정(얼굴 표정 분석을 기반으로 행복함 또는 놀라움 등 이미지의 감정을 지정), 젠더 밸런스(촬영된 성별 특성의 우월성을 기반으로 한 필터), 인원수(단체 샷과 클로즈업 구분) 등을 검색에 적용할 수 있다.
AP통신은 2017년 컴퓨터 비전(vision) AI 기술(이미지 인식 시스템)을 사용하여 매일 처리하는 수천 장의 뉴스 사진에 레이블을 지정했다. 시스템은 이미지에 주제, 사람, 사진 스타일, 폭력성 여부 등의 정보를 태그 했다. 테스트 데이터셋을 개발하고 최종적으로는 편집자가 태그를 승인하는 등 정확성 판별은 사람의 몫이다.
당시 프로젝트를 맡았던 스튜어트 마일스(Stuart Myles) AP 임원은 "이 시스템을 사용하고 있음에도 2년간 12명 이상의 편집, 기술, 행정 직원으로 약 36개월의 검증, 추가 작업이 필요하다"고 설명했다. 작업의 약 1/3은 자동화하기 어려운 고도의 가치 판단이 필요하기 때문이다. 뉴스룸에서 AI는 일의 시간과 속도를 개선하지만 (최종적으로는) 인간 기자의 관여로 완성도를 높여야 한다.
AI를 사용하여 인용문을 식별하면 새로운 콘텐츠를 생성할 때 유용하다. 시간이 흐른 뒤에도 동일 주제의 의견 변화를 추적하고, 사실을 확인할 수 있다. <가디언>은 프랑스 통신사 AFP와 협력해 기사 본문에서 인용문을 정확하게 추출하고 올바른 출처와 일치시키는 솔루션을 개발했다.
AI 및 자연어 처리 전문 소프트웨어 기업 익스플로전(Explosion)의 도구를 사용했다. 출처 인용의 스타일 가이드를 작성했다. 현재는 따로 관리할 만한 의미 있는 인용문의 식별 기술을 고도화 하고 있다. 기존 메타 데이터, 출처 및 콘텐츠에서 추출한 추가 정보의 조합에 가치를 높이는 작업이다. 더 나아가 기자가 과거 인용문을 쉽게 발견해 현재 발언과 대조하거나 기사를 보강할 수 있도록 사용자 인터페이스 개발에 나서고 있다.
편집자의 취사선택 돕는 도구
- 로이터 통신
로이터는 2020년 구글 디지털뉴스혁신(DNI) 기금을 지원받아 1896년부터 쌓인 100만 건의 동영상 아카이브를 AI 기반으로 설계했다. 레닌에서 트럼프까지, 1차 세계 대전에서 9/11까지, 사라예보에서 중동 가자 지역까지 역사적으로 중요한 순간을 정확히 찾는 환경이다.
특히 사용자가 영상에서 강조가 표시된 장면으로 더 빠르고 쉽게 이동할 수 있다. 가장 큰 장점은 방대한 양의 데이터를 추출해 편집자가 정보를 비교, 선택할 수 있도록 한 것이다.
관심 콘텐츠 파악, 구독 여부 판단까지
- 런던 타임스(The Times of London)
영국 <런던타임스>는 2019년 독자의 관심사에 맞는 맞춤형 뉴스레터를 만들었다. 구독자가 관심을 가질 만한 콘텐츠를 예측한 뒤 읽을 가능성이 가장 높은 시점에 선호하는 형식으로 전송하는 개별화된 이메일 솔루션 '제임스(James, Journey Automated Messaging for Higher Engagement)'다.
'제임스'는 문자 메시지 및 푸시 알림과 같은 채널로 확장하며, 타깃 광고의 정확성을 높이는 데도 사용한다. 다른 매체의 뉴스룸에서도 도입할 수 있다. 이 솔루션은 구글 DNI 자금을 지원받아 뉴스UK(News UK) 데이터과학팀, <런던타임스> 기자 등 약 29명이 9개월여 개발했다. 새로운 AI 소프트웨어를 테스트하는 동안 <런던타임스> 디지털 가입자 취소 사례는 절반으로 줄었다.
- 월스트리트저널(WSJ)
WSJ은 수년 간 테스트 끝에 개별 독자에게 적합한 페이월을 구축했다. WSJ는 자사 웹사이트에 가입하지 않은 방문자를 대상으로 처음 방문하는지 여부, 사용 중인 운영 체제, 읽고 있는 디바이스 등 60개 분야 이상에 점수를 매긴다. 이를 근거로 구독 가능성이 있는지를 파악하는데 이제는 대부분 구독 여부를 파악할 수 있을 수준의 학습 모델을 얻었다.
독자의 감정, 뉴스의 맥락 파고든다
<뉴욕타임스> 광고팀은 2017년 기사가 불러일으키는 감정을 예측해 광고주에게 적합한 문맥 광고를 제안해보자는 과제에 몰두했다.[4] 이후 NYT 데이터 과학팀은 기사에 따르는 감정적 영향을 이해하고 예측하는 프로젝트 '필즈(Project Feels)'를 시작했다.
자발적으로 참여한 1200명 이상의 독자를 대상으로 실시한 설문조사는 기사를 읽는 동안 어떻게 느꼈는지 묻고, '다양한 감정' 범주와 '감정 없음' 범주 가운데 선택하도록 했다.[5] 기계 학습을 위해 데이터를 체계적으로 크라우드 소싱한 것은 이 매체에서는 처음이었다.
<블룸버그>는 2018년 모바일 앱 불레틴(The Bulletin)을 출시했다. 머신 러닝과 AI 기술을 활용하여 중요 뉴스를 선별하고 각각 단일 문장으로 요약한 정보를 제공한다. 앱을 열 때마다 개인화된 콘텐츠 목록-요약 세트와 속보를 볼 수 있다. 새로 고침 버튼을 누르면 새 목록을 수동으로 로드하고 기사의 전체 텍스트 요약 버전도 볼 수 있다.
이 매체 혁신 연구소(BHIVE)가[6] 완성한 AI 기반 요약 기술의 장점은 자연어 처리를 활용하여 전체 기사를 스캔하고 일반적인 키워드 및 의미 분석을 넘어서는 데 있다. 즉 뉴스가 다루는 진정한 맥락을 이해하고 소비하기 쉬운 한 문장으로 요약한 정보를 패키징 한다.
미디어의 미래 향하는 개인화 프로젝트
BBC R&D팀은 2017년 10월 기계 학습으로 시청자가 보고 싶어하는 내용을 파악하는 5개년 계획을 발표했다. 테크 기업, 대학 데이터 과학자 및 연구자들과 협력해 '보다 개인화 한 BBC'라는 목표를 담았다. 디지털 및 기존 방송 콘텐츠를 대상으로 이용자 데이터를 분석하고 알고리즘을 적용, 잠재 고객의 선호도 파악에 나선다.
해외 뉴스 미디어의 AI 접목 사례
- 자동화된 기사 작성 : AP, 가넷(Gannett), 워싱턴포스트 등이 실험하고 있다. 이를 지원하는 유나이티드 로봇(United Robots)은 2015년부터 완전히 자동화된 기사 생산 프로젝트를 실험하고 있다. 부동산 및 지역 스포츠와 같은 롱테일 콘텐츠에 유용하다. 관련 솔루션으로는 빠른 속도로 콘텐츠를 제작하고 자동 게시를 돕는 Jaspar, Sudowrite 등이 있다.
- 인공 음성 : 시리(Siri), 알렉사(Alexa)는 대표적이다. 주요 언론사들은 구독자 전용 팟캐스트를 제공하고 있다. 100% AI로 생성된 팟캐스트도 등장했다. 청취자는 주제를 제안하거나 향후 에피소드의 게스트와 호스트를 제안할 수도 있다.
- AI 생성 이미지 : 텍스트에서 간단하게 정적인 이미지를 수 초 만에 만들 수 있는 '달리(Dall-E)'가 있다.
- 자동화된 비디오 : 메타(Meta)는 텍스트 설명을 기반으로 짧은 동영상 클립을 생성하는 온라인 도구 메이크 비디오(Make Video)'를 발표했다. 기존에 선보였던 영상 자동 생성 도구로 어도비(Adobe), 무브리(Moovly), 위비치(Wibbitz), 카무아(Kamua), 티피토(Typito), 로케티움(Rocketium), 애니메이커(Animaker), 오페오(OFFEO), 메지스토(Magisto), 인비디오(InVideo) 등이 있다.
- 개인화 서비스
AI 한계 보완하는 기자 관여도 부각
<뉴욕타임스>는 2016년 구글 모회사인 알파벳 기술 인큐베이터 직소(Jigsaw)와 협력해 댓글 섹션 개선에 나섰다. 6년 전 기준 커뮤니티 데스크 소속 15명 안팎의 기자가 매일 약 11,000개의 댓글을 수동으로 검토하면서 고품질은 유지했지만 더 많은 댓글 참여와 공개 게시는 물리적으로 한계가 있었다.
2017년 이후 <뉴욕타임스>는 기계 학습 모듈인 '인식(Perspective)'으로 댓글의 유해성, 스팸성, 선정성 등을 분석, 점수화 했다. 이때 댓글 게시자의 신원이나 기사 내용을 검토하지는 않는다.
담당 기자들은 대화형 대시보드에 나타난 평가 점수, 잠재적으로 문제가 될 만한 문구, 기타 상황 정보를 종합적으로 검토하고 댓글 게시 여부를 결정했다. 이 시스템은 기계 학습과 기자들이 결합하는 것으로 댓글 검토 속도를 높였다. 그러나 예기치 않은 편향의 변수들을 걸러내야 하는 과제는 남아 있다.[7]
'뉴스 자동화: 알고리즘이 미디어를 다시 쓰는 방법'을 쓴 니콜라스 디아코풀로스(Nicholas Diakopoulos) 노스웨스턴대 컴퓨테이션 저널리즘 랩 교수는 "(2019년 기준) 현재 수준의 AI 기술은 기자 업무의 약 15%, 편집자 업무의 9%만 자동화할 수 있다"면서 "AI는 기자 업무를 대체하는 것이 아니라 '보완'하는 수준"이라고 평가했다. AI는 보고, 취재원과 협의 등 창조적인 기자 활동이 아니라 더 빠르고, 개선된 형태로 작업할 수 있도록 돕는 기능인 것이다.
지금까지 저널리즘 업계에서 AI 기술은 기사를 자동으로 생산하는 뉴스봇이 대표적이었다. 주식, 스포츠, 날씨 뉴스는 실시간으로 많은 정보를 생성하고 있다. 소셜미디어 오디언스와 대화하고 피드백을 받는 챗봇도 두드러진다. 또 콘텐츠의 A/B 테스트를 실험하고 독자의 반응을 파악한다. 머신 러닝과 데이터 마이닝 덕분이다.
탐사보도에서 특정 영역을 돋보이게 하고 개별 독자에게 개인화 서비스 기회를 만들어내는 등 뉴스 서비스 프로세스에도 변화가 있었다. 하지만 숙련된 기자가 담당하는 업무까지 대신하는 것은 아니다. 가령 속보 뉴스는 종종 편집자들의 정보 검증과 의사 결정에 더 많은 시간을 요구한다.[8]
특히 AI 기술은 구축 비용과 시간이 드는 만큼 현장 적용은 더딘 것이 사실이다. 이 때문에 나이트 재단, 런던 스쿨 등의 통계에서 보듯 상당수 해외 언론도 R&D 투자를 크게 늘려 새로운 기술을 실험하거나 새 플랫폼에 맞는 제품 출시보다는 기존 채널의 변경 및 최적화에 활용하는 것이 일반적이다.
국내 언론사, 경쟁적으로 로봇기자 도입
국내 언론사들도 6~7년 전부터 AI 접목하는 서비스를 내놓고 있다.[9] <매일경제>, <한국경제> 등 경제지를 중심으로 로봇 기자가 주식시장 속보, 부동산 실거래가 정보 등을 생산하는 채널들을 속속 공개했다. 2016년 1월 <파이낸스뉴스>는 서울대 이준환·서봉원 교수 연구팀과 협업으로 국내 언론사 가운데 최초로 경제 시황, 주요 종목 등의 기사를 자동으로 생산하는 로봇기자(IamFNBOT)를 도입했다.
종합일간지 가운데 <조선일보>는 지난해 11월부터 자사 해외 주식투자 채널인 '서학개미봇'에 스타트업 '웨이커'의 AI 기자 솔루션으로 기사를 자동 생산하고 있다.
이에 앞서 <연합뉴스>는 2017년 8월 영국 프리미어리그 경기 결과를 로봇 기자가 생산하는 '사커봇'에 이어 2020년 4월 엔씨소프트와 협력, 머신 러닝 기반 자연어처리(NLP) 기술을 적용한 날씨 기사 서비스를 선보였다.[10] 단순히 틀에 맞춰 숫자 등만 바꾸는 로봇 기사에서 어느 정도 문장의 짜임새를 갖추는 데까지 한 걸음 나아간 것이다.
<연합뉴스>는 2021년 3월 기사 뷰페이지 상단에 본문 내용을 3줄로 요약하는 '기사 본문 AI 3줄 요약'을 오픈했다. 독자가 '요약' 버튼을 누르면 주요 기사를 세 문단으로 정리한 별도의 창이 뜬다.[11] 지난해 3월에는 취재 부서에서 활용하는 솔루션 ‘AI 사진추천 시스템’ 을 구축했다.
방송사는 AI 앵커로 주목도를 높이는 실험이 이어졌다. MBN은 김주하 AI 앵커(2020년 4월), YTN은 변상욱 AI 앵커(2021년 4월)를 등장시켰다.
국내 주요 언론사 AI 활용 사례 목록
- 2016년 1월 <파이낸셜뉴스> IamFNBOT : 서울대 이준환 언론정보학과/서봉원 융합과학기술대학원 공동 개발
- 2016년 2월 <아시아경제> 아경봇 기자 r2 : 자체 개발
- 2016년 5월 <전자신문> 엣봇 : 씽크풀과 협업
- 2016년 9월 <헤럴드경제> HeRo·Herald Robot(영어 로봇 기사)
- 2017년 2월 <연합뉴스> 지진 속보 제공
- 2017년 3월 <조선비즈> c-biz봇 : 증권플러스(두나무) 개발
- 2017년 5월 SBS NARe : 19대 대선 투개표 뉴스 : 서울대 이준환, 서봉원 교수팀 협업
- 2017년 8월 <연합뉴스> 사커봇
- 2017년 12월 <서울경제> 서경뉴스봇 : 자체 개발 추정. 이후 아파트 실거래가 뉴스봇 개발
- 2018년 4월 <국민일보> 웨더봇 : 자체개발
- 2018년 5월 <한국경제> 한경로보 : 씽크풀과 협업
- 2018년 6월 <매일경제> 아이넷 로봇 : 씽크풀과 협업
- 2020년 4월 MBN 김주하 AI 앵커
- 2021년 3월 <연합뉴스> 3줄 요약 서비스 : 자체 개발
- 2021년 4월 YTN 변상욱 AI 앵커
- 2021년 9월 <부산일보> 개인맞춤형 뉴스 추천 서비스 : 구글GNI 기금(2019)
- 2021년 11월 <조선일보> 서학개미봇 : 스타트업 웨이커와 협업
하지만 AI 기반의 개인화 서비스는 지지부진하다. <부산일보>는 작년 9월 로그인 기반이 아닌 'HTTP 기반'의 개인 맞춤형 뉴스 추천 서비스 '나를 위한 뉴스'를 시작했다.[12]
2021년 8월 로그인월을 시행하고 올해 유료화에 나선 <중앙일보>는 이용자 이용 행태 데이터를 들여다보는 정도이다. <중앙일보>의 한 관계자는 "AI 기술을 본격적으로 수용하는 단계는 아니고 머신 러닝 기반 추천 서비스를 고려하는 정도에 있다"고 말했다. 이러는 사이 디지털 뉴스 생태계는 AI가 더욱 확산되고 있다. 포털사이트 카카오(다음), 네이버는 각각 루빅스(2015년), 에어스(2017년) 등 뉴스 추천 및 편집에 AI를 강화했다.
언론사 안팎에서 AI를 활발히 다루고 있음에도 갈 길은 멀다는 것이 공통된 지적이다. AI 시스템에 제공되는 데이터도 잘 챙겨야 한다. 규모와 품질은 그 어느 때보다 중요하다. 이 시스템은 정확한 입력 없이는 정확한 출력을 얻을 수 없기 때문이다. 또한 전문적인 인력과 일관된 예산 투입이 중요하다. 높은 개발 비용과 인건비를 고려하면 언론사 간 양극화도 피할 수 없다.
국내에서도 구글의 디지털 뉴스 혁신 기금을 지원받는 곳이 나오고 있다. 전 세계 언론사들이 빅테크 기업과 협업하는 것에 비하면 아직은 그 횟수나 열성에서 뒤진다. 이제 저널리즘 세계의 새로운 플레이어는 컴퓨터 엔지니어, 언어학자, 데이터 과학자이다. 여력이 없다면 IT 기업과 기술 솔루션을 논의하는 자리를 마다해선 안 된다. 일회성으로 끝나서도 안 된다.
특히 앞으로는 독자들의 AI 권리도 중요하다. 독자들은 자신의 데이터를 AI가 분석하고 패턴을 식별하고 결과를 보고하는 과정에서 언론사가 어떻게 사용했는지 투명하게 알아야 한다. AI 쓰임새는 결국 그 의도가 바르게 움직여야 한다. 언론사 내부에 특별한 AI 리더십을 요청하는 배경이다.
구글이 소개하는 AI 저널리즘
AI는 지능적인 인간의 행동을 모방하도록 학습된 모든 종류의 컴퓨터 시스템이다. AI가 세상 사람들을 놀라게 한 사건은 알파고가 프로기사와 바둑 대국에 나선 일이다. 이렇게 사람이 할 수 있는 게임은 물론이고 주식 시장이나 MRI 분석, 외국어 번역 등으로 활용 반경이 커지고 있다. 출퇴근길 네비게이션으로 최적의 길을 안내받는 것도 AI의 도움이다.
스마트폰에 저장된 사진은 '이미지 인식 시스템'으로 새로운 앨범을 쉽게 구성할 수 있다. 각각의 이미지에 들어있는 식별가능한 특징들을 찾아내고 레이블을 지정할 있도록 돕는다. 선정적이거나 잔혹한 영상과 이미지 노출을 차단할 수 있다.
AI가 인간의 말을 이해할 수 있도록 돕는 기술인 음성인식(Speech recognition)은 번역 도구와 음성 인식 스마트 스피커의 근간을 이룬다. 자연어 처리를 통해 복잡한 발화 방식과 다양한 뉘앙스의 차이를 파악할 수 있도록 진화하고 있다. 인간과 대화하듯 상호작용하는 가상의 비서((Virtual assistants)는 영화를 넘어 현실이 되고 있다.
인류 공동체의 현재와 미래에 솔루션을 제공하기도 한다. 광범위한 기후 데이터를 수집한 AI가 그렇다. 홍수, 가뭄, 빙하의 해빙, 해수면 상승, 태풍의 경로 등에 대비하는 정보처럼 생태계의 변화를 둘러싼 중요한 의미를 찾아낼 수 있다. 정보가 충분히 주어진다면 AI는 자연 재해 예측이나 투자 관리까지 모든 영역에서 의사결정이 가능한 정보를 제시할 수 있다.
물론 AI가 최적의 솔루션을 생성할 수 있도록 하려면 양과 질을 담보한 디지털 정보 즉, 데이터셋에 달려있다. 데이터셋은 컴퓨터에게 교과서와 같다. 학습과정의 기반이 되는 만큼 데이터셋 구축과 수정에 심혈을 기울여야 한다.
현재 AI는 머신러닝 기술의 도입으로 커다란 진전을 보였다. 두 개의 AI 시스템을 뜻하는 생성적 적대 신경망(GAN)이 대표적이다. 하나의 시스템보다 더 효율적으로 콘텐츠를 만들거나 작업을 처리할 수 있다. 양자 컴퓨터에서 구동하는 AI 시스템의 연산능력은 더 탁월할 것이다.
AI는 다양한 정보의 패턴을 제공되는 정보를 기준으로 훈련하고 인식한다. 인간이 경험과 지식으로 이해하는 것과 다르다. AI 시스템의 계산 방식이 복잡해질수록 사람들은 이해하기 어려울수 있다. 사회적 책임을 생각하는 기업은 AI 윤리를 점검한다.
개발자나 관리자들은 데이터 관리에 항상 주의를 기울여야 한다. AI가 편향에 빠질 수 있기 때문이다. 시스템이 보다 안정적인 결과를 도출할 수 있도록 훈련과 테스트 또는 조정을 수행하는 사람인 HITL(Human-in-the-loop)의 역할도 중요하다. 구글은 "AI 시스템이 우리 각자를 고유하게 만드는 사회적 뉘앙스와 맥락, 관계에 대해 더 깊게 이해하도록 돕는 역할을 할 수 있다"고 강조했다.
AI를 기반으로 이미지, 음성, 음악 및 동영상을 합성하는 극도로 사실적인 '딥페이크' 기술이 사회 문제가 되고 있다. 부적절하게 사용할수록 허위조작정보를 양산해 여론질서를 오염시키기도 한다. 언론의 AI 활용 방향성에 저널리즘 원칙의 강화가 빠지지 않는 이유이기도 하다.
-
1
최근 들어 AI 기반 서비스에 저널리즘 책임성을 강조하는 분위기가 형성되고 있다.
-
2
런던스쿨에서 공개한 자료 가운데 몇 가지 사례를 정리했다.
-
3
AI의 하위 그룹인 머신 러닝 즉, 기계 학습은 데이터의 수학적 모델을 사용하는 프로세스로서 직접 명령 없이 컴퓨터가 학습하도록 지원한다. 기계 학습은 알고리즘을 사용하여 데이터 안에 패턴을 식별하고, 이러한 패턴을 사용하여 예측할 수 있는 데이터 모델이다.
-
4
NYT는 2018년 초부터 특정 기사가 불러일으키는 감정을 기반으로 하는 광고 배치를 시범 운영했다. 1년 뒤 50개 광고, 3천만 이상의 노출로 매출에 기여했다. 이는 광고 프로젝트로 뉴스룸과는 조율없이 이뤄졌다. 취재물이나 기타 편집 결정에 영향을 미치지 않았다.
-
5
이 과정에는 로지스틱 회귀분석이 쓰였다. 각 감정과 긍정적으로 관련된 몇 가지 상위 단어를 뽑아낸다. 가령 웹 사이트 방문자가 장바구니에서 결제 버튼을 클릭할지 여부를 추측한다고 가정할 때, 웹 사이트에서 보낸 시간 및 카트에 있는 항목 수와 같은 과거의 방문자 행동을 살펴본다. 그런 다음 과거에 방문자가 사이트에서 5분 이상 시간을 보내고 카트에 3개 이상의 항목을 추가한 경우 결제 버튼을 클릭했다고 판단한다. 이 정보를 사용하여 새 웹 사이트 방문자의 행동을 예측할 수 있다.
-
6
2017년 신설된 BHIVE는 디자이너, 엔지니어, 제품 개발자 및 연구원으로 구성된 이용자 연구 및 프로토타이핑 그룹이다. 신제품 모색과 새로운 아이디어를 테스트하여 이용자 경험 향상을 전개한다. 불레틴 앱은 BHIVE가 이용자 대상의 뉴스 소비 습관 설문조사를 토대로 만든 최초의 프로토타입 중 하나다. 이 앱의 서비스 과정은 첫째, 전 세계 2,700여명의 기자와 분석가들이 생산하는 콘텐츠를 마이닝하고 둘째, 가장 중요한 세부 정보를 추출하고 셋째, 전체 이야기를 단일 스냅샷으로 전달한다.
-
7
<뉴욕타임스>는 자체 검증을 거듭하면서 세 가지 원칙을 정리했다. 첫째, 머신 러닝 시스템을 맹목적으로 신뢰해선 안 된다. 둘재, 머신 러닝 시스템을 사용하는 기자들이 중요하다. 셋째, 머신 러닝 시스템에 대한 지속적인 평가, 감독이 필요하다.
-
8
AI 등장 이후 기존 기자를 대체할 수 있는가의 질문은 어느 정도 결론이 났다.
-
9
김태균 외(2019), AI시대의 저널리즘: 로봇기자와의 고군분투 실무체험기
-
10
<연합뉴스>는 당시 종전의 날씨 기사 작성 시간을 30분에서 최소 5분으로 줄였다고 밝힌 바 있다. 2021년 이 매체 콘텐츠 인큐베이팅팀은 'AI 지역별 날씨 기사 서비스'를 추가했다.
-
11
포털사이트 줌인터넷과 공동 개발한 요약 서비스는 약 1년여 자연어 처리(NLP) 분야 중 하나인 문서 요약(text summarization)에 초점을 맞췄다.
-
12
이용자가 어떤 기사를 주로 읽었는지를 중심으로 분석해 이용자의 관심 뉴스를 헤드라인과 주요 뉴스 영역에 노출한다. 자주 방문하지 않는 이용자도 몇 건의 기사를 보면 AI가 취향을 분석해 추천한다.