인간과 로봇의 협업은 현실이다

News

2022년 12월 06일

인공지능 도입 부작용 경계하지만
생산 및 유통 효율성과 비즈니스 기여
선택이 아닌 필수가 된 인공지능

Share on Twitter Share on Facebook Share on LinkedIn Share by email

새로운 기술과 솔루션으로 미디어 산업의 변화가 가파르다. 상품 개발과 혁신이 맞물리면서 기존의 것과 새로운 것이 공존하고 있다. 올해 세계 주요 언론사는 팟캐스트와 뉴스레터로 혁신을 이어가며 틱톡 등 비디오 플랫폼에 힘을 쏟고 있다.

이런 흐름에서 인공지능(AI)은 미디어 산업의 미래를 정의할 유력한 기술로 부상했다. 인공지능은 현재 뉴스룸에서 어떻게, 무엇을 위해 사용되고 있는가? 많은 언론사들은 이미 이용자 행동을 예측하고, 지루한 반복 작업을 자동화 하는데 쓰고 있다. 이 덕분에 기자들은 고품질 콘텐츠에 몰두할 수 있도록 여유를 갖게 된다.

세계신문협회(WAN-IFRA) ‘뉴스 미디어의 혁신 세계 보고서 2022-23’에 따르면 오늘날 뉴스룸 혁신에서 인공지능의 밝기는 그 어떤 것보다 눈부셨다.

대다수 언론사 리더, 인공지능 주목

올해 초 세계신문협회(WAN-IFRA)가 펴낸 보고서에 따르면 약 75%의 뉴스 미디어 기업이 향후 3년 안에 인공지능이 비즈니스에 중대한 역할을 할 것이라고 답했다. 또 다른 조사는 라틴 아메리카, 중앙 및 동유럽 20개국의 여러 뉴스룸에서 다양한 수준의 인공지능을 활용하고 있었다. 즉, 인공지능 활용은 언론사의 규모나 자본력과 비례하지 않았다.

다만 언론계 현장에서 인공지능 적용은 초기 단계이다. 가장 큰 원인으로 인공지능에 대한 두려움을 꼽을 수 있다. "인공지능이 기자들의 역할을 축소할 것이다", "로봇이 뉴스를 양산하는 시대가 올 것이다" 등 부정적인 메시지가 전 세계 언론사들을 여러 차례 휩쓸었기 때문이다. 물론 그럴 가능성도 있지만 아직은 먼 미래다.

로이터 연구소에서 52개국 246명의 언론계 리더들을 대상으로 조사한 보고서에 따르면 인공지능은 이미 현실이다. 많은 뉴스룸에서 수집, 생산, 유통 등 현대 뉴스의 모든 단계에서 인공지능을 적용하고 있다. 머신러닝, 딥러닝, NLP(natural language processing)[1], NLG(natural language generation)[2] 등 향상된 기술도 이미 사용하고 있다.

뉴스 리더 대다수는 인공지능의 잠재력을 높게 샀다. 응답자의 절대 다수(85%)는 개인화 및 콘텐츠 추천에서 인공지능이 결정적일 것으로 봤다. 또 81%는 "인공지능이 콘텐츠 태깅, 초벌 보조(assisted subbing), 인터뷰 전사(轉寫) 등 자동화 및 속도 증가에 중요하다"고 응답했다. 이외에도 다수의 리더들은 데이터를 통한 스토리 발굴, 구독 가능성이 큰 이용자 탐색 및 타겟팅에 인공지능의 쓰임새를 높게 평가했다.

뉴스 생산 기여부터 반복 작업 대체 활발

몇몇 언론사들은 지난해 뉴스 생산과 유통에 인공지능을 적극적으로 활용했다. <보스톤 글로브(The Boston Globe)>는 지난해 핀포인트(Pinpoint, 대규모 분산 시스템 추적 플랫폼)와 구글 AI 도구를 활용, 예방 가능한 교통사고를 조사한 ‘블라인드 스팟(Blind Spot)’으로 탐사보도 부문(investigative journalism) 퓰리처 상을 수상했다.

또 <스카이 뉴스(Sky News)>는 인공지능으로 PDF나 접근이 불가능했던 포맷의 자료들에서 공중 위생 데이터를 추출해 웹페이지나 TV 그래픽에 활용했다.

<워싱턴포스트>는 아마존 ‘폴리(Polly)’를 이용해 합성 음성 오디오 버전의 적용을 모든 콘텐츠 제품으로 확장했다. 텍스트를 음성으로 변환(text-to-voice)하는 기능을 개선해 더 자연스러운 음성 생성도 전개했다.

가장 활발한 것은 뉴스룸 작업의 반복과정을 대체하는 프로젝트다. 일부 언론사는 이미 인공지능 기반의 전사 기술을 도입했다. 미국 텍사스 지역 케이블방송사 KSAT-TV는 트린트(Trint)로 팬데믹 기간 공공회의 녹음 파일을 자동으로 텍스트화 했다. 또 오리건 주 공영 방송도 인공지능 전사를 적용했다.[3] 이 결과 내부 인력은 다른 뉴스 수집에 집중할 수 있었다.

정교한 구독자 전환 예측 도구로 진화

노르웨이에서 두 번째로 큰 미디어 기업인 아미디아(Amedia)는 소비자 행동 특성 파악을 인공지능에 맡겼다. 70가지 독자 행동 통계 데이터를 학습시켜 독자 충성도 예측 지표를 만들었다. 참여 지수(engagement index)로 불리는 매트릭스는 뉴스 제작자 통제 아래 있는 콘텐츠 제품이 독자 충성도에 미치는 영향력에 초점을 맞췄다.

캐나다 <글로브 앤 메일(Globe and Mail)>은 페이월에 인공지능을 적용했다. 이용자에게 페이월을 보여준 뒤 결제가 이뤄지지 않으면 전략을 바꿔 이메일 등록을 권하는 형식이다. 광고 수익과 구독 수익 간 가능성을 저울질할 수 있도록 설계한 능동적인 페이월이다.[4]

프랑스 최대 신문사 퀘스트프랑스(Quest-France)와 트와이프(Twipe) 그리고 실랍스(Syllabs)는 협력 연구로 예측 점수(predictive score) 기반 내부 검색엔진을 개발했다. 3천만 개가 넘는 기사를 활용해 페이지뷰를 만들어낼 가능성을 판별하는 도구로 아카이빙 된 콘텐츠의 '수익화 예측 점수'를 예측한다. 페이지뷰, 참여도, 구독 등 세 가지 관점으로 각각 알고리즘을 개발한다.[5]

벨기에 <미디어후이스(Mediahuis)>는 데이터 기반으로 자동화된 구독자 전략을 추진하고 있다. 머신러닝을 활용해 '이탈률 경향성' 예측 모델을 개발했다. 예측모델은 이탈과 유지, 설득 가능성이 공존하는 이용자 그리고 구독 유지 가능성이 높은 이용자를 판별한다. 신규 이용자의 구독 가능성과 구독 서비스 종류를 예측하는 구매 경향 모델도 개발했다.

도로 단위 지역 이슈 자동 생산까지

인공지능은 뉴스 수집과 작업 공정 관리를 넘어 스토리 생산 단계로 나아가고 있다. NLG 기반 콘텐츠가 대표적이다. 최근 2~3년 내 전무했던 NLG 기반 기사 점유율이 7%에 도달했다. 독자가 인지하지 못했더라도 한번쯤 NLG 기반 기사를 읽었을 수 있다는 얘기다.

<월스트리트저널>은 내러티바(Narrativa)와 파트너십을 맺고 인공지능 내러티브를 생산하고 있다. 인공지능 가브리엘레(Gabriele)는 미국과 유럽 그리고 아시아의 경제시장 상황에 대한 정보, 소비자 가격 지수(CPI)와 생산자 가격 지수(PPI)를 생산한다. 생산된 정보들은 월스트리트저널 전문가들이 분석해 그 영향을 파악한다.

BBC는 2019년 진행한 실험을 2022년 지역선거로 확장했다. 선거 상황에 따라 변동하는 숫자에 맞춰 수백 페이지의 기사들을 인공지능으로 자동 작성, 재구성하는 실험이다. 인공지능이 생산한 기사들은 BBC의 스타일에 맞춰 작성된다. BBC는 이번 실험이 성공적일 경우 보건부터 스포츠, 비즈니스까지 다양한 영역의 공공 데이터를 활용할 수 있는 시스템을 갖출 계획이다.

인공지능의 자동 뉴스생산 능력은 지역언론에서 그 가치가 커진다. 스웨덴 고타 미디어(Gota Media)는 스포츠, 부동산, 교통 등 지속적 업데이트가 필요한 지역 정보들을 자동 생산하고 있다.

비영리 커뮤니티 프로젝트 크로스타운(Crosstown)[6] 인공지능을 활용해 지역 소식을 커버한다. 인공지능으로 공공 데이터셋을 수집 및 저장한 뒤, 사람이 데이터셋을 내러티브로 만든다. 범죄, 교통, 대기질, 코로나 등 관련 데이터에 지역정보를 태깅해 동네(neighborhood) 뉴스로 탈바꿈시킨 것이다. 비슷한 사례로 LA의 범죄 데이터베이스는 도로 단위로 세분화돼 지역주민들에게 실질적 범죄 발생 정보를 알려줄 수 있다.

개인화 서비스 풀 수 있는 열쇠

대형 미디어 기업이 직면하는 가장 큰 과제는 천차만별인 독자의 니즈를 단일화된 웹사이트 및 앱으로 만족시켜야 한다는 점이다. 인공지능은 뉴스룸 어젠다를 유지하면서 독자 경험을 개인화 하는 데 용이하다. 예를 들면 롱폼, 숏폼, 요약, 이미지 및 비디오 등 여러 형태의 콘텐츠를 훨씬 효율적으로 제공할 수 있다.

한 연구에 따르면 독자들은 뉴스 기사에 글 머리표(bullet-points) 사용 증가, 텍스트 위에 덧붙여지는 시각적 스토리 그리고 소셜미디어 게시물처럼 혼합된 미디어 형태를 선호한다. 뉴스룸의 인공지능 기술도 독자 선호를 따라가고 있다. 예시로 BBC 최신 모두스(Modus) 프로토타입은 NLP를 활용, 글 머리표 주도 스토리와 사진 갤러리 이미지에 자동화 캡션을 적용한다[7].

기술이 직면하는 또 다른 장벽은 언어다. 현존하는 NLP 모델은 ‘영어’에 집중돼 있다. 아랍어, 스페인어 등 영어 외 언어들로 인공지능을 활용하려면 추가 작업이 필요하다. 지역언론과 학계의 협업은 하나의 해답이 될 수 있다. 아르헨티나의 라 나시온(La Nacion), 튀지니의 인키파다(Inkyfada)는 학계와 협력 프로그램으로 자체 모델을 개선했다.[8]

그러나 AP 보고서에 따르면 소규모 뉴스룸은 인공지능 확대에 현실적인 어려움을 호소한다. 빈번한 이직, 업무 과부하, 비용 등 부담이 크다. 전문가들은 그 해결책으로 뉴스룸에 적용가능한 일련의 기술들을 하나로 통합해 개발한 '올인원 통합 솔루션' 을 제시한다. 기술 선택과 도입이 어려운 뉴스룸들에게 합리적인 가격과 기능을 제공할 수 있기 때문이다.

딥러닝으로 잡지 커버 이미지 제작

인공지능의 다음 단계는 이미지와 비디오다. 2021년 OpenAI에서 발표한 DALL-E는 텍스트를 오리지널 이미지로 만들어준다. 스토리에 담길 간단한 삽화를 넘어 완전히 새로운 형태의 반자동화된 시각(visual) 저널리즘을 예고한다.

특히 딥러닝 모델인 생성모델(foundation model)은 상상 그 이상의 이미지를 제시한다. 현재 생성모델은 딥러닝 최신 기술로 인공지능 영역을 지배하고 있다. 딥러닝은 기본적으로 인간 뇌의 뉴런들처럼 수백에서 수억 개의 텍스트, 이미지 그리고 사운드 클립 예제를 통해 학습한다.

  • <이코노미스트(The Economist)>

<이코노미스트>는 6월 인공지능을 활용해 잡지 커버를 디자인하는 실험과 관련한 보고서를 공개했다. 기존 잡지 커버는 인간 디자이너의 브리핑-> 아이디어 공유-> 러프 스케치-> 아트 워크라는 과정을 거친다. 생성모델은 리드 기사의 제목과 조건 필터링을 거쳐 이미지를 얻어낸다.

즉, 인간과 유사한 학습 과정을 거쳐 언어, 프로그래밍, 일러스트레이션에서 상징적 의미를 파악하고 창의적 방식으로 다룬다. <이코노미스트>는 인공지능이 제시한 여러 이미지 중 하나를 선택해 커버로 사용했다.

  • <코스모폴리탄(Cosmopolitan)>

한 주 뒤 패션 잡지 <코스모폴리탄>도 OpenAI의 DALL-E 2를 활용한 첫 커버 디자인 작업을 공개했다. DALL-E 2는 텍스트 기반으로 이미지를 생성해 내는 인공지능 DALL-E의 개선 버전이다. 단어 기반 요청을 받은 DALL-E는 인간들이 만들어 둔 수백만 장의 이미지 히스토리를 탐색해 픽셀 단위로 제작된 자체 이미지 즉, 오리지널 이미지를 만들어낸다.[9]

DALL-E는 인간 뇌의 작동 방식을 흉내 낸 신경망 알고리즘을 사용한다. 사물이 무엇인지, 서로 어떤 관계들을 보유하는지 인간이 이미지에 기록한 캡션을 보고 분석해 학습한다. 핵심은 사물 간 ‘관계’를 파악해 예리하고 맥락적으로 생성한다는 것이다. 다만, 코스모폴리탄의 사례처럼 원하는 이미지를 얻기 위해선 여러 번의 시도와 구체적 설명을 담은 긴 프롬프트가 필요하다.

오픈 소스 등 실행 방법 찾을 때

인공지능은 이제 더 이상 미래의 기술이 아니다. 뉴스룸마다 방식과 규모가 다를 뿐 널리 활용되고 있다. 인공지능이 뉴스룸에게 중요한 이유는 단순히 기술적 진보에 있지 않다. 사람을 도와 더 나은 저널리즘을 만드는 도구라는 점에 있다. 자동화와 구독자 예측 등 비즈니스 개선으로 뉴스 생산자와 이용자 모두에게 혜택을 준다.

물론 기술기업이 아닌 미디어가 기술 진보를 따라가긴 어렵다. 하지만 기술의 진보는 보편화도 가져온다. 여러 조사에서 중소 규모 뉴스룸까지 인공지능에 관심을 갖고 이용할 수 있는 이유가 여기에 있다. 막연한 두려움은 접어두고 기술 탐색과 사례 조사로 적합한 기술 스택을 찾아가야 한다.

기술 기업 혹은 선도적 미디어 기업에서 제작한 '올인원 솔루션'도 해답이 될 수 있다. 이미 쇼핑몰, 검색엔진, 콘텐츠 플랫폼에서 오랜 기간 활용해 온 콘텐츠 추천부터 비교적 새로운 기사 생성까지 활용의 난이도와 범위가 다양하다. 중소 뉴스룸과 후발 주자들은 앞선 사업자들이 밟은 단계를 하나씩 따라가면 된다.

대형 테크 기업이 훌륭한 도구로 다양한 콘텐츠를 창출하는 생성모델의 사례도 이를 단편적으로 보여준다. 지금 언론사에 필요한 것은 실행 가능한 작은 것부터 도전하는 용기다.

  1. 1

    NLP(natural language processing): 인공지능의 한 분야로 컴퓨터가 인간의 언어, 즉 자연어를 이해, 생성, 조작할 수 있도록 하는 기술이다. 텍스트와 음성으로 자연어를 입력하여 다양한 분석 및 서비스를 구현한다. 대표적인 예시로 음성 자동 번역, 문서 요약, 스팸 메일 필터링, 감정분석, 문법 및 철자 검사 등이 있다.

  2. 2

    NLG(natural language generation): NLP가 입력 받은 자연어의 처리를 의미한다면 NLG는 자연어를 생성하는 기술이다. 자연어를 듣고 이해하는 영역에서 더 나아가 단어들을 조합해 맥락에 맞고 사람이 쉽게 이해할 수 있는 자연어 문장을 만들어 낸다. 대표적인 예시로는 인공지능 스피커, 비서 등이 있다.

  3. 3

    현재 일부 언론사는 단순 '전사'를 넘어 뉴스로 가치가 있는 토픽을 자동으로 발견해 알려주는 기능 등으로 발전시키고 있다.

  4. 4

    NLP를 활용해 페이월 밖 노출시킬 스토리를 선정하고 99%의 디지털 콘텐츠 배치를 결정한다. 인공지능 페이월 적용 후 구독이 51% 증가해 올 4월 17만 명의 디지털 전용 구독자를 확보했다. 인공지능 솔루션은 외부 미디어 기업에 판매해 부가가치를 창출하고 있다.

  5. 5

    검색엔진은 신문사의 아카이브 콘텐츠 재조명, 재출판 그리고 수익화에 기여하는 것을 목표로 한다. 현재는 페이지뷰 관점의 검색엔진만 완성한 상태이다.

  6. 6

    가장 중요한 가치는 사람의 한계, 반복작업과 노동력 한계를 인공지능으로 극복한 데 있다. 데이터를 수집하고 분석하는 과정을 인공지능이 맡고, 편집팀은 거주민들에게 초국소적 단위로 정보를 전달할 수 있다.

  7. 7

    새로운 기능들로 '모두스'는 <워싱턴포스트> 아크(Arc), BBC 옵티모(Optimo)처럼 차세대 모듈식 콘텐츠 관리 시스템으로 평가받고 있다. 모듈식 콘텐츠 관리는 콘텐츠 제작을 하나의 스토리가 아닌 여러 개의 모듈화된 블록을 기반으로 처리해 여러 콘텐츠 간의 연결성과 재활용성을 향상시킨다.

  8. 8

    LSE의 폴리스(Polis), INMA의 인공지능 웨비나와 쇼케이스 등 협력 프로그램들은 언어장벽 극복의 계기를 마련하는 프로그램들이다.

  9. 9

    DALL-E 관계자는 아이들에게 플래시 카드를 보여주는 것과 같은 학습방법이라고 설명한다. 만약 DALL-E에게 ‘오토바이를 탄 코알라’를 전달하면 코알라 캡션이 달린 이미지로 학습된 코알라의 모습, 오토바이를 무언가가 탄다라는 개념에 맞춰 이미지를 조합하여 그려낸다. 또 '코스모폴리탄 잡지 커버에 등장한 다스베이더'로 입력하면 단순히 다스베이더의 이미지를 복사하는 게 아니라, 가운을 입히고 핫핑크 립스틱을 쥐어준 이미지를 제시한다.