언론사, '인공지능 R&D' 나설 때다

News

2023년 03월 30일

생성 AI, 불과 3개월 만에 지식 정보 생태계 재편 주도
BBC 등 세계 방송사는 영상제작, 업무 프로세스에 접목
책임성, 법제화 별개로 뉴스룸 혁신 인프라로 접근 필요

Share on Twitter Share on Facebook Share on LinkedIn Share by email

지식 정보 생태계를 가르는 키워드는 단연 챗GPT다. 불과 출시 4개월여 만에 미디어 산업과 기술 분야를 생성 AI(Generative AI) 모델이 몰아치는 양상이다. 지난해 가트너(Gartner)는 2022년부터 2030년까지 생성 AI 시장 규모를 1,108억 달러로 추산했다. 2021년 79억 달러 시장에서 큰 폭의 성장을 내다본 것이다.

생성 AI가 그리는 미래를 '창조적인 신세계'로 띄우는 드라마틱한 예상도 쏟아진다. "생성 AI로 생성되는 대기업의 아웃바운드 마케팅 메시지는 2022년 2% 미만에서 2025년 30%로 증가할 것이다. 2030년 주요 블록버스터 영화의 90%는 텍스트-비디오 생성 AI로 제작될 것이다. 현재 1% 미만인 생성 AI 기반 정보 규모는 2025년까지 모든 데이터의 10%를 차지할 것이다. 또 2026년까지 새로운 웹사이트 및 모바일 앱을 위한 디자인 프로세스의 60%가 생성 디자인 AI에 의해 자동화될 것이다" 등이다.

사실 시장 침체와 기술주 하락, 구조조정 등에도 불구하고 생성 AI 기술 기업은 투자자들의 환대를 사고 있다. 이미 이미지 생성 AI '스테이블 디퓨전'을 개발한 스타트업 스태빌리티AI(Stability AI)와 글쓰기 생성 AI를 개발한 재스퍼(Jasper) 등의 관련 스타트업은 각각 1억 달러 이상의 자금을 유치했다. 주요 펀드 운용사들은 생성 AI 분야가 수조 달러의 경제적 가치를 창출할 것으로 기대하고 있다.

스타트업 생태계를 조사하는 딜룸에 따르면 세계 곳곳에 설립된 생성 AI 스타트업은 텍스트, 음악, 이미지, 코드, 게임, 동영상, 챗봇, 합성 데이터 등 20여개 분야 총 250여개로 집계됐다. 단기간에 관련 기업이 폭증한 것이다.콘텐츠(art)에 생성 AI와 블록체인을 결합하는 하이브리드 형식도 예고되지만 불과 1~2년 전 광풍을 일으킨 메타버스를 밀어내며 시장을 이끄는 기업군이 되고 있다.

낫싱, 포에버 화면
NBC, <낫싱, 포에버> 애니메이션 방송 프로그램 화면 캡처

BBC, 아카이브에서 AI가 편집한 프로그램 내놓아

다른 산업군과 비슷하게 언론사도 초기 단계이지만 생성 AI의 흐름에 젖어들고 있다. 이미 다양한 뉴스룸은 AI 기반의 콘텐츠 생산 경험을 축적해 왔다. 가장 확실하게 자리잡는 것은 업무 프로세스 자동화 영역이다. 특히 아카이브를 배경으로 가치를 끌어올리거나 생산 과정에 효율성을 확보하는 쪽에서 각광받고 있다.

대표적인 곳은 영국 BBC다. 6년 전 BBC R&D팀은 AI 기술을 사용하여 미디어 제작을 더 저렴하고 더 많이 만들어 BBC 보도 범위와 규모를 늘릴 수 있는 기회를 찾는 'AI 프로덕션 프로젝트'를 시작했다. 에딘버러 페스티벌(Edinburgh Fringe Festival)의 무대에 초고화질 카메라를 설치하고 자동화된 편집 영상 패키지를 테스트 했다. 더 적합한 메타데이터를 만들 수 있고, 검색 가능성을 높일 수 있도록 자동화된 메타데이터 생성-COMA 프로젝트도 전개했다. 콘텐츠 품질 제고와 생산방식 효율성을 위해서다.

AI는 BBC 4(Four) 채널이 과거에 방송한 프로그램과 그 속성을 조사하여 설명과 주제(음악, 역사, 과학 등)를 분석했다. 컴퓨터는 아카이브에서 디지털 형식으로 제공되는 270,000개 이상의 프로그램을 샅샅이 뒤져 채널의 정체성에 부합하는 가장 관련성이 높은 사실적 프로그램 상위 150개의 순위를 매겼다. 그런 다음 채널 스케줄러는 목록을 사용하여 특정일에 방송할 항목을 선택했다.

그 다음 사람들이 하는 것처럼 훌륭하게 맞아 떨어지는 비디오를 선택하고 편집하는 과정에 적용했다. 150개 프로그램을 짧게 잘라 15,000개 이상으로 나누고 다시 연결했다. 물체 및 장면 인식, 자막 분석, 시각적 역동성 등을 인식하는 기술을 사용해 학습한 내용으로 새로운 콘텐츠를 만들었다. 프로그램의 비디오 편집은 사실상 AI가 만든 것과 같고, 모든 클립의 선택과 거의 모든 편집은 최소한의 인간 개입으로 이뤄졌다.

NBC, 생성 AI가 24시간 애니메이션 영상 서비스

이렇게 업무 자동화와 재가공의 측면에서 고안되던 인공지능은 이제 전혀 다른 국면을 맞고 있다. 미국 NBC 방송의 유명 시트콤 <사인펠드(Seinfeld)>를 패러디 한 라이브스트림 <낫싱, 포에버(Nothing, Forever)>는 대표적이다. 지난해 12월 트위치에서 스트리밍 중인 <낫싱, 포에버>는 24시간 방영되는 애니메이션 영상으로 모두 AI가 생성한다. 다소 거친 그래픽으로 처리된 영상이지만 동시 시청자 수가 만 명을 훌쩍 넘을 정도로 인기를 끌고 있다.

대화 텍스트는 GPT-3, 음성은 언어, 시각 정보 등에 적용하는 클라우드 기반 AI(인공 지능) 서비스인 마이크로소프트의 '아주르 인식 서비스(Azure Cognitive Services)'에서 생성한다. 미리 녹음한 관객의 웃음소리만 빼면 카메라 컷과 캐릭터 움직임을 모두 자동으로 만든다. 이 애니메이션 영상 제작사 미스매치 미디어(Mismatch Media)는 "생성용 알고리즘의 통합 체계를 부르는 디렉터(director)는 개별 조각들을 하나의 콘텐츠로 묶는다"고 말했다.

이 생성 AI는 관련 콘텐츠를 빠른 속도로 생산하고 배포하면서 입소문을 퍼뜨리고 있다. 여기에 사용자가 범용화 하는 생성 AI를 활용해 패러디물을 내놓는 등 다양한 참여로 효과를 내고 있다.

생성 AI가 제작한 이 프로그램에 대해 "영혼 없는 웅얼거림"이란 혹평도 나왔지만 "끝없는 웃음 트랙이 있다"는 호평도 이끌어냈다. '자막 기능' 자동화에 불과했던 인공지능의 방송 시장 활용이 이제 본격화 하고 있는 것 만큼은 분명해 보인다. 원작의 후광 효과도 거들지만 기대 이상의 성과를 거둔 NBC는 생성 AI 모델 실험을 더 강화할 예정이다.

JTBC 뉴스룸에 등장한 챗GPT
JTBC 뉴스룸에 등장한 챗GPT

"툭하면 없애는 R&D 조직"...국내는 눈도 못떼

지금까지 생성 AI 어플리케이션이 도입되거나 실험하는 영역으로[1] 뉴스 보도(정보 수집)나 기사 번역, 이미지 가공부터 프로그램 제작, 마케팅(고객 응대) 등이 거론되고 있다. 광고 등 언론산업과 연관된 시장에도 변화가 예고된다. 기존 광고를 바탕으로 새로운 광고를 생성할 수 있어 경우에 따라서는 기업 광고주의 선택지를 넓힌다.

반면 국내 방송사는 눈도 떼지 못한 상태다. 다만 이벤트가 몇 차례 있었다. 대표적으로는 2월 초 JTBC가 메인 뉴스 프로그램인 JTBC 뉴스룸을 통해 챗GPT를 직접 시연한 것을 꼽을 수 있다.[2] 이 방송에서 앵커는 가상인간으로 연출된 챗GPT(AI Human with ChatGPT)에 질문하고 답했다. 방송 화면을 위해 시각적으로 구성한 것이다. 방송 프로그램이 끝난 후에는 방청객을 초대한 스튜디오에서 온라인으로 챗GPT 기능을 추가 소개했다.

이 장면은 AI 서비스 전문 기업 이스트소프트의 지원으로 이뤄졌다. 이스트소프트는 국내 최초의 챗GPT-AI 버추얼 휴먼 연동 구현으로 영화 '아이언맨'에 등장한 인간형 AI '자비스'의 구현이 머지않았다는 점을 부각했다. 그러나 JTBC는 이후 공식적으로 생성 AI 기반의 연구와 실행 계획은 언급하지 않았다.

한 지상파방송사 관계자는 "해외 방송사들이 AI 등장 이후 꾸준히 관련 기술을 연구하고 실험에 나선다지만 한국은 뚜렷한 움직임이 없다"며 "경영진과 기자들의 인식 결여, R&D 분야 예산 부족 때문"이라고 말했다. 국내 방송사는 디지털 미디어 생태계를 준비하기 위해 설치한 랩(Lab) 등의 실험 조직을 꾸리기도 했지만 뚜렷한 이유 없이 없애기도 했다.

플랫폼 경쟁 환경 재편은 시간 더 필요

생성 AI 모델이 시장 경쟁 환경을 근본적으로 바꾸기에는 시간이 더 필요할 것으로 보인다. 특히 챗GPT가 구글 검색과 경쟁하기는 시기상조라는 의견이 많다. 가령 구글은 검색 결과를 실행하고 표시하는 데만 분기당 80억~200억 달러를 지출하고 있다. 검색 쿼리 결과를 표시하는 데 드는 Google의 검색당 비용인 2.5센트 정도다.

반면 채팅 GPT를 위해 GPT-3 모델을 실행하는 데는 각 결과당 약 30센트의 컴퓨팅 비용이 소요된다. 구글 대비 10배가 넘는 비용이 든다. 마이크로소프트(MS)사의 빙(Bing)의 경쟁력을 높이려면 10배의 비용 절감이 필요한 셈이다. 빙은 검색 결과를 제공하고 컴퓨팅 리소스를 효율적으로 사용할 수 있도록 모델을 최적화해야 한다. 비용 구조와 비즈니스 모델을 풀어가려면 상당한 전문 인력과 노하우가 결합돼야 한다.

산업 확대의 걸림돌은 여전히 비즈니스 모델이 보이지 않는다는 점이다. 특히 콘텐츠 생산자인 언론사, 미디어 기업은 대가에 민감하다. 빙의 비즈니스 모델[3]은 검색 엔진을 통해 콘텐츠로 수익을 창출하는 것인데 퍼블리셔 진영에게 어떤 몫이 돌아갈지는 회의적이다.

특히 사용자가 빙에서 검색하면 검색 엔진에서 제공하는 답변 목록이 표시되는데 자세한 내용을 읽기 위해 게시자의 웹 사이트 링크를 클릭하지 않을 수도 있다. 생성 AI가 검색 엔진 기능을 지속적으로 개선할수록 사용자는 구체적인 답변을 챗GPT 안에서 해결할 수 있다. 구글과 다르게(?) 언론사 웹사이트는 콘텐츠를 게시하고 광고 매출을 올리는데 어려움을 겪을 수 있다. 콘텐츠를 기반으로 수익을 창출할 수 있으려면 새로운 검색 엔진 사업자와 협력의 장을 열어둬야 할 것이다.

챗GPT 적용 사례
챗GPT 다양한 영역에서 적용되고 있다. 출처 세쿼이아 캐피털(Sequoia Capital) 재구성

비즈니스 모델 등 생성 AI에 의문부호 커져

GPT-4를 빙에 통합한 마이크로소프트의 도전, 챗GPT 대항마인 '바드(Bard)'를 내놓은 구글의 응전 추이에 따라 시장 구도의 격랑은 불가피하다. 일단 생성 AI 사업자의 비즈니스 모델로 기업 사용자 타깃과 유료 구독 모델이 부상하고 있다. 오픈 AI와 마이크로소프트의 파트너십이 대표적이다. 오픈AI는 마이크로소프트 제품의 기존 비즈니스 고객을 대상으로 업그레이드를 제안하는 것이다. 오피스 365(Office 365)에 GPT가 번들로 제공되는 것은 이미 현실이다.

이 과정에서 구독 기반 요금제는 이슈다. 챗GPT의 '프로' 기능은 월 42달러로 책정됐다. 이후 최적화 같은 기능상의 개선이 없다면 사용자 이탈이 예상된다. 사용량 기반 구독 요금제를 도입한 딥러닝 텍스트, 이미지 기반 이미지 생성 AI인 '스테이블 디퓨전'은 이미지를 생성할 때마다 0.2달러의 비용을 받는다. 부담을 줄이려는 사용자에게 안성맞춤이지만 서버 운영 등 인프라 효율화는 사업자의 과제다.

생성 AI를 둘러싼 이슈는 계속 증가하고 있다. 공공영역의 문제는 뼈아픈 부분이다. 관리하는 규제가 거의 또는 전혀 없기 때문이다. 허술한 체계로 불거진 노트르담시의 사례를 다룬 퍼블리시뉴스와기술연구소의 최신 리포트에 따르면 잘못된 데이터를 학습한 AI 시스템으로 엉뚱한 시민들이 피해를 겪었다. 언론을 비롯 전문가와 정부 등이 협력해야 할 사안이다.

이런 상황에서 거시적인 비판론이 고개를 들고 있다. "모든 인공지능 연구소에 GPT-4보다 강력한 인공지능 시스템의 학습을 최소 6개월 동안 즉시 중단할 것을 요청한다"는 주장이 그것이다. 저작권을 둘러싼 산업계의 이해 충돌도 마찬가지다.[4] '고등 AI'가 인류 문명에 부정적 변화를 초래할 수 있다는 목소리가 커진 것은 사실이다. 관련 기술이 사회적으로 선출되지 않은 기술 리더에게 온전히 맡겨서는 안 되며, 그 효과가 긍정적이고 위험을 관리할 수 있다는 확신이 있을 때에만 개발해야 한다는 논리다.

뉴스조직의 생성 AI 과제
뉴스조직의 생성 AI 과제

뉴스조직, AI 기반 인프라 더 미룰 수 없어

언론사도 콘텐츠와 업무 프로세스에서 생성 AI의 역할이 커지고 있지만 그만큼 신중하게 관리해야 한다. 뉴스조직은 점점 확실한 윤리적 경계를 가진 규범 채택과 다른 한편으로는 더 빠른 혁신 실행의 이슈를 동시에 풀어가야 한다. 전문 인력 확보, 시스템 및 기술 비전, M&A 및 파트너십 등은 당면한 과제다.

한 종합일간지 관계자는 "레거시 미디어는 인터넷, 스마트폰 이후 가장 큰 변곡점을 지나고 있다"며 "AI가 이끄는 생태계에 능동적으로 대응할 필요가 있다"고 말했다. 예를 들면 "생성 AI 기반의 콘텐츠를 그대로 제공하는 것이 아니라 기자가 제대로 된 정보를 생산할 때 보완하는 도구"로 일단 활용해야 한다.

당장에는 팩트체크 등 본연의 저널리즘 원칙을 실현하려면 지금보다 더 많은 리소스 투입이 가능하도록 조직 변화도 구상할 수 있다. 신속한 정보 수집과 정보에 정확성을 기하는 전통적인 취재보도 활동에 집중해야 한다는 의미다. 이 과정에서 익명의 취재원을 인용하는 '따옴표 저널리즘'이나 익숙한 프레임을 완화하는 변화도 일어날 수 있다. 생성 AI 환경에서는 합당한 근거와 논리를 제시하는 것이 차별화 요소일 것이기 때문이다.

한 종합편성채널의 디지털 부문 담당자는 "AI 앵커나 단편적인 보도를 넘어 생성 AI 생태계를 매체 디지털 전환의 촉진제로 삼아야 한다"고 말했다. 이 관계자는 "언론사별로 비슷한 속보 푸시나 웹사이트 운영이 아니라 지금은 개인화 서비스 경험 등 특별한 목적을 띠는 별도의 채널처럼 근본적인 전환을 검토할 때"라고 덧붙였다. 뉴스 아카이브, CMS, 독자 이용행태 데이터 같은 기본 인프라 고도화는 뉴스조직의 현안으로 부상할 가능성도 크다. 관건은 R&D 차원으로 다루는 방향성이다. 더 이상 보여주기식 이벤트로 끝나선 안 된다.

  1. 1

    언어: 대규모 언어 모델(LLM)은 시, 대본, 에세이 생성, 코드 개발, 번역, 유전적 서열 이해 등 다양한 작업에 활용된다. 뉴스룸에서는 뉴스 보도, 외신 기사 번역 등에 활용한다.

    오디오: 음악, 오디오 및 음성. 텍스트 입력으로 오디오 클립의 노래를 개발하고, 비디오의 개체를 인식하고, 다양한 비디오 영상에 수반되는 노이즈를 생성하고, 맞춤형 음악을 생성할 수 있는 모델이 있다.

    비주얼(visual): 3D 이미지, 아바타, 비디오, 그래프 및 기타 일러스트레이션의 생성. 가상 또는 증강 현실을 위한 사실적인 이미지를 생성하고, 비디오 게임용 3D 모델을 생성하고, 로고를 디자인하고, 기존 이미지를 개선하거나 편집하는 등의 작업을 수행할 수 있다. (예) Midjourney, DALL-E 및 Stable Diffusion과 같은 텍스트-이미지 변환 프로그램

  2. 2

    국내 방송사 최초의 AI 앵커는 2020년 MBN에서 시도됐다.

  3. 3

    전통적인 검색 엔진 수익 창출 모델은 자연 검색 결과와 함께 유료 링크를 제시하고, 사용자가 자연 검색 결과보다 더 나은 답변을 제공하는 광고 클릭을 유도한다. 그러나 검색 엔진이 직접 답변을 제공하는 경우에는 사용자가 링크를 클릭할 이유가 없다. 검색 엔진이 제공하는 답변에 링크를 포함시켜 수수료를 부과하는 방식을 고려할 수 있다. 다만 이러한 접근 방식은 광고주가 잠재적으로 결과를 조작할 수도 있다. 답변의 정확성과 공정성 논란을 불러일으킬 수 있다.

  4. 4

    지적 재산권의 침해 문제는 지뢰밭이다. 생성 AI 모델의 데이터 세트는 일반적으로 살아있는 예술가의 동의를 구하지 않거나 저작자의 권리와 무관하게 스크랩된다. 자동 완성 코드도 스포트웨어 불법 복제에서 자유롭지 않다. 방대한 뉴스 데이터를 학습하고 있는 부분도 생존 위기에 빠진 퍼블리셔 진영에겐 '공정사용'으로 넘어가기는 힘들다.