인공지능 기술 리터러시 부상

2023년 04월 17일

AI에 대응하는 저작권 보호 기술 점점 진화
이미지 스트리밍, 학습 데이터에 워터마킹 주목
테크기업, 언론, 사용자 스스로 제역할 해야

디지털 텍스트, 이미지, 음원, 영상들은 온라인 공간에서 무한대로 확산된다. 콘텐츠 생산자와 배포 채널은 사용자 접근성 확장과 동시에 저작권 침해 위협 등 양면적 상황에 놓인다. 이 과정에서 무단 변형과 조작, 불법 공유, 정보 오·남용처럼 디지털 콘텐츠를 잘못된 방식으로 활용하는 사례가 불거진다.

인터넷이 보급되기 시작한 1990년대 중반 이래 콘텐츠 배포와 저작권 보호 문제는 지속적인 전쟁의 국면이다. 특히 과거 지면과 브라운관에서 만나던 오프라인 콘텐츠들이 디지털화 되면서 디지털 플랫폼과 기성 콘텐츠 기업 간에는 갈등과 진통이 잇달았다. 온라인 유통을 막기에는 역부족인 만큼 생산자의 권리 보호 노력이 이어졌다.

콘텐츠 생산자의 권리 보호 방법들로는 법 이외 기술적 조치가 있다. 사용자 인식 변화를 위한 장기적인 환경 조성도 중요하지만 ‘저작권 보호 기술’^[1]은 상당히 결정적인 역할을 하고 있다. 디지털 기술로 발생하는 문제에 기술이 일정 부분 대안을 내놓는 셈이다. 물론 기술이 완벽한 솔루션은 아니다.

생성형 인공지능(Generative AI)도 문제적 솔루션이다. 인공지능은 저작권 침해 가능성도 높지만 훌륭한 창작 보조 도구로서의 잠재력도 크다. 세계 곳곳의 정부부처와 법원 등 공공기관은 인간 중심의 저작권을 보호하는 큰 틀에서 기술 활용의 가능성을 열어두는 모양새다.

이 과정에서 기술의 역할은 제도적, 사회적 합의를 이행하는 집행관으로서의 지위다. 변화하는 지식정보 생태계에 걸맞는 새로운 저작권 기술의 필요성이 부상하는 배경이다.

스트리밍 기술로 이미지 도용 잡는다

유튜브, 스포티파이, 넷플릭스의 공통점은 스트리밍 플랫폼이다. 급속히 성장한 스트리밍 서비스는 대표적인 콘텐츠 소비 형태다. 실시간 접근이 가능한 스트리밍은 별도 노력 없이도 저작권을 지키는 소비를 가능케 한다. 하지만 영상, 음원과 달리 이미지 소비 방식은 아직 큰 변화가 없었다.

jpg, jpeg, png 포맷의 이미지 파일은 쉽게 도용될 수 있다. 실제로 매일 약 25억 개의 이미지들이 온라인상에서 도용되고 있다. 이미지 저작권 문제는 단순히 창작자의 권리 보호 차원으로 끝나지 않는다. 무단 변형과 유통으로 인해 허위정보 유포, 개인정보 침해 등을 야기한다.

스타트업 ‘스마트프레임(SmartFrame Technologies)’은 이미지를 음원과 영상처럼 스트리밍하는 방식으로 문제 해결에 나섰다.

이미지 스트리밍 기술은 한 줄의 코드면 된다. 원하는 이미지를 라이브러리에서 선택하면 임베딩(embedding)할 수 있는 코드를 제공받고, 그 코드를 CMS 등 콘텐츠 편집도구에서 원하는 위치에 삽입하면 된다. 가장 큰 차이는 그동안 이미지 ‘파일’을 웹페이지의 특정 공간에 업로드했다면 이젠 동일한 공간에 실시간 스트리밍한다는 점이다.

스마트프레임 홈페이지에서 제공하는 이미지 스트리밍 예시 | 좌측상단의 'EMBED' 버튼을 클릭하면 삽입할 수 있는 코드가 나온다 - 출처: 스마트프레임(SmartFrame)

사용자 몰입도 개선, 허위정보 확산 차단까지

최대 100메가 픽셀까지 구현되는 스트리밍 이미지는 독자에게 줌인해도 깨지지 않는 디테일과 전체화면 기능, 맥락적 설명이 담긴 캡션, 공유 기능을 포함한다. 이미지 자체에 내재화돼있기 때문에 콘텐츠 제작자인 퍼블리셔의 CMS나 웹페이지에 별도의 기능을 요구하지 않는다. 즉, 상호작용이 가능한 고품질의 이미지를 별도 요구사항 없이 코드 한 줄로 자유롭게 배치할 수 있다.

스트리밍 이미지 사용의 이점은 여럿 있다. 첫째, 고품질 이미지와 상호작용 기능으로 독자의 몰입도를 높일 수 있다. 독자는 이미지에 대한 세부 탐색이 가능하고, 캡션으로 이미지의 맥락 정보를 얻는다. 이는 독자의 경험을 개선하고 체류시간 즉, 독자의 관심을 늘릴 수 있다.

둘째, 이미지의 도용과 오용을 막을 수 있다. 파일 형태가 아닌 스트리밍 구조를 갖기 때문에 손쉽게 복제 및 이용되지 않도록 관리된다. 조작 및 불법적 공유를 통한 허위정보 확산을 예방할 수 있다. 퍼블리셔 입장에서도 오용, 라이선스 위반을 피할 수 있다. 이미지 저작권에 대한 투명성과 가시성을 확보하는 셈이다.

셋째, 새로운 수익을 만들 수 있다. 영상 스트리밍처럼 이미지 안에 광고 적용이 가능하다. 웹페이지에 삽입하는 광고와 다른 점은 맥락적 광고라는 점이다. 시스템에 등록된 이미지의 메타 데이터와 정보들로 이미지의 내용과 맥락을 같이 하는 광고를 배치할 수 있다. 독자의 경험을 해치지 않는 선에서 일시적으로 노출돼 관심과 참여를 높이게 된다.

이미지 스트리밍의 장점

프로그래매틱 광고보다 맥락 광고 효율 높다

이미지를 제공하는 소유자는 광고 수익의 일부를 대가로 얻을 수 있다. 일일이 소유권 분쟁을 치르지 않아도 권리를 지킬 수 있는 것이다. 이는 언론사에도 이득이다. 이미지 소유자들이 갖는 수익구조로 퍼블리셔들은 이미지 이용에 별도의 수수료를 지급할 필요가 없다.

광고 배치에 대한 부담감도 감소해 광고배너나 MPU 등으로 인한 방해 없이 웹페이지를 설계하고 전체적인 독자 경험 향상을 꾀할 수 있다. 또 시스템으로부터 이미지 수요, 독자 참여요인 등 고유한 데이터를 얻어 향후 콘텐츠 기획과 캠페인 도달을 위한 지표로 활용할 수 있다.

광고주들은 맥락 광고의 효과를 누릴 수 있다. 지금의 프로그래매틱 광고들은 대부분 조회수 지표처럼 양적 기준으로 집행되는데, 원치 않는 공간에 광고가 올라가기도 한다. 비효율적이고, 잠재적으로 브랜드 이미지에 악영향을 줄 수 있는 것이다. 이미지와 맥락을 같이하는 광고는 적은 비용으로 더 향상된 도달율을 기대할 수 있다.^[2]

이미지 스트리밍의 잠재력

인공지능 워터마크가 대안으로 떠올라

미디어 업계가 생성형 모델로 떠들썩한 가장 큰 이유는 인공지능의 저작권 침해에 있다. 챗GPT(chatGPT)는 GPT-4, Bard, LLaMA와 같은 대형 언어모델과 DALL-E, Midjourney, Stable Diffusion과 같은 이미지 생성모델의 부상 배경에는 사람이 창작하는 것과 유사한 텍스트나 이미지들을 만들어 내는데 있다.

모델 학습에 사용된 데이터의 저작권 문제, 인공지능 기반 창작물의 저작권 문제 모두가 비상한 관심을 사고 있다. 허위정보 확산, 개인정보 침해 등 정보 생태계를 혼돈에 빠뜨릴 가능성도 적지 않다. 이미 딥페이크로 유명 인사를 사칭하거나 성적으로 노골적인 콘텐츠 제작 사례들은 사회적 논란이 되고 있다.

책임성을 강조하는 사용 가이드라인과 규제 장치 등이 인공지능 기술의 진보 속도를 따라가지 못한다는 우려의 목소리가 큰 편이다. 일부 전문가들은 6개월간 대형 인공지능 모델의 성능 확장을 중단하자는 성명까지 낸 바 있다.

이런 가운데 저작권 보호기술도 점차 진화하고 있다. 디지털 콘텐츠 제작자 혹은 사용자는 '워터마크'를 익히 경험했을 것이다. 도용과 오용을 막는 기술로 지금까지도 활용되고 있다. 이 워터마크의 개념을 인공지능으로 확장한 것이 바로 '인공지능 워터마크'다. 인공지능 기반 콘텐츠를 식별하고 정보에 대한 진위 여부를 판별할 수 있다.

워터마킹된 이미지 - 출처: freepik

워터마킹된 이미지 원본 - 출처: freepik

학습 데이터부터 워터마크, 태그 활용하자

기존의 워터마크가 적용된 이미지(좌측)는 콘텐츠에 일정한 표식을 남겨 소유권과 진위여부를 구분 및 판단할 수 있게 한다. 현재는 미세한 픽셀 단위를 조정한 디지털 워터마크가 도입돼 있다. 사용자는 원본의 변형 없이 콘텐츠를 소비할 수 있고, 저작권도 쉽게 확인할 수 있다. 특히, 이미지의 자르기, 크기 및 색상 조정, 디지털 형식 변환 등 간단한 조작에 복원력을 갖는다. 복원력이 있다는 건 워터마크가 유지될 수 있다는 것이다.

인공지능 기반 창작물에는 워터마크를 어떻게 적용할 수 있을까? 워터마크 코드를 인공지능 모델에 직접 추가하면 된다. 물론 오픈소스 모델에서는 누구나 코드를 쉽게 제거할 수 있기 때문에 효용성이 다소 떨어진다.

대안으로 등장한 베이크드인(baked-in) 방식^[3]도 있다. 모델이 아닌 학습 데이터에 워터마크를 삽입하는 방법이다. 이미지 생성 모델의 경우 학습 데이터에 픽셀 단위 워터마크를 삽입하게 되면, 모델이 만든 이미지 또한 동일한 워터마크를 갖게 되는 구조다. 인공지능이 원본 이미지를 변형 및 재조합하더라도 워터마크는 유지될 수 있다.

chatGPT를 개발한 OpenAI도 생성모델 창작물에 워터마크를 도입하는 실험을 진행하고 있다. 다만, 이미지와 텍스트 창작물은 차이가 있다. 학습 단위가 다르기 때문이다. 텍스트의 경우 인공지능이 생성하는 키워드(단어)에 의도적인 편향 혹은 규칙을 부여한다.

종류는 여러가지다. 학습용 텍스트 데이터를 분류해 놓은 하위 단어 집합에 특정 태그를 지정한 다음, 인공지능이 결과로 도출한 단어 대신 태깅된 동의어를 선택하도록 만드는 방식이다. 인공지능이 ‘구매’라는 의미를 갖는 단어를 문장에 활용할 때 동의어인 ‘구입’이라는 단어만 의도적으로 선택하게끔 하는 식이다.

영상 암호화 기술 등장...미디어 인증 표준 논의

산업계도 이러한 기술적 장치를 시장에 확대하기 위해 공동 노력을 펼쳐기 시작했다. 어도비(Adobe), 마이크로소프트, 인텔(Intel), BBC 등이 동참한 C2PA(Coalition for Content Provenance and Authenticity)의 미디어 인증 표준 제정은 대표적인 사례다.

개방형 미디어 기술 표준을 만들고자 하는 C2PA

테크기업, 사용자, 언론의 역할 커진다

권리 보호를 위한 기술들도 한계는 있다. 이미지 스트리밍은 사용자 환경에서 워터마크 없이 캡처가 되는 경우가 있고, 스트리밍 환경에서는 업로드할 수 있는 파일의 사이즈도 제한적일 수 있다. 점점 이미지 해상도가 올라가는 현실을 고려했을 때 기술과 비용 측면에서 제약이 따를 수 있다.

인공지능 워터마크와 (영상제작시) 암호화 서명도 마찬가지다. 인공지능 워터마크는 개발자들이 워터마킹된 학습 데이터를 활용해야 하는데, 아직 가시적인 성과는 나오지 않았다. 암호화 서명도 제작과정에서 악의적인 의도를 갖게 되면 변조가 이뤄질 수도 있다.

이러한 과정 속에서 생성형 AI 모델의 등장은 하나의 전환점이 되고 있다. 이미 사람들은 진본과 인공지능이 만들어 낸 것을 구분하기 어려워하고 있다. 그러나 동시에 충분한 훈련 즉, 인공지능 기술과 관련된 리터러시를 익힌다면 구분이 가능하다는 것도 입증되고 있다. 바야흐로 장기적인 싸움이 될 것이다.

서둘러 규제 제도를 마련해도 공백은 있다. 물론 이 빈틈을 메우는 데는 표준을 지키지 않는 콘텐츠를 걸러내는 등 플랫폼 기업들이 적극 나서야 한다. 특히 사용자도 기술 변화에 주도적인 태도를 가져야 한다. 기술의 방향성을 인간의 관점에서 조정하지 않으면 기술에 지배되는 것은 시간문제다. 언론도 기술의 장점과 부작용에 초점을 맞추기보다는 해결책을 제시해야 할 것이다.

2

맥락적 광고(혹은 맥락 광고)는 콘텐츠의 내용과 연관성이 높은 광고를 싣는 걸 의미한다. 맥락적으로 연결된 광고를 통해 광고 효과를 극대화를 목표로 한다. 예를 들어 드라마가 끝난 이후 주연 배우가 출연한 광고나 예능 프로그램의 내용과 관련된 제품의 PPL 등 범위는 생각보다 넓다.
온라인 공간에선 웹페이지 배너 등에 게시되는 광고를 사용자에게 맞춰 제공하는 개인화된 광고들이 이에 해당된다. 하지만 최근 제3자 쿠키의 종말 등을 이유로 어려움을 겪을 것으로 예상된다.
이에 해결책으로 등장한 방식이 인공지능 기반 개인화 광고인데, 인공지능이 콘텐츠의 내용을 자동으로 분석해 연관성 높은 광고를 배치하는 '맥락적' 광고다. 이미지 스트리밍에선 이미지에 대한 메타데이터와 캡션 등을 통해 이미지의 내용과 맞는 광고를 삽입하는 맥락적 광고라 할 수 있다.
3

기존 이미지 생성모델의 워터마크 기능을 위한 노력은 코드 기반이였다. 인공지능 모델 자체에 워터마크를 생성하는 코드를 배치하는 방식이었는데, 오픈소스의 경우 누구나 해당 코드를 삭제할 수 있어 유명무실해졌다. 예시로 Stable Diffusion 모델의 경우, 제작사인 Stability AI는 배포시 워터마킹 코드를 포함시켰지만 실제 모델 사용자들이 활용한 코드에는 포함돼 있지 않았다. 그래서 제시된 개념이 학습데이터 자체에 워터마크를 도입하는 베이크드인(baked-in) 방식이다.

디지털 기술과 데이터에 관심이 있습니다.