이미지·동영상 제작하는 생성AI 시대 '성큼'
편향성 극복 등 AI 윤리 중요성 제고

어질러진 방 한가운데 한 소녀가 응시하고 있는 이 그림은 원작인 요하네스 페르메이르의 ‘진주 귀걸이를 한 소녀’를 오픈AI의 초거대AI 달리(DALL-E)가 아웃페인팅 기능을 통해 재창작된 이미지다. [source=openai]
어질러진 방 한가운데 한 소녀가 응시하고 있는 이 그림은 원작인 요하네스 페르메이르의 ‘진주 귀걸이를 한 소녀’를 오픈AI의 초거대AI 달리(DALL-E)가 아웃페인팅 기능을 통해 재창작된 이미지다. [source=openai]

인공지능(AI)의 한계는 어디일까. 최근 텍스트에서 이미지나 동영상을 만들 수 있는 생성AI(Generative AI)에 대한 관심이 급증하고 있다.

달리(DALL-E)는 가장 널리 알려진 생성AI다. 일론 머스크 테슬라 CEO 등 미국 실리콘밸리의 저명 인사들이 참여해 설립하고, 마이크로소프트(MS) 등 빅테크 기업의 대규모 투자를 받은 AI연구소인 오픈AI가 개발한 달리는 자연어를 기반으로 정교한 이미지를 생성하는 AI다. 

자연어를 그림으로 바꿔준다는 점에서 공개 직후부터 전세계적인 관심을 모은 달리는 지난달 말 기준으로 하루 200만개 이상의 이미지가 생성되고, 10만여명의 사용자가 커뮤니티에서 자신이 생성한 이미지를 공유하고, 피드백을 받고 있을 정도로 인기를 끌고 있다. 

‘달리 미니’로 알려진 크레용(Craiyon)도 있다. 자연어로 웹에서 간편하게 이미지를 생성할 수 있어 인기를 끌고 있는데, 일 평균 약 1천만개의 이미지가 생성될 정도다.

크레용에 따르면, 지난해 7월 공개 이후 약 10억개의 이상의 이미지가 크레용을 통해 만들어졌으며 흥미로운 크레용의 생성 이미지를 공유하는 트위터 계정의 팔로워가 100만명을 돌파하기도 했다.

최근에는 메타플랫폼(구 페이스북)이 자연어로 짧은 동영상까지 만들어내는 ‘메이크-어-비디오(Make-A-Video)’를 공개했다.

단어, 텍스트 등을 이용해 일러스트를 만들었던 메타의 ‘메이크-어-신(Make-A-Scene)’을 고도화한 것으로 ‘말이 물을 마시고 있다’ 등과 같은 문장을 입력하면 AI가 적합한 짧은 비디오 클립을 제작한다. 이미지를 넘어 동영상까지 AI로 생성하고 있는 것이다.

메타가 공개한 동영상은 아직은 어색한 부분도 적지 않지만 이미지 부분에서 생성AI의 빠른 발전을 감안하면 자연어로 AI가 만들어내는 동영상도 빠르게 발전할 것으로 전망된다.

단 몇 줄의 텍스트로 AI가 자동으로 생성한 메타 '메이크-어-비디오' 동영상 클립. [source=meta]
단 몇 줄의 텍스트로 AI가 자동으로 생성한 메타 '메이크-어-비디오' 동영상 클립. [source=meta]

일례로 지난해 초 처음 공개된 달리는 올해 4월 선보인 2.0버전에서는 화질을 4배 이상 높였으며, 이미지 삽입·편집·확장 등의 기능을 추가해 더 자연스럽고, 사용자 의도에 부합하는 결과물을 만들 수 있게 했다.

오픈AI는 9월 달리의 사용자 제한을 풀어 대기 없이 즉시 가입, 활용할 수 있게 개방했다. 기존에는 초대장을 받은 사용자만 달리를 활용할 수 있었지만, 이제 누구나 쉽게 달리를 사용해 이미지를 생성할 수 있도록 한 것이다.

오픈AI의 최대 후원사 중 하나인 마이크로소프트(MS)는 이달 개최한 ‘이그나이트’ 컨퍼런스에서 달리 2.0버전을 애저 클라우드에서 서비스한다고 밝혔다. MS는 ‘MS365’, ‘MS 디자이너', '이미지 크리에이터' 등에도 달리 기능을 통합해 제공할 계획도 전했다. 누구나 쉽게 생성AI를 활용할 수 있는 시대의 개막을 알리는 선언이다.

물론 생성AI에 대한 우려도 적지 않다. 창작의 문턱을 낮춰 누구나 쉽게 크레이터가 될 수 있게 하며, 제조 산업 등에서는 설계 작업을 효율화, 가속화해 제품 출시 시간을 단축시키는 등은 생성AI의 긍정적 효과로 기대되지만, 반대로 딥페이크 기술처럼 성범죄나 가짜 뉴스 등의 확산에 악용될 수 있는 문제도 제기된다.

생성AI 서비스들은 유명 연예인, 정치인의 이름을 금지하는 등 필터, 블록 적용을 통해 악용 방지에 나서고 있지만, 일각에서는 필터링을 무력화한 불건전 이미지가 생성됐다고 보고하기도 한다. 

편향성 문제도 해결해야 할 과제다. 기존 데이터에서 학습하는 AI가 잘못된 인식을 더 확증적으로 만드는 데 일조할 수 있기 때문이다.

일례로 오픈AI의 레드팀은 CEO, 변호사 등의 단어에 백인 남성 위주의 이미지를 생성하고, 승무원 등의 단어에는 아시아계 여성을 나타내는 편향성을 나타냄을 지적하기도 했다. 

[source=pixabay]
[source=pixabay]

저작권(IP)에 대한 논란도 있다. 생성AI는 방대한 이미지로 훈련하고 이를 토대로 결과물을 만들어낸다. 이를 순수 창작물로 볼 수 있는가의 여부가 논란의 핵심이다. 또 이 과정에서 대상이 된 원본 이미지 창작자의 스타일이 모방될 수도 있다. 

8월 미국 콜로라도주의 디지털아트 경연대회 우승자에 대한 논란은 이의 연장선에 있다.

우승자가 ‘미드저니’란 생성AI로 수백개의 이미지를 생성하고, 이 중 하나를 선택해 포토샵으로 보정했다고 밝히면서 적법성에 대한 논란이 일었다. 주최 측이 디지털 툴 사용이 제한되지 않았다는 점을 들어 우승을 인정하면서 일단락됐지만 독창성, 저작권에 대한 고민을 남긴다.

유료 이미지 서비스들의 입장도 제작각이다. 셔터스톡, 어도비스톡 등은 AI 이미지를 창작물로 인정해 판매에 제한을 두고 있지 않지만, 게티이미지는 저작권 분쟁을 피하기 위해 스톡 이미지 데이터베이스(DB)에 생성AI 이미지를 업로드를 금지하는 정책을 적용하고 있다. 

사람의 직업을 위협한다는 점도 논란거리다. 생성AI가 더 고도화되면 일러스트레이터나 사진작가, 그래픽 디자이너 등의 직업군을 와해 시킬 수 있다. 전문인력 고용비용보다는 훨씬 더 저렴한 금액으로 생성AI를 이용할 수 있을 것이기 때문이다.

사람의 전유울로 여겨졌던 예술, 창작의 영역까지 기술이 파고들 수 있음을 보여주는 사례다.

카카오브레인이 개발한 AI모델 ‘시아(SIA)’는 지난 8월 시집도 출간했다. 초거대AI 언어모델인 KoGPT를 기반으로 구현된 시아는 약 1만3000여편의 시를 읽으며 작법을 익혔다. [사진=카카오브레인]
카카오브레인이 개발한 AI모델 ‘시아(SIA)’는 지난 8월 시집도 출간했다. 초거대AI 언어모델인 KoGPT를 기반으로 구현된 시아는 약 1만3000여편의 시를 읽으며 작법을 익혔다. [사진=카카오브레인]

이 뿐만이 아니다. 고객 응대 등 AI로 인한 변화는 곳곳에서 나타나고 있으며 사람의 수준으로 생각하고, 특정 영역에 국한되지 않는 범용 인공지능(AGI)까지도 얘기되고 있다. 

물론 범용AI까지는 아직은 갈길이 멀다. 하지만 AI의 침투가 사회 곳곳에서 이뤄지고 있으며, 속도에도 가속도가 붙고 있다. AI의 악용, 편향성 등에 대한 방지 방안과 AI로 인한 변화를 발전적으로 수용할 수 있는 사회적·제도적 기반, AI윤리에 대한 건설적 논의가 필요한 시점이다.

관련기사

저작권자 © IT비즈뉴스(ITBizNews) 무단전재 및 재배포 금지