데이터셋 확장 학습·편집/변환 기능 추가로 활용성 업그레이드

칼로로 생성된 토끼 이미지. [사진=카카오브레인]
칼로로 생성된 토끼 이미지. [사진=카카오브레인]

카카오브레인이 인공지능(AI) 이미지 모델 ‘칼로’의 API를 ‘카카오디벨로퍼스’에서 공개했다. 칼로는 이미지를 만들 수 있는 1억8000만장 규모의 텍스트-이미지 데이터셋을 학습해 이미지를 만들어 주는 생성AI다. 

칼로 API는 이용자가 입력한 제시어의 내용을 이해해 이미지를 생성하는 툴이다. 다양한 후 다양한 화풍과 스타일로 세상에 단 하나뿐인 이미지를 생성할 수 있다는 게 카카오브레인의 설명이다.

칼로 API가 공개된 카카오디벨로퍼스는 웹 서비스, 모바일 앱, 기타 응용프로그램 개발에 필요한 플랫폼과 카카오 서비스와 연계할 수 있는 부가 기능을 제공하는 개발자 전용 웹사이트다. 

카카오의 AI기술, 카카오톡 접점이 필요한 파트너나 개인 누구나 카카오 기술과 무료 제공하는 오픈 API를 활용해 AI 서비스를 만들 수 있다. 

카카오브레인은 칼로 API 공개와 함께 생성 이미지를 이용자 의도에 따라 편집·변환하는 기능을 추가해 활용도를 높였다고 소개했다.

가령 검은 토끼의 이미지를 유화로 그려내게 한 후 토끼 얼굴 영역을 선택해 “a black rabbit with a crown(왕관을 쓴 검은 토끼)”라는 제시어를 추가 입력하면 해당 영역을 칼로가 편집해 왕관을 쓴 검은 토끼 이미지로 재생성할 수도 있다.

카카오브레인은 영감을 얻는 툴로 칼로를 활용할 수 있다는 점도 강조했다. 생각하는 작품의 핵심주제와 연관성이 높은 이미지를 업로드하면 이를 기반으로 칼로가 생성한 다양한 이미지를 통해 아이디어를 얻는 용도로 활용할 수 있는 것이다.

카카오브레인은 칼로 API를 이용할 수 있는 체험판도 함께 공개했다. 매달 제공되는 이용 횟수 안에서 칼로의 다양한 기능을 사용할 수 있으며, 1회 당 최대 3장의 이미지를 생성·편집·변환할 수 있다.

카카오브레인은 향후 추가적인 데이터셋 학습과 함께, 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 ‘이미지 아웃페인팅’ 등의 기능을 추가하며 모델의 성능을 고도화해 나갈 계획이다.

카카오브레인 김일두 대표는 “이번에 공개한 칼로 API 및 체험판을 통해 더 많은 사람들이 카카오브레인의 혁신적인 AI 이미지 생성 기술을 접할 수 있기를 기대한다”며 “꾸준한 연구개발을 통해 칼로의 성능을 고도화하고 이를 다양한 형태로 공개하며 활용 범위를 꾸준히 확대할 것”이라고 말했다.

관련기사

저작권자 © IT비즈뉴스(ITBizNews) 무단전재 및 재배포 금지