KAIST·카네기멜론대, 창작자 중심 상호작용형 창작 지원 시스템 개발
국내 연구진이 텍스트, 이미지 등 다양한 데이터를 입력하면 화성 구조(코드)로 변환해 음악 창작을 돕는 인공지능(AI) 기술을 개발했다.
7일 카이스트(KAIST)에 따르면, 전기및전자공학부 이성주 교수 연구팀이 AI 기반 음악 창작 지원 시스템 ‘어뮤즈(Amuse)’를 개발했다.
이성주 교수 연구팀이 개발한 어뮤즈 시스템은 텍스트·이미지·오디오와 같은 다양한 형식의 영감을 입력하면 이를 화성 구조(코드 진행)로 변환해 작곡을 지원해 주는 AI 기반 시스템이다.
가령 ‘따뜻한 여름 해변의 기억’과 같은 문구나 이미지, 사운드 클립을 입력하면 어뮤즈는 해당 영감에 어울리는 코드 진행을 자동으로 생성해 제안한다.
연구팀은 “기존의 생성AI와 달리 어뮤즈는 사용자의 창작 흐름을 존중하고 AI의 제안을 유연하게 통합·수정할 수 있는 상호작용 방식을 통해 창의적 탐색을 자연스럽게 유도한다는 점에서 차별성을 갖는다”고 설명했다.
핵심 기술은 대형언어모델(LLM)을 이용해 사용자의 영감으로 프롬프트에 입력한 글자 따라 이에 어울리는 음악 코드를 생성하고, 실제 음악 데이터를 학습한 AI 모델이 부자연스럽거나 어색한 결과는 걸러내는(리젝션 샘플링) 과정을 거쳐 결합한 방법을 자연스럽게 이어 재현하는 하이브리드 생성 방식이다.
연구팀은 실제 뮤지션을 대상으로 한 사용자 연구를 수행한 결과, 어뮤즈가 단순한 음악 생성AI가 아닌 사람과 AI가 협업하는 창작 동반자(Co-Creative AI)로서의 가능성이 높다는 평가를 받았다.
KAIST 전기 및 전자공학부 박사과정 김예원, 이성주 교수, 카네기 멜런 대학의 크리스 도너휴 교수가 참여한 해당 논문(Amuse: Human-AI Collaborative Songwriting with Multimodal Inspirations)은 4월26일 일본 요코하마에서 열린 CHI(ACM Conference on Human Factors in Computing Systems)에서 상위 1%에게만 수여되는 최우수 논문상(Best Paper Award)을 수상했다.
이성주 교수는 “창작자가 실제로 필요로 하는 것이 무엇인지에 주목하며 창작자 중심의 AI 시스템 설계에 주안점을 뒀다”며 “어뮤즈는 창작자의 주도권을 유지한 채 AI와의 협업 가능성을 탐색하는 시도로, 향후 음악 창작 도구와 생성AI 시스템의 개발에 있어 보다 창작자 친화적인 방향을 제시하는 출발점이 될 것으로 기대한다”고 말했다.
관련기사
- AWS, 이달 14일 ‘AWS 서밋 서울 2025’ 개최
- 경제 질서의 지각 변동…“공급망·규제·기술 등 전방위 재정비해야”
- 산업부, 유통·AI 얼라이언스 발족식…유통산업 AI 확산 속도전
- 카카오엔터, AI 기반 웹툰 숏폼 ‘헬릭스 숏츠’ 론칭
- 최근 4년 간 KAIST 출신 스타트업 상장사 20곳…기업가치 10조원 돌파
- 네이버, 이달 27일 AI브리핑 도입…‘온서비스AI’ 전략 속도전
- 국내 연구진, 화재 걱정 없는 고효율 아연-공기 배터리 개발
- 알리바바클라우드, 비디오 생성AI ‘완2.1’ 오픈소스로 공개
- 콘진원, 올해 방송영상·OTT특화 콘텐츠 지원에 577억원 투입
- 알리바바클라우드, 오픈소스 LLM ‘큐원3’ 공개