커머스 AI 전문 버즈니(대표 남상협, 김성국)는 AI 숏폼 자동 생성 서비스 ‘비스킷 AI(VISKIT AI)’에 숏폼 제작 신규 기능 4종을 추가했다고 16일 밝혔다.
영상 중심 콘텐츠 소비가 증가하면서, AI 영상 제작 시장도 점점 커지는 추세다. 현재 시장에 출시된 동영상 편집 앱에도 AI 편집과 생성 기능은 기본으로 탑재돼 있다. 그중에서도 ‘숏폼’은 핵심 콘텐츠로, 국내에도 숏폼 제작에 초점을 맞춘 AI 서비스가 늘어나고 있다.
그러나, 패션과 외식 등 카테고리와 다루는 주제에 따라 차별화된 영상을 만드는 것은 쉽지 않다는 지적이다.
따라서 버즈니는 신기능 4종을 통해 차별화에 초점을 맞췄다고 전했다. 비스킷AI는 영상이나 이미지를 업로드하면 AI가 핵심과 문맥을 분석해 모바일에 최적화된 세로형 숏폼 비디오로 자동 생성해 준다.
우선 영상 편집 자동화를 넘어 커머스와 마케팅에 특화된 멀티모달 AI라고 강조했다. 13년 이상 축적된 방대한 홈쇼핑 방송 데이터를 모델에 학습, 제품의 핵심 소구점(하이라이트)을 AI가 스스로 판단해 영상을 구성한다는 것이다.
▲네이버 플레이스 숏폼 제작하기 ▲블로그로 숏폼 제작하기 ▲뉴스 기사로 숏폼 제작하기 ▲음식점 숏폼 등이 추가됐다.
기존 숏폼 제작 기능이 광고형 콘텐츠를 빠르게 제작하는 것에 초점이 맞춰져 있었다면, 이번 신기능은 ‘스토리텔링’에 초점을 맞춰 바이럴형 콘텐츠를 기획하고 완성하는 것에 집중했다고 전했다.
또 하나의 모델이 모든 결과를 만드는 것이 아니라, 스토리 생성과 음성 생성(TTS), 배경음악 생성이 개별 최적 모델로 생성된 뒤, 이를 하나의 영상으로 조합하는 멀티 에이전트 방식이다.
예를 들어 기사와 블로그, 커뮤니티 글처럼 정제되지 않은 텍스트를 입력하면, 먼저 AI가 콘텐츠의 문맥과 핵심을 분석해 바이럴에 적합한 스토리를 생성한다.
생성 스토리를 바탕으로 TTS 모델이 콘텐츠 분위기에 맞는 음성을 생성하는 동시에 음악 생성 모델이 영상 흐름에 맞는 배경음악을 구성하는 식이다. 마지막으로 이를 통합, 영상에 자연스럽게 맞춰지도록 결합해 준다.
뉴스 링크나 포스팅 콘텐츠만 입력해 AI로 영상 및 숏폼 콘텐츠를 제작하는 서비스는 이미 등장했다.
그러나 비스킷AI는 텍스트를 요약해 영상으로 변환하는 수준에서 그치지 않는다고 강조했다. 다른 서비스들은 생성 이미지나 범용 이미지 소스를 활용하는 경우가 많지만, 버즈니는 뉴스 채널이 보유한 실제 기사 이미지, 썸네일, 콘텐츠 자산 등을 바탕으로 숏폼을 제작해 고유의 브랜드 톤앤매너와 신뢰도를 유지할 수 있다는 것이다.
생성 이후에 에디터를 통해 직접 편집이 가능하다는 것도 장점으로 꼽았다. AI가 초안을 자동 생성해 주는 것에서 끝나지 않고, 컷 구성과 자막, 이미지 순서, 문구 등을 직접 수정할 수 있다. 사람의 최종 편집까지 연결되는 제작 환경을 제공하는 것이 차별화 포인트라고 강조했다.
관계자는 “B2B 고객사 계약이 지속적으로 늘어나고 있으며 커머스 기업, 방송사, 콘텐츠 제작사 등 산업군에서 도입 문의와 협업 사례가 꾸준히 확대되는 등 AI 숏폼에 대한 수요는 꾸준히 증가하고 있다”라고 말했다.
지난해에는 신세계라이브쇼핑 등 홈쇼핑사 3곳이 기술을 도입됐으며, 올해는 홈앤쇼핑이 전면 도입해 숏폼 중심의 쇼핑 경험을 제공하고 있다.
B2C 사용자도 증가 추세다. “별도 대규모 마케팅을 진행하지 않았는데도 자연 유입 사용자 수와 사용량이 꾸준히 늘어나고 있다”라며 “특히 한번 사용해 본 유저들이 반복적으로 콘텐츠를 제작하거나 팀 단위로 활용 범위를 넓혀가는 사례가 늘고 있다”라고 말했다.
남상협 버즈니 대표는 “이번 신규 기능은 일반 소상공인과 마케터들도 누구나 쉽게 고품질의 숏폼을 만들어 비즈니스에 활용할 수 있도록 돕는 데 중점을 뒀다”라며 “앞으로는 단순 영상 편집 자동화를 넘어 커머스와 콘텐츠 시장의 생산성을 근본적으로 혁신하는 기술로 성장시켜 나갈 것”이라고 말했다.
장세민 기자 semim99@aitimes.com