알리바바, 해피호스 1.1 출시…9개 이미지 참조 및 오디오 생성 지원

알리바바 그룹의 해피호스(HappyHorse) 1.1 비디오 생성 모델이 오디오 출력과 9개 이미지 캐릭터 참조(character reference) 지원을 추가하며, 1.0 버전 대비 역동적 표현력, 피사체 일관성 및 시각적 품질을 업그레이드했다.

알리바바는 이번 업데이트가 "모션 모델링과 시간적 일관성을 최적화하여 동작의 정합성을 향상시킨다"고 설명했으며, 최대 9개의 캐릭터 참조 이미지를 동시에 입력할 수 있어 멀티샷 이해 능력과 프롬프트 준수도를 강화했다.

해피호스 1.1은 역동적 표현력, 피사체 일관성, 명령어 준수도, 시각적 품질, 오디오 기능 등 5가지 차원에서 1.0 버전 대비 전면적인 개선을 이뤘다. 이 모델은 공식 해피호스 웹사이트, 알리바바 클라우드 바이리안 및 큐원(Qwen) 클라우드에 통합되어 개발자와 기업 고객이 알리바바의 클라우드 인프라를 통해 직접 접근할 수 있다.

이번 업그레이드는 AI 비디오 생성 시장에서 알리바바의 경쟁력을 강화한다. 이 시장에서는 바이트댄스, 콰이쇼우, 텐센트도 경쟁 모델을 출시한 상태다. 알리바바는 자본 지출에 3800억 위안(약 525억 달러) 이상을 투입했으며, 경영진은 AI 워크로드를 위한 컴퓨팅 인프라 구축 경쟁 속에서 최종 지출 규모가 초기 계획을 초과할 수 있다고 시사한 바 있다.

해피호스 1.1은 치열한 경쟁이 펼쳐지는 중국 AI 비디오 모델 시장에 합류했다. 바이트댄스의 지멍(Jimeng), 콰이쇼우의 클링(Kling), 텐센트의 비디오크래프터(VideoCrafter)는 모두 지난 1년간 비디오 생성 기능을 출시하며 각자 개발자 채택과 기업 계약을 놓고 경쟁 중이다. 알리바바의 강점은 클라우드 유통망에 있다. 해피호스는 40만 이상의 기업 고객을 보유한 AI 플랫폼인 알리바바 클라우드 바이리안에 기본 통합되어 있다.

오디오 생성 기능 추가는 차별화 요소다. 중국 경쟁사들의 대부분 비디오 생성 모델은 무음 출력을 제공해 별도의 오디오 파이프라인이 필요하다. 해피호스 1.1의 엔드투엔드 오디오-비디오 생성은 콘텐츠 제작자와 마케팅 팀의 워크플로 복잡성을 줄여 기업 도입을 가속화할 잠재력이 있다.

알리바바 주식은 선행 주가수익비율(PER) 약 10배 수준에서 거래되고 있으며, 이는 텐센트의 15배보다 할인된 수준이자 항셍지수 전반보다는 프리미엄이다. 해피호스 업그레이드만으로 주가가 움직일 가능성은 낮지만, 알리바바가 인프라에 공격적으로 지출하는 시점에서 이번 발표는 알리바바를 AI 리더로 자리매김하는 서사(narrative)를 강화한다. 해당 모델을 보유한 알리바바 클라우드는 2025 회계연도에 690억 위안의 매출을 기록했으며, AI 관련 매출은 세 자릿수 성장률을 보이고 있다. 리스크는 AI 비디오 생성이 여전히 불분명한 수익화 경로를 가진 초기 시장이라는 점이다. 오픈AI의 소라(Sora)는 아직 공개 출시되지 않았으며, 경쟁사 중 비디오 생성 도구로 지속 가능한 수익을 입증한 곳도 없다.

본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.