阿里发布通义万相（HappyHorse）1.1版本，支持九张图像参考及音频生成

阿里巴巴集团旗下通义万相1.1视频生成模型新增音频输出及九张图像角色参考支持，在动态表现力、主体一致性及视觉质量方面相较1.0版本全面升级。

阿里表示，此次更新"优化了运动建模和时间一致性，以增强动作连贯性"，同时支持最多同时输入九张角色参考图像，以实现更强的多镜头理解能力和提示词遵从度。

通义万相1.1在动态表现力、主体一致性、指令遵循、视觉质量及音频能力五大维度实现系统级提升，较1.0版本全面升级。该模型现已集成至通义万相官网、阿里云百炼及通义云平台，开发者和企业客户可通过阿里云基础设施直接访问。

此次升级进一步巩固了阿里在AI视频生成领域的竞争地位。在这一赛道中，字节跳动、快手及腾讯均已发布竞品模型。阿里巴巴已承诺资本支出超过3800亿元人民币（约合525亿美元），公司高管表示，随着阿里加紧建设AI工作负载所需的计算基础设施，最终数字可能超出最初规划。

通义万相1.1进入了一个竞争激烈的中国AI视频模型市场。字节跳动的即梦、快手的可灵及腾讯的VideoCrafter均在过去一年内推出了视频生成功能，各方争相获取开发者采用及企业合同。阿里的优势在于其云分发能力——通义万相已原生集成至阿里云百炼，该AI平台服务超过40万家企业客户。

新增音频生成功能是一项差异化特性。多数中国竞争对手的视频生成模型仅能输出无声内容，需单独配置音频管线。通义万相1.1的端到端音视频生成能力降低了内容创作者和营销团队的工作流程复杂度，有望加速企业级应用落地。

阿里巴巴股票目前远期市盈率约为10倍，低于腾讯的15倍，高于恒生指数整体水平。此次通义万相升级本身不太可能推动股价变动，但在阿里大力投入基础设施建设的背景下，它强化了阿里作为AI领军者的叙事。承载该模型的阿里云在2025财年实现营收690亿元人民币，AI相关收入以三位数百分比增长。风险在于，AI视频生成仍是一个变现路径尚不明朗的新兴市场。OpenAI的Sora尚未公开上线，目前尚无任何竞争对手已通过视频生成工具实现可持续收入。

本文仅供信息参考，不构成投资建议。