阿里巴巴AI视频模型全球排名升至第二,OpenAI的Sora与字节跳动的Seedance排名下滑(14分钟阅读)
摘要
阿里巴巴发布HappyHorse 1.1,这是一次重大AI视频生成模型升级,现已通过API提供,在竞争对手Sora和Seedance表现不佳的情况下,全球排名升至第二。
阿里巴巴的HappyHorse 1.1 AI视频生成模型通过一个为集成到企业软件栈而构建的API,提供可用于生产的视频。该模型现已上线阿里云模型工作室,并在前两周提供全场40%的发布折扣。HappyHorse支持文本转视频、图像转视频、主体转视频生成,以及视频编辑。其能力覆盖商业视频需求的整个范围,从构思、制作到后期制作。
查看缓存全文
缓存时间: 2026/06/23 13:42
# 阿里巴巴AI视频模型跃居全球第二,OpenAI的Sora与字节跳动的Seedance黯然退场
来源:https://venturebeat.com/technology/alibabas-ai-video-model-rises-to-no-2-in-global-rankings-as-openais-sora-and-bytedances-seedance-fall-away
阿里云(https://www.alibabacloud.com/en?_p_lc=1)于周日发布了HappyHorse 1.1(https://www.happyhorse.com/),这是其AI视频生成模型的重大升级。该公司表示,该模型能够在核心内容创作场景中提供可投入生产的视频合成。该模型现已登陆阿里云百炼平台(https://modelstudio.alibabacloud.com/),面向企业客户和开发者提供完整的API访问权限,并在前两周提供全站40%的发布折扣。
此次发布恰逢AI视频生成市场剧烈动荡之际——阿里巴巴似乎敏锐地抓住了这一时机。OpenAI因财务不可持续而停用了Sora(https://help.openai.com/en/articles/20001152-what-to-know-about-the-sora-discontinuation)。字节跳动则在遭到好莱坞片商大量版权投诉后,无限期搁置(https://www.cnbc.com/2026/03/17/bytedance-seedance-shut-down-tiktok-marsha-blackburn-peter-welch.html)了Seedance 2.0的国际发布。对于那些曾评估或将这些工具集成到营销、广告和内容制作工作流程中的企业采购团队而言,竞争格局在短短数月内急剧收缩。
这种收缩既为阿里巴巴带来了机遇,也带来了考验。HappyHorse 1.1既不是研究演示,也不是消费者玩具——它是一款优先考虑API的产品,专为企业软件栈集成而设计,按量定价,并得到价值527亿美元的全球基础设施建设的支持。它能否将技术能力转化为企业采用,尤其是在中美科技紧张局势不断加剧的西方市场,将决定阿里巴巴能否在分析师预测到本十年末将达到数百亿美元的生成式视频市场中确立自己的重要地位。
## **HappyHorse 如何从匿名基准测试参赛者跃升为排名第一的视频模型**
HappyHorse(https://www.happyhorse.com/)最初于4月初以匿名提交的形式出现在Artificial Analysis Video Arena(https://x.com/arena/status/2044977389185482998)上。这是一个独立的基准测试平台,真实用户在此通过盲测、并排对比的方式比较模型输出。该模型立即在文生视频和图生视频两个排行榜上夺得榜首。随后确认其创造者为阿里巴巴,由该公司ATH(阿里巴巴Token Hub)AI创新单元开发——该团队在战略组织重组前隶属于淘宝天猫集团下的未来生活实验室。
根据Arena.ai(http://arena.ai/)的数据,HappyHorse 1.0目前在Video Arena的三个排行榜上均位居第二。该平台指出,该模型在文生视频和图生视频两个类别中均获得1,444分,在文生视频上领先谷歌的Veo-3.1(含音频)69分,在图生视频上领先xAI的Grok-Imagine-Video 23分。在Arena这类基于Elo评分的排名系统中,模型根据用户在直接对比中是否偏好其输出来获得或失去分数,因此持续两位数的领先优势反映了人类评估者感知到的持续质量差距——而非统计上的侥幸。
该模型的架构有助于解释其原因。根据社区整理的技术文档,HappyHorse基于一个150亿参数的统一自注意力Transformer构建,能够在单个Token序列中处理文本、图像、视频和音频Token。与许多将视频和音频模型拼接在一起的竞争对手不同,HappyHorse作为一个统一系统运行,在单次生成过程中处理所有模态,无需第三方配音或后期处理音频工具。对于评估总拥有成本的企业买家来说,这种架构的简洁性直接转化为更少的集成点、更少的供应商依赖以及更快的上线时间。
## **1.1版升级修复了哪些问题——以及为何对商业视频制作至关重要**
1.1的升级针对企业视频制作团队深有体会的一系列痛点。阿里云(https://www.alibabacloud.com/en?_p_lc=1)将此版本描述为“在核心内容生成场景上进行了系统性优化”,具体改进揭示出该模型是为商业部署而非病毒式社交媒体演示而调优的。
最重大的升级是多图像参考能力,阿里巴巴称之为R2V(参考到视频)。该功能允许用户上传多个角色参考图像,并在生成的视频中保持身份一致性——这直接解决了AI视频制作中最棘手的问题之一,即主体在帧或镜头之间外观容易漂移。对于制作广告活动、产品视频或系列化营销内容的品牌而言,身份一致性并非锦上添花,而是一项必不可少的要求,以往这常常迫使团队回归传统制作方法。
运动质量获得了重大改进,阿里巴巴称之为“增强的运动建模”,解决了以往在速度和流畅度方面的限制。该公司还对视觉纹理进行了针对性改进,特别指出消除了“面部油光”、“过度锐化”和“不自然纹理”——这些伪影自该技术问世以来一直困扰着商业AI视频,并立即向观众表明内容是机器生成的。
另外两项升级完善了此次发布。HappyHorse 1.1(https://www.happyhorse.com/)改进了音视频同步,包括阿里巴巴声称的对话场景“零漂移唇形同步”以及上下文感知的语速控制——这建立在1.0版本已能生成最长15秒1080p视频并同步音频输出的显著能力之上。该模型还改进了对长而复杂指令的遵循能力,这对于需要单次生成(而非反复尝试数十次)指定精确镜头运动、光照条件和叙事节奏的企业用户来说,是一个关键差异化优势。
## **Sora的崩溃和Seedance的冻结让企业买家面临前所未有的选择匮乏**
围绕此次发布的竞争环境对阿里巴巴异常有利,理解其原因至关重要。
OpenAI的Sora网页和应用程序体验已于4月26日停用(https://help.openai.com/en/articles/20001152-what-to-know-about-the-sora-discontinuation),Sora API将于9月24日停用。关闭的原因是该产品在财务上不可持续:Sora每天运营成本约100万美元,但总收入仅约210万美元,同时活跃用户从峰值近100万下降至不足50万。对于已将Sora集成到生产流程中的企业团队而言,突如其来的撤出突显了依赖缺乏可持续商业模式的AI产品的风险——这是一个采购官员不太可能很快忘记的警示故事。
字节跳动的Seedance 2.0(https://seed.bytedance.com/en/seedance2_0)——许多人认为它是Sora最强大的继任者——遇到了另一种障碍。Netflix、华纳兄弟、迪士尼、派拉蒙和索尼向字节跳动发出法律威胁,指控其系统性地侵犯版权,原因是用户生成了包含好莱坞知识产权的病毒式片段。字节跳动无限期推迟(https://techcrunch.com/2026/03/15/bytedance-reportedly-pauses-global-launch-of-its-seedance-2-0-video-generator/)了国际发布,全球推广至今仍处于暂停状态。
这使得谷歌的Veo 3.1(https://blog.google/innovation-and-ai/technology/ai/veo-3-1-lite/)成为企业视频生成领域的主要西方竞争对手。但阿里巴巴在Arena排名中的数据表明,HappyHorse在用户感知质量上优于Veo,而阿里云百炼上的40%发布折扣可能使HappyHorse在大规模使用下显著更便宜。在1.0级别,通过第三方API平台,720p下每10秒视频片段的价格约为1.82美元,1080p下为3.12美元。凭借促销定价,HappyHorse 1.1可能使达到生产质量的AI视频生成对之前认为该技术仅适合实验而过于昂贵的中端市场和代理机构变得触手可及。
## **阿里巴巴527亿美元基础设施押注让HappyHorse拥有竞争对手无法匹敌的分发优势**
HappyHorse 1.1(https://www.happyhorse.com/)并非孤立存在。它建立在全球基础设施攻势之上,这使阿里巴巴区别于那些构建了令人印象深刻的技术但缺乏为受监管企业客户大规模服务所需的物理和商业机器的纯AI模型公司。
就在HappyHorse 1.1发布前五天,阿里云(https://www.alibabacloud.com/en?_p_lc=1)在法国开设了首批数据中心,建立了继德国和英国之后的第三个欧洲枢纽。巴黎区域设有两个可用区,使公司的全球足迹达到32个区域共105个可用区。“我们云基础设施向法国的扩张,强化了我们致力于为欧洲企业提供主权、安全和智能解决方案的持续承诺,”阿里云首席技术官兼国际业务总裁李飞飞博士在公司公告中表示。在日本,该公司于6月19日在东京开设了第五个数据中心。
据Data Center Dynamics(https://www.datacenterdynamics.com/en/news/alibaba-cloud-launches-france-region/)报道,首席执行官吴泳铭已承诺投资527亿美元建设“统一的全球云网络”,公司随后考虑将这一数字增至690亿美元。仅在今年,阿里巴巴就在墨西哥、泰国、马来西亚柔佛州和法国启动了新区域。法国部署也是阿里云计划于下半年在欧洲推出企业级智能体AI服务的一部分,包括AgentRun(https://help.aliyun.com/en/functioncompute/fc/what-is-agentrun)(AI智能体开发平台)、STAROps(https://help.aliyun.com/en/starops/product-overview/introduction-of-starops)(智能运维平台)和ACS Agent Sandbox(https://www.alibabacloud.com//blog/one-click-openclaw-deployment-building-enterprise-grade-ai-agent-applications-with-acs-agent-sandbox_602980/_____tmd_____/punish?x5secdata=xcybsQIh5Cown%2fWZGmvZM4R8tzrKeLy38z%2bxF39tV8%2fJwaQbn3Vu7Pb7GOOHfHTc9jfWBSal7fUMFaPB4md90IQbPqDwo4rlivLRDyLVfZwpl0vKVA7dwDSrf6Scw4ClRD9ZUte6ZkHtjGJxj2KB%2f4rQdKygWtukQNfv494%2fgbCGHwYB5Pg08kF18V9%2bYRULrQ6hp2PCkXtH%2f3pVnvORQU3ViffPPs%2fa1PN%2fDb4vdHSw5EdZZoZdHfv15xALfTrN4w__bx__www.alibabacloud.com%2fblog%2fone-click-openclaw-deployment-building-enterprise-grade-ai-agent-applications-with-acs-agent-sandbox_602980&x5step=1)(为智能体工作负载提供硬件级安全隔离)。
对于HappyHorse(https://www.happyhorse.com/)这样的产品而言,基础设施构建发挥着双重作用。运行一个带集成音频的150亿参数视频生成模型计算密集度极高,拥有本地基础设施可降低企业API调用的延迟,同时将客户数据保留在监管边界内。对于在欧盟委员会于6月3日发布的新技术主权框架下运营的欧洲买家而言——该框架明确旨在保护欧盟的“数字独立性”——能够在本地托管基础设施上运行AI视频生成工作负载并非奢侈,而是日益成为合规要求。
## **五角大楼清单与地缘政治风险笼罩着阿里巴巴的西方雄心**
阿里巴巴的全球扩张正面临重大的地缘政治逆风,企业买家不可忽视。美国五角大楼于6月8日将阿里巴巴(https://www.cnbc.com/2026/06/09/alibaba-baidu-byd-named-on-pentagons-china-military-list-.html)与比亚迪和百度一同列入中国军事企业清单,禁止其获得美国国防合同。阿里巴巴否认这一认定,表示“不是中国军工企业,也不是任何军民融合战略的一部分。”
被列入清单不会自动触发制裁,也不直接限制美国私营企业与阿里巴巴之间的商业交易。但它为采购决策增加了声誉和监管方面的复杂性,尤其是对于那些与美国政府有业务往来、涉及国防供应链或拥有跨大西洋业务的公司而言。企业技术采购很少仅凭技术优势进行评估——供应商风险评估、董事会级合规审查以及地缘政治情景规划都影响着云基础设施和AI工具的购买决策。
对欧洲客户而言,其考量方式更为复杂。欧洲大陆日益强调的数字主权具有双重作用:一方面创造了对占主导地位的美国超大规模云服务商(根据Synergy Research Group的数据,Amazon Web Services (https://aws.amazon.com/)、Microsoft Azure (https://azure.microsoft.com/en-us) 和 Google Cloud (https://cloud.google.com/) 控制了欧洲约70%的云基础设施收入)替代品的需求,但另一方面也引发了对中国供应商是否代表着战略自主性有意义的改善的质疑。阿里巴巴通过在目标市场建设符合主权要求的基础设施策略,正是直接回应这一疑问——但五角大楼的清单确保了这个问题将被反复提出。
## **随着AI视频市场整合,企业团队应关注什么**
HappyHorse 1.1(https://www.happyhorse.com/)对企业团队的实际影响十分显著。HappyHorse支持四种生成模式——文生视频、图生视频、主体生视频以及新增的视频编辑——覆盖从构思到制作再到后期的商业视频全光谱需求,且均无需额外费用即可集成音频。这种广泛的能力通过单一API端点提供,简化了以往碎片化且昂贵的制作流程。
未来的问题在于,阿里巴巴能否将基准测试领先和竞争时机转化为持久的企业关系。该公司计划通过阿里云百炼发布HappyHorse,并提供完整的企业SLA、安全认证和区域合规——这是区分研究突破与生产级服务的基本要求。值得关注的是客户披露、使用指标,以及fal.ai和Atlas Cloud(已托管HappyHorse 1.0)等第三方平台是否会迅速更新至1.1版本,这将表明阿里巴巴生态系统之外的真实开发者需求。
进入2026年时,AI视频生成市场有三家可信的企业级竞争者。一家已消亡。一家已冻结。而剩下的那一站着的,是一家由中国公司支持、拥有527亿美元基础设施投入、在所有主要独立基准测试中排名第二的公司,并且正在为任何愿意下注的人提供40%的折扣。在企业技术领域,最好的产品并不总是能赢——但当竞争对手已经退出赛场时,它很少会输。
相似文章
Sora 2 正式发布
OpenAI 发布了 Sora 2,这是一个先进的视频生成模型,代表了人工智能内容创作能力的重大进步。
Claude Mythos、Deepseek v4、HappyHorse、Meta 新 AI、实时视频游戏:AI 新闻
Anthropic 公布被雪藏的 Claude Mythos 模型,可自主挖掘数千个 0-day;ZAI 开源 1.5 TB GLM-5.1,登顶开放权重基准;阿里巴巴未发布的 HappyHorse 视频模型冲上公开榜第一;Deepseek 放出“专家模式”v4 预览。
Seed2.1 发布
字节跳动发布了新 AI 模型 Seed2.1,并附有博客文章和模型卡。
@Radha_AI:中国刚刚推出了一位永不休眠的 AI 员工。它能做研究、写代码、建网站、做幻灯片,还能生成……
ByteDance 发布 DeerFlow 2.0,这是一个开源 AI Agent 框架,支持在本地执行编程、研究和内容生成等任务,无需依赖云端或订阅服务。
Sora 已推出
OpenAI 已向公众推出其视频生成技术 Sora,并采取了包括 C2PA 元数据、水印和滥用防护在内的安全措施。该系统在物理学和复杂动作方面存在已知限制,但代表了人工智能驱动视频创作能力的重大进步。