AI视频生成领域迎来一匹横空出世的“黑马”——HappyHorse-1.0。在Artificial Analysis最新更新的视频竞技场排行榜中,这款此前鲜为人知的模型同时占据四个子榜单的前两名,以颠覆性表现打破行业格局。截至4月9日,其文生视频(无音频)赛道得分1378分,领先第二名字节跳动Seedance2.0达105分;图生视频(无音频)赛道更以1411分刷新平台历史纪录。即便在带音频赛道,也仅以1-2分微弱差距与Seedance2.0并列,引发行业震动。
这款模型的突围路径充满戏剧性:既无发布会造势,也无企业背书,仅凭榜单成绩便完成从零到行业顶流的跨越。其模型名称旁标注的“即将推出”字样,更增添神秘色彩。直到4月10日,阿里巴巴正式确认该模型出自ATH创新事业部,由副总裁郑波团队研发,目前处于内测阶段并将于近期开放API。资本市场迅速反应,消息公布当日阿里港股一度涨幅超7%。
深入分析其技术架构,HappyHorse采用约150亿参数的纯自注意力单流Transformer,将文本、视频与音频token置于同一序列联合建模。这种设计区别于传统“视频生成+音频后处理”的拼接方案,使声音与画面在生成阶段即处于同一语义空间,从而在口播与人物场景中实现更自然的同步效果。参与盲测的用户反馈显示,该模型在人物面部纹理细腻度、镜头切换流畅性以及复杂提示词下的人物一致性方面表现突出,尤其在人像与口播类内容占比超60%的评测样本中,局部优势被显著放大。
然而,高分背后仍存隐忧。社交媒体上的技术拆解指出,已发布视频中存在水体抖动不自然、快速运动物体条纹崩坏以及大屏显示画质劣化等问题。某AIGC导演直言,其真实度接近Seedance2.0,但剧烈运动时的“AI感”依然明显。X平台用户daniel.dmai更尖锐指出:“当对比对象都是旧模型时,结果自然偏向更顺眼的选项,实际与Seedance2.0仍有差距。”这种分歧暴露出Elo盲测机制的双重性——虽能通过9000次真实用户选择反映偏好,但样本分布不均与潜在“刷榜”风险,使其难以全面评估高分辨率细节稳定性、长时间视频连贯性等实际应用指标。
HappyHorse的登场策略颇具深意。其命名暗合2026年农历马年,官方支持语言中普通话与粤语并列的细节,暗示亚洲团队背景。更关键的是,它选择绕过传统发布会模式,直接通过第三方榜单验证实力。这种路径与今年2月智谱AI的GLM-5(匿名上线时称Pony Alpha)如出一辙,揭示出资源有限但技术尖端的团队正通过“先盲测后发布”的策略重塑行业规则。150亿参数的规模虽不及Seedance2.0,但通过架构设计与评测场景的精准匹配,实现了“以小博大”的效果。
这场突袭对行业格局产生多维冲击。对开发者而言,若HappyHorse最终开源,将直接挑战闭源模型的商业模式——用户可绕过API付费体系进行自部署,边际成本随使用量增加而摊薄。业内普遍预期其费用可能仅为Seedance的一半,折射出专业群体对现有高成本压力的焦虑。但对已建立业务壁垒的即梦、可灵等平台而言,视频生成能力仅是电商直播、广告投放等场景中的插件,真正的护城河在于流量分配权与业务流闭环。HappyHorse能赢得盲测的第一眼惊艳,但进入真实生产流程仍需突破多重障碍。
技术迭代周期的缩短加剧了竞争残酷性。自去年9月以来,可灵2.5Turbo、Seedance2.0、SkyReelsV4等模型轮流登顶,几乎每月都有“新王”诞生。好耶科技创始人吴杰茜指出,视频大模型竞争是永不停歇的烧钱长跑,投入强度或迭代速度稍有松懈,用户便会转向更强模型。HappyHorse的崛起,短期让头部厂商承压,长期则抛出核心命题:在开源浪潮冲击下,闭源模型的定价权与壁垒是否比预期中更脆弱?当技术领先无法替代商业闭环,行业或将重新审视开源与闭源的路径选择。











