发现商业评论 旗下
洞察商业 启迪未来

蔡浩宇新加坡再出发:LPM 1.0突破AI视频局限,开启虚拟角色交互新纪元

   时间:2026-04-14 15:38 来源:天脉网作者:沈如风

在AI视频生成领域,一场关于“表演”的革命正悄然展开。当行业还在为提升画面质量而激烈竞争时,Anuttacon公司推出的LPM 1.0模型却另辟蹊径,将焦点转向了虚拟角色的交互能力与生命感,为AI视频生成开辟了新的赛道。

长久以来,AI视频生成领域一直面临着一个棘手的难题——“表演三难困境”。这一困境指的是在表现质量、实时推理和长程稳定性这三个方面难以同时达到理想状态。现有的模型虽然在短视频生成上表现出色,但一旦涉及长时间、实时的交互需求,便会暴露出诸多问题,如角色脸部特征骤变、身份不一致或动作不合理等。这些问题使得AI视频生成在更广泛的应用场景中受到限制。

然而,LPM 1.0的出现打破了这一僵局。该模型实现了真正意义上的“无限时长”视频生成,在官网上展示的45分钟视频demo令人惊叹。这一突破并非单纯依靠堆砌算力,而是得益于其独特的在线流式生成架构。通过分布匹配蒸馏的四阶段训练方式,LPM模型将一个170亿参数的大型扩散模型压缩成了“主干 - 精炼器”结构。主干网络负责稳定视频的粗略轨迹,精炼器则专注于还原高保真的表情细节。这种设计使得模型在内存占用恒定的情况下,能够维持近乎永恒的身份一致性。

除了无限时长的生成能力,LPM 1.0在交互性方面也有着显著的创新。它首次实现了全双工的音视频对话,能够同时处理两路音频流。一路是AI自身的话语,用于驱动口型同步;另一路是用户的话语,用于驱动实时反应。这使得AI能够根据用户的语气和停顿,像人类一样产生点头、挑眉等微表情,大大增强了虚拟角色的生命感和真实感。

Anuttacon公司的背后,站着米哈游的前任董事长蔡浩宇。作为米哈游的第一大股东,蔡浩宇将米哈游在游戏开发中积累的丰富经验带到了AI领域。米哈游的核心壁垒在于将“人类表演学”进行了数字工业化的解构,这种独特的基因在LPM 1.0中得到了充分体现。例如,该模型的“身份感知参考图像管线”不仅需要一张照片,还需要全局外观、多视角图像甚至是8类预定义的表情范例。相比于从海量无标注视频中提取特征,Anuttacon能够提供高度结构化的“表演逻辑”数据,如78种精细情感和超过5000个动作描述符。这种对美感和角色塑造的经验积累和极高品控标准,是通用短视频平台难以企及的。

在商业策略上,Anuttacon选择了完全不开源LPM 1.0模型。这一决策符合商业理性,因为该模型不仅是一套算法,更是一套完整的视觉引擎,在AI视频生成的虚拟角色细分领域具有巨大的商业价值。然而,实时生成视频对算力的消耗巨大,即使LPM经过了极致的优化,能在单GPU约0.35秒处理1秒的视频,但在大规模并发的实际应用场景中,硬件成本和运维压力依然不容小觑。

从应用场景来看,LPM的底层能力更适合对稳定性要求严苛的B端场景。虚拟主播、AI导师、客服等常见场景对长时间稳定性有刚需,LPM驱动的AI角色能够7天24小时运行,且无需昂贵的动捕设备成本,综合成本极具竞争力。若将LPM作为构建UGC平台的基础设施,还能降低内容创作的专业门槛,用户只需提供一张照片和一段话,AI即可完成所有的表演,为全新的互动媒体形式的诞生创造了条件。

LPM 1.0的出现,标志着AI视频生成领域进入了一个新的阶段。它不再局限于追求画面的逼真度,而是更加注重虚拟角色的交互能力和生命感。在这场关于“表演”的革命中,Anuttacon公司已经抢占了先机,而蔡浩宇的商业布局也正逐渐展现出其深远的影响。

 
 
更多>同类内容
全站最新
热门内容