发现商业评论 旗下
洞察商业 启迪未来

林俊旸离职后首谈AI:剖析千问技术弯路,展望智能体式思考新方向

   时间:2026-03-27 07:19 来源:快讯作者:冯璃月

林俊旸在离开阿里千问团队后首次公开发声,未对离职风波或个人去向作出回应,而是以一篇长文深入探讨了AI领域从“推理模型时代”向“智能体时代”的演进逻辑。

千问团队曾尝试将“思考模式”与“指令模式”整合到单一模型中,Qwen3便是这一思路的代表性成果。该模型引入混合思维框架,试图通过四阶段后训练流水线实现两种模式的动态平衡。然而,林俊旸坦言,这种融合面临本质性挑战:指令模式追求简洁高效,而思考模式需要深度探索,两者在数据分布和行为目标上的差异导致合并后的模型表现平庸——思考变得冗余犹豫,指令变得迟缓昂贵。尽管2025年下半年千问团队拆分了独立版本,但林俊旸认为,真正的突破应在于构建“推理力度连续光谱”,使模型能自适应调整思考深度。

行业对推理模型的探索已进入新阶段。OpenAI的o1和DeepSeek-R1验证了通过强化学习训练“先思考后回答”能力的可行性,其核心在于利用数学、代码等强反馈信号优化模型正确性。但林俊旸指出,当前研究重心正从“延长思考时间”转向“为行动而思考”。智能体式思维要求模型在与环境交互中动态修正计划,而非仅生成静态推理轨迹。例如,编程任务中,智能体需通过执行、调试、迭代逐步优化代码,而非一次性输出完整方案;工具调用需根据实时反馈调整策略,而非依赖预设函数库。

智能体时代的到来对技术栈提出全新要求。传统推理强化学习依赖静态评估环境,而智能体训练需构建包含工具服务器、模拟器、执行沙箱的闭环系统。林俊旸强调,环境设计已成为核心能力,其稳定性、真实性和反馈丰富度直接影响模型效能。例如,编程智能体若在训练中直接搜索答案而非自主推理,虽能提升短期指标,却会削弱实际解决问题的能力。多智能体协作框架逐渐兴起,通过编排者分配任务、领域专家处理细分问题、子智能体维护上下文隔离,实现复杂任务的高效分解与执行。

技术路径的分野已显现。Anthropic的Claude系列通过可控思维预算整合推理与工具使用,将编程质量和长周期任务作为首要目标;GLM-4.5则统一推理、编程与智能体能力,强调动态规划与跨轮次连贯性。林俊旸认为,这些实践揭示了未来方向:从训练单一模型转向训练智能体系统,竞争优势将源于环境构建、编排工程及闭环决策能力。例如,智能体需在部分可观测环境中处理噪声数据,在失败后修正策略而非重新规划,这些能力无法通过延长推理时间实现,而需通过与真实世界的交互迭代获得。

随着工具赋能的思维模式成为主流,AI研究正从“追求更长推理轨迹”转向“优化有效行动路径”。林俊旸的论述为行业提供了新视角:真正的智能不在于输出多少文字,而在于能否在复杂环境中持续产生实际价值。这一转变或将重新定义AI技术的评价体系与发展方向。

 
 
更多>同类内容
全站最新
热门内容