在AI技术快速迭代的浪潮中,曾经以GPU研发为核心竞争力的行业格局正经历深刻变革。2024年初,壁仞科技联合创始人徐凌杰宣布离开GPU赛道,转而创立魔形智能,将目光投向"AI Token Factory"这一新兴领域。这一决策在当时引发诸多猜测,但随着2026年OpenClaw、Seedance等应用的普及,"Token经济学"迅速成为行业焦点,验证了其前瞻性判断。
徐凌杰的转型并非偶然。这位曾在英伟达、AMD、三星北美研究院担任要职,并主导阿里云智能事业群业务的技术专家,在2024年1月离职信中写下"AGI is calling,江湖再见"的宣言。彼时壁仞科技正迎来产品量产与上市辅导的关键期,其选择在此时离开引发外界关注。面对质疑,徐凌杰在上海漕河泾开发区的办公室中解释道:"40岁是人生黄金期,当看到Token技术浪潮即将到来,必须抓住精力最充沛的这几年。"
推动其决策的两个关键事件发生在2024年:英伟达在GTC大会上发布的GB200 NVL72超节点系统,集成了36个Grace CPU与72个Blackwell GPU,重量达3000磅;同年5月开源模型DeepSeek V2通过MoE架构创新,将推理成本降低至行业水平的4%。这两项突破分别代表了算力供给的极致化与模型效率的革命性提升,使Token的工业化生产成为可能。徐凌杰回忆道:"当看到超节点与开源模型的组合时,我们意识到这就是市场需要的解决方案。"
行业数据印证了这种转型的必要性。2026年3月,中国Token日均调用量突破140万亿次,较前一年增长300%。东吴证券研报指出,算力租赁厂商正从裸算力出租向模型服务或Token分成模式转型,但面临硬件获取、运营效率与资金周转三大挑战。魔形智能的解决方案在于其跨领域团队配置:徐凌杰的硬件背景与联合创始人金琛(前Graphcore中国工程副总裁)的模型优化经验形成互补,这种组合在AI Infra领域具有稀缺性。
在技术实现路径上,魔形智能采取"超节点+软硬协同"策略。徐凌杰以服务器稳定性为例说明其优势:"meta训练Llama 3时,1.6万块H100集群每3小时中断一次,而自研服务器可降低故障率90%。"这种设计使模型训练效率显著提升。对于衡量标准,他提出"电力-Token转化率"概念:"未来评估Token工厂的核心指标是单位电力产生的Token数量,这类似数据中心评估中的每瓦性能指标。"
面对"电力出海"的热门概念,徐凌杰保持审慎态度。他指出当前Token成本中电力占比不足10%,算力成本才是核心:"中国算力供给尚未自给自足,谈电力出口为时尚早。未来随着国产芯片水平提升,这种模式可能成立,但当前首要任务是优化现有成本结构。"这种务实态度体现在其商业策略中——通过与算力中心合作获取硬件资源,而非自建数据中心,以降低初期投入风险。
在竞争格局方面,徐凌杰认为AI Infra市场仍处于早期阶段。他以芯片行业类比:"2020年芯片公司认为市场已饱和,但2021年仍涌现大量优质企业。AI Infra的市场规模将超过芯片领域,当前资本投入远未达到饱和点。"这种判断支撑着魔形智能的扩张策略,其近期完成的新一轮融资将用于超节点技术研发与全球市场布局。












