近期,国内AI大模型市场掀起新一轮价格波动,DeepSeek凭借连续降价策略引发行业关注。在多数企业选择提价应对成本压力的背景下,DeepSeek通过技术突破实现成本压缩,将百万Tokens输入价格最低降至0.025元,较初始定价下降97.5%。这一举动不仅打破行业涨价惯性,更将"价格战"推向新维度。
4月24日,DeepSeek同步推出V4-Pro与V4-flash双版本模型,参数规模分别达1.6T和284B,均支持百万级上下文窗口。定价策略呈现差异化特征:V4-Pro输入(缓存命中)原价1元/百万Tokens,输出价24元/百万Tokens;V4-flash对应价格仅为0.2元和2元。次日启动的限时优惠将V4-Pro输入价直接打至2.5折,并逐步将缓存命中场景价格永久性降至原价的1/10。至4月28日,优惠期限延长至5月31日,形成持续月余的低价窗口。
技术突破构成降价核心支撑。据技术白皮书披露,DeepSeek-V4采用新型注意力机制,通过Token维度压缩与DSA稀疏注意力技术,在保持长上下文处理能力的同时,将计算资源需求降低40%。华为昇腾950超节点的协同优化进一步释放硬件效能,官方预计下半年量产设备投入使用后,模型服务吞吐量将提升300%。这种软硬件协同创新模式,使单位推理成本较行业平均水平降低80%以上。
行业反应呈现分化态势。资本市场率先作出回应,DeepSeek降价次日,智谱、MiniMax等企业股价出现3%-5%的波动。但截至发稿,被调研的头部企业均未公布跟进降价计划。某云厂商技术负责人指出:"算力适配需要6-12个月周期,现有架构难以在短期内复制这种成本结构。"这种技术代差导致价格竞争出现阶段性断层,摩根士丹利报告显示,中国头部模型推理成本已降至美国同行的15%-20%,但工程效率优势尚未完全转化为市场优势。
价格博弈背后折射出战略路径差异。DeepSeek通过开源策略构建生态壁垒,其技术报告特别强调在英伟达GPU与昇腾NPU平台的双重验证,这种"双芯片适配"路线既降低供应链风险,又为国产化替代预留空间。与之形成对比的是,部分企业选择通过模型升级维持溢价能力,如MiniMax计划在M3模型迭代后启动价格上调,试图以性能优势对冲成本压力。
这场由技术驱动的价格变革正在重塑行业规则。猎豹移动CEO傅盛在实测后表示:"V4系列将国产模型性能提升至全球第二梯队,更重要的是验证了差异化发展路径的可行性。"文渊智库创始人王超则从产业周期角度分析:"当前处于算力成本小周期上升与技术创新大周期下降的交叉点,DeepSeek的突破预示着价格下行通道的开启。"随着5月31日优惠截止日临近,行业正密切观察是否会出现新一轮价格调整,这场没有硝烟的战争或将重新定义AI大模型的市场竞争法则。











