滚动资讯

DeepSeek V4上线：参数与上下文双突破，国产开源模型再掀性价比风暴

时间：2026-04-25 00:04 来源：快讯作者：顾雨柔

全球人工智能领域迎来重要进展——DeepSeek V4大模型正式上线预览版并同步开源，其核心突破在于通过技术重构将长上下文处理成本大幅降低，同时以1.6万亿参数规模刷新国产开源模型纪录。此次发布的V4系列包含DeepSeek-V4-Pro和DeepSeek-V4-Flash两款模型，均标配100万token上下文窗口，标志着长文本处理能力从高端功能转变为行业基础配置。

在技术架构层面，V4系列通过混合专家（MoE）模型实现参数规模与推理效率的平衡。V4-Pro总参数达1.6万亿，激活参数490亿；V4-Flash总参数2840亿，激活参数130亿。这种设计使得单个token实际调用的算力减少，但知识储备量显著提升。相较于前代V3.2模型，V4-Pro的参数量增长2.4倍，而激活参数增幅不足33%，体现了更高效的稀疏化门控网络设计。

长上下文处理能力是本次升级的核心亮点。行业此前主流上下文窗口为12.8万至25.6万token，谷歌Gemini模型曾以100万token窗口保持领先。V4系列将该能力作为全系标配，配合优化的注意力机制，使单token推理计算量较V3.2降低73%，KV缓存占用减少90%。这种突破使得处理百万级文本的成本大幅下降，为智能体（Agent）执行复杂任务提供技术支撑。

模型性能方面，V4-Pro-Max在HLE测试中取得37.7分，Apex Shortlist评分达90.2%，超越OpenAI、Anthropic等海外闭源模型。在编程任务Codeforces中，其Rating达到3206分，显示强大的逻辑推理能力。智能体能力测试中，V4在Terminal Bench 2.0（67.9%）和Toolathlon（51.8%）等工具调用场景表现突出，官方定位其使用体验优于Sonnet 4.5，交付质量接近Opus 4.6非思考模式。

定价策略凸显性价比优势。V4-Flash以每百万token输入1元、输出2元的价格成为行业最低，缓存命中后输入成本降至0.2元。V4-Pro定价12元/24元（输入/输出），虽受高端算力产能限制，但单位token性价比仍优于Qwen3.6-Max、GPT-5.4 Pro等旗舰模型。技术文档透露，随着华为昇腾950芯片下半年批量部署，Pro版本价格有望大幅下调。

技术文档详细披露了注意力机制的创新设计。V4采用压缩稀疏注意力（CSA）与重压缩注意力（HCA）交替使用的方案：CSA每4个token合并为摘要并筛选top-k相关项，HCA每128个token合并但保留稠密计算。配合滑动窗口处理局部依赖，形成"粗细结合、稀稠协同"的混合架构。这种设计使100万token上下文的推理成本仅相当于传统架构处理10万token的水平。

后训练方法引入"分化再统一"策略：先针对数学、代码、Agent等方向训练专家模型，再通过在策略蒸馏技术将多个专家能力整合到统一模型。为解决多教师模型加载的显存压力，开发团队将教师权重卸载至分布式存储，仅缓存最后一层隐藏状态，确保训练效率。智能体训练方面，DSec沙箱平台可同时管理数十万个训练实例，支持工具调用格式从JSON向XML的优化切换，减少转义错误并保留跨轮次推理痕迹。

硬件适配层面，V4在技术报告中首次将华为昇腾NPU与英伟达GPU并列作为验证平台。昇腾CANN团队确认将于发布当日进行V4模型的首发演示，寒武纪也完成基于vLLM框架的Day 0适配并开源代码。值得注意的是，V4的MoE专家权重采用FP4精度，与昇腾950PR芯片原生支持的精度格式完全匹配，为后续性能优化奠定基础。

更多>同类内容

DeepSeek-V4发布：华为昇腾助力，性能提升，价格亲民开启新篇章

DeepSeek在文章中表示，V4 开创了一种全新的注意力机制，在 token 维度进行压缩，结合 DSA 稀疏注意力（DeepSeekSparse Attention），实现了全球领先的长上下文能力，并且…

04-25

伊卡路斯冲刺港交所：60岁创始人郝庆军掌控超七成投票权履历丰富

04-24

国产算力产业链热度攀升科创50指数三连阳科创50ETF易方达周成交超70亿

04-24

实体店经营难题怎么破？刻睡赋能舱来助力，低成本盘活空间增收益

04-24

北汽新能源高层变动：张国富卸任刘观桥接棒完成工商变更

天眼查App显示，近日，北京新能源汽车股份有限公司发生工商变更，张国富卸任法定代表人、董事长，由刘观桥接任，同时，部分高管也发生变更。该公司成立于2009年10月，注册资本约150.6亿人民币，经营范围含生…

04-24

智电领航焕新启程标致携多款概念车亮相北京车展共赴出行新未来

神龙汽车有限公司副董事长、总经理吕海涛，标致品牌全球CEO阿兰•法维先后发表主旨演讲，全球首发了PeugeotConcept6狮锐和PeugeotConcept8琉明两款智电旗舰概念车，彰显了标致品牌加快电动…

04-24

伊卡路斯冲刺港交所：60岁创始人郝庆军掌控超七成投票权履历丰富

伊卡路斯的历史可追溯至2008年6月，当时公司的创始人、董事会主席兼非执行董事郝庆军于江苏省成立公司（约42岁时），并开始于中国开展车辆铰接系统业务。郝庆军于2015年5月至2019年1月担任凯博易控的执行…

04-24

珈凯生物冲刺北交所：田军等三实控人控股超七成，一致行动稳定性引关注

04-24

44亿资本易主：万达电影更名儒意，渠道与内容碰撞开启娱乐新篇章

04-24

SpaceX或进军GPU领域：1.75万亿美元IPO文件透露自研芯片新动向

04-24

雷军官宣小米YU7 GT 5月登场欧研携手宝马等车企团队打造高性能座驾

04-24

IEA《2026年全球能源回顾》：清洁能源崛起，全球能源转型迈入关键阶段

04-24

宁德时代麒麟凝聚态电池续航达1500公里，动力电池企业数量持续攀升

04-24

联盛化学2025年研发投入增长22.91% 聚焦前沿技术拓宽高附加值产品矩阵

04-24

自变量机器人革新架构推WALL-B，35天后搭载新模型机器人开启家庭服务之旅

自变量创始人兼CEO王潜、联合创始人兼CTO王昊全面解读了WALL-B的技术架构、数据策略和训练机制等，并宣布35天后搭载WALL-B的新一代机器人将首批入驻真实家庭，开启机器人服务家庭生活的成长之旅。为机…

04-24

点击查看更多 +

全站最新

宁德时代大股东裴振华减持5800万股完成套现超237亿引关注

“AIGC第一股”困境求变：李志飞砍业务裁中层，AI化转型能否破局？

AI赋能下iPhone优势凸显？CEO剖析苹果生态护城河奥秘

75岁烟台首富王伟修：万亿光模块巨头背后，财富跃升与隐忧并存

AI生图真假难分：“马斯克卖瑜伽裤”“库克换身份证” 图片信任危机来了？

泰禾集团人事变动：黄其森卸任董事长拟推举黄霄辉接任

热门内容

本栏最新

智电领航焕新启程标致携多款概念车亮相北京车展共赴出行新未来

伊卡路斯冲刺港交所：60岁创始人郝庆军掌控超七成投票权履历丰富

宁德时代麒麟凝聚态电池续航达1500公里，动力电池企业数量持续攀升

雷军北京车展官宣小米YU7 GT 5月发布近30万人围观多话题引爆热搜

雷军披露小米汽车新进展：24个月交付超65.5万，SU7锁单交付成绩亮眼

清华团队突破万量级比特资源纪录，“AI+量子”融合平台量智开物启航

发现者网 - 深度洞察行业动态引领市场先锋平台 - 发现商业评论旗下网站北京·通州天津·滨海山东·济南
发现者网（www.fxw.com.cn）所有稿件免费开放转载，转载请务必保留版权。
合作微信：netspread（注明:发现者网）
Copyright © FXW 2012-2023 www.fxw.com.cn All rights reserved. 鲁ICP备2022032383号-3 鲁公网安备37010202700500号