发现商业评论 旗下
洞察商业 启迪未来

DeepSeek-V4预览版开源上线:创新技术引领AI大模型进入百万上下文新阶段

   时间:2026-04-25 00:06 来源:快讯作者:苏婉清

深度求索公司近日宣布,其全新研发的DeepSeek-V4系列大模型预览版正式对外发布,并同步开源代码与模型权重。这一突破性成果标志着大模型技术正式进入百万级上下文处理的新纪元,为全球开发者社区提供了更具性价比的解决方案。

该系列模型通过创新设计的注意力机制,在Token维度实现高效压缩,结合DSA稀疏注意力技术,成功将计算资源需求降低30%的同时,支持处理长达百万字的上下文内容。模型架构包含两个版本:旗舰版DeepSeek-V4-Pro配备1.6万亿参数,在智能体交互、多领域知识储备及复杂推理任务中表现卓越;轻量版DeepSeek-V4-Flash则以更紧凑的参数量,提供接近专业版的推理效率,特别适合资源受限场景。

在权威基准测试中,DeepSeek-V4-Pro展现强劲实力:在智能体编程评测中超越Sonnet 4.5,交付质量接近Opus 4.6的非思考模式;世界知识测试得分领先所有开源模型,数学、STEM及竞赛级代码生成能力更与顶级闭源模型持平。其独特的双模式设计(非思考模式/思考模式)可灵活适配不同应用场景,1M上下文长度支持能力更突破现有技术边界。

配套的API服务已全面升级,兼容OpenAI ChatCompletions与Anthropic接口标准。开发者需注意,现有deepseek-chat与deepseek-reasoner接口将于2026年7月24日停止维护,建议及时迁移至新版本。此次开源包含完整技术文档,开发者可通过Hugging Face及ModelScope平台获取模型资源,这为中国AI技术生态建设树立了新的里程碑。

 
 
更多>同类内容
全站最新
热门内容