国产大模型领域再添新突破。
4月24日上午,深度求索(DeepSeek)正式发布全新系列大模型DeepSeek-V4预览版,同步完成开源,并开放官网、App及API调用服务,标志着百万字超长上下文能力进入普惠阶段,为国内开源领域及大模型产业发展注入新动力。
受此消息影响,华丰科技(688629)、寒武纪(688256)、摩尔线程(688795)等概念股直线拉升。算力相关板块表现活跃,截至午间收盘,海光信息(688041)上涨9.61%,星华新材(301077)上涨15.67%,众合科技(000925)、日海智能(002313)均上涨10.05%,润和软件(300339)上涨6.72%。
迈入百万上下文普惠时代
据悉,DeepSeek-V4系列大模型的核心优势的是具备100万Token(约合75万字)的超长上下文处理能力。该系列通过结构创新实现性能突破,开创全新注意力机制,结合Token维度压缩与DSA稀疏注意力(DeepSeekSparse Attention)技术,在大幅降低计算与显存开销的同时,将百万上下文能力设为所有官方服务的标配,可轻松应对整本著作、大型代码库、百万字法律合同等超长文本处理场景。
DeepSeek-V4系列包含两个版本,以满足不同场景的使用需求。其中,DeepSeek-V4-Pro作为旗舰版本,性能可与顶级闭源模型比肩,在Agent能力、世界知识储备及推理性能方面表现突出;DeepSeek-V4-Flash定位为轻量高效的经济型版本,虽在世界知识储备上略逊于V4-Pro,但拥有接近的推理能力,且因模型参数和激活规模更小,能提供更快捷、低成本的API服务,可满足日常及轻量Agent场景的使用需求。
Agent能力的专项优化是本次发布的重点内容之一。目前,DeepSeek-V4已完成与Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品的适配优化,在代码生成、复杂PPT方案等文档处理任务上的表现得到显著提升。同时,两款模型均支持非思考模式与思考模式,用户可通过不同设置提升答案的准确性。
国产AI算力生态迎利好
业内人士表示,DeepSeek-V4预览版的上线与开源,不仅填补了国内开源大模型在百万上下文及高阶Agent能力上的短板,还通过双版本布局降低了超长上下文技术的使用门槛,将推动大模型在代码开发、文档处理、复杂推理等场景的规模化应用。
作为DeepSeek的下一代旗舰模型,DeepSeek-V4的硬件选择此前已成为行业关注的焦点。据报道,该模型打破了过往长期依赖英伟达(NVDA)芯片的格局,正式切换硬件方案,全面选用华为最新昇腾系列芯片作为核心算力底座。
对此,英伟达(NVDA)CEO黄仁勋曾在采访中直言,DeepSeek基于华为平台开发的新模型“对美国来说将是一个糟糕的结果”。他认为,一旦AI模型被优化为在中国硬件上表现最佳,美国芯片的竞争优势将受到严重冲击。
有专家认为,除技术突破外,DeepSeek-V4发布的更重要价值,在于推动中国AI算力生态实现从依赖进口到自主可控的关键跨越,这将为国产算力板块带来全链路利好,覆盖芯片、服务器、算力租赁(886050)等核心环节。
该人士预计,未来随着模型持续迭代、开源生态不断完善,国产AI与算力产业链将进一步协同发力,相关产业机遇值得持续关注。
