DeepSeek -V3.1让国产算力迎新机遇

0次浏览发布时间：2025-08-29 18:25:00

中经记者李昆昆李正豪北京报道

近日，DeepSeek正式发布了DeepSeek-V3.1，引发了业内关注。

DeepSeek方面称，本次升级包含以下主要变化：混合推理架构让一个模型同时支持思考模式与非思考模式；相比DeepSeek-R1-0528，DeepSeek-V3.1-Think能在更短时间内给出答案，让模型拥有更高的思考效率；通过Post-Training优化，让新模型有更强的Agent能力，在工具使用与智能体任务中的表现有较大提升。

据悉，官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮，实现思考模式与非思考模式的自由切换。

就此，速途研究院院长丁道师告诉《中国经营报》记者，这次版本的升级，性能更强大了，更好用了。但核心还不是这些升值，而是针对国产芯片的优化，这个才是重中之重。

性能升级

DeepSeek API也已同步升级，DeepSeek-chat对应非思考模式，DeepSeek-reasoner对应思考模式，且上下文均已扩展为128K。同时，API Beta接口支持了strict模式的Function Calling，以确保输出的Function满足schema定义。

另外，新版本增加了对Anthropic API格式的支持，可以轻松将DeepSeek-V3.1的能力接入Claude Code框架。

爱分析首席李喆告诉本报记者，V3.1版本融合了大语言模型和推理模型，做了Agent适配和国产芯片适配。整体来看，模型能力本身没有大提升，主要是工程化方面做了很多优化，更适合在模型之上开发各类应用。

丁道师认为，英伟达芯片不安全了，我们就要开启国产化了，在这个背景下，DeepSeek进行了这次大升级。“所以说要把这些背景全部结合起来看，才能一目了然看到这一次升级的本质，就是说现在我国大模型人工智能产业要实现自主可控，要不被美国的产品卡脖子，我们就需要在模型、芯片、算法等多个层面实现自主突破，这样就能理解此次DeepSeek的升级，以及华为芯片的升级之所以备受关注的原因所在了，这背后是整个国家战略的支撑。”

据了解，DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度，该模型与UE8M0FP8动态范围大，提升稳定性与效率，适配华为昇腾等芯片，实现“低卡高能”部署，带动全产业链发展。在政策推动下，其与昇腾组合切入关键领域，打破垄断，对国产算力及AI产业发展意义重大。

根据中研网预测，2025年中国AI算力市场达1200亿元。华西证券表示，DeepSeek-V3.1通过技术迭代带动芯片、服务器和云服务的联动优化。国产算力链条呈现出“外部受阻、内部加速”的格局，标志着中国大模型生态正在进入自主化与规模化并进的新阶段。

流量下滑

近日，硅谷顶级风投a16z发布了新一期的AI应用百大榜单。ChatGPT依旧稳坐第一，但这个宝座越来越不稳固了。Google的Gemini用户数已经追到它的一半，它俩现在是两大顶级的新一代人工智能平台。

马斯克的Grok靠着一款二次元虚拟伴侣Ani，硬是从0发展到2000万月活。DeepSeek在今年年初爆火后，月活跃用户出现下降，移动端下降了22%，网页端达到了40%。不过其他国产应用表现继续亮眼，移动端Top 50的应用中，预计有22款是由中国团队开发的应用。

在前20名里，阿里的夸克、字节的豆包、月之暗面的Kimi同时上榜。其中，Kimi作为新兴创业团队的一款产品，能和ChatGPT、Gemini这些巨头产品同台竞争，已经说明了国内用户对中文大模型的强烈需求。

“DeepSeek -V3.1的优势是继续降低了token使用量，降低使用成本。性能与效果层面，V3.1和其他基模无显著差异。后续各家基模能力上不会有特别大差别，大概率都围绕着如何降低使用成本、提升使用体验和输出稳定性方面进行不断优化。新一轮模型价格战要开始了。”李喆说。

DeepSeek-V3.1-Thinking在Aider编码测试中，拿下了76.3%的高分，远超Claude 4 Opus、Gemini 2.5 Pro（0325）。

第三方Artificial Analysis基准同样验证了DeepSeek-V3.1的强大实力，仅次于gpt-oss。在推理效率方面，V3.1也与OpenAI产品相当。

要论2024年国内最风光的AI明星，DeepSeek认第二，可能没人敢认第一。QuestMobile数据显示，去年一季度它的下载量冲到8111万次，相当于每16个中国人就有1人装了其APP，比当年微信刚出朋友圈还火。

不过，后来有第三方数据显示，DeepSeek用户使用率和官网流量回落。据第一财经报道，360集团创始人周鸿祎对此表示，DeepSeek官网流量下降是因为DeepSeek没有花心思，但现在很多第三方云服务上都有DeepSeek的服务，用了DeepSeek的大模型流量一直很高。在中国，许多公司包括360智能体的基座模型等都使用DeepSeek来改，相当于很多公司的“武器装备”都是DeepSeek提供的。

比如，Kimi K2就用了MOE架构，总参数1T，激活参数32B。另外，阿里巴巴通义千问发布新版Qwen3系列模型，包括2个MoE模型和6个dense模型，参数量从0.6B到235B。

（编辑：吴清审核：李正豪校对：颜京宁）