DeepSeek大模型上新关联下代中国芯

2025-08-22 05:02:31大公报

字号: 放大; 标准

　　【大公报讯】据中通社报道：中国人工智能（AI）公司深度求索（DeepSeek）21日宣布，其最新大语言模型DeepSeek-V3.1正式发布。

　　据DeepSeek介绍，新升级版本变化体现在三方面：混合推理架构、更高的思考效率、更强的Agent（智能体）能力。通过“深度思考”按钮切换，DeepSeek-V3.1实现一个模型同时支持两种模式：面对简单问题时，能以“非思考模式”快速回答。处理复杂问题时，可切换到“思考模式”，给出更具深度和逻辑的解答。此外，DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。DeepSeek官方公众号在其文章置顶留言里说，UE8M0 FP8是针对即将发布的下一代中国产芯片设计。

　　官方数据显示，与今年5月发布的旗舰推理模型DeepSeek R1升级版本“R1-0528”相比，DeepSeek-V3.1在思考模式下效率大幅提升，能在更短时间给出答案，token（大模型文本处理的最小单位）消耗量可减少20%至50%，各项任务平均表现与R1-0528持平。

DeepSeek大模型上新关联下代中国芯

点击排行

分享到微信朋友圈×

﻿DeepSeek大模型上新 关联下代中国芯

点击排行

分享到微信朋友圈×

DeepSeek大模型上新关联下代中国芯