大公网

大公报电子版
首页 > 新闻 > 两岸 > 正文

DeepSeek大模型上新 关联下代中国芯

2025-08-22 05:02:31大公报
字号
放大
标准
分享

  【大公报讯】据中通社报道:中国人工智能(AI)公司深度求索(DeepSeek)21日宣布,其最新大语言模型DeepSeek-V3.1正式发布。

  据DeepSeek介绍,新升级版本变化体现在三方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。通过“深度思考”按钮切换,DeepSeek-V3.1实现一个模型同时支持两种模式:面对简单问题时,能以“非思考模式”快速回答。处理复杂问题时,可切换到“思考模式”,给出更具深度和逻辑的解答。此外,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。DeepSeek官方公众号在其文章置顶留言里说,UE8M0 FP8是针对即将发布的下一代中国产芯片设计。

  官方数据显示,与今年5月发布的旗舰推理模型DeepSeek R1升级版本“R1-0528”相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间给出答案,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务平均表现与R1-0528持平。

点击排行