DeepSeek创始人梁文锋明确否认使用OpenAI模型输出训练

2025-09-19 05:02:44大公报

字号: 放大; 标准

　　据中通社报道：由DeepSeek团队研发、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文，近日荣登国际权威期刊《自然（Nature）》封面。这是全球首个经过同行评审的主流大语言模型，填补了业内空白。

　　综合媒体18日消息，《自然》评价指：“目前几乎所有主流大模型尚未经过独立同行评审，这一空白终于被DeepSeek打破。”相较今年1月发布的初版论文，新论文披露了更多模型训练细节，并正面回应了模型发布初期的质疑。

　　使用的数据全部来自互联网

　　在同行评议过程中，DeepSeek团队根据评审意见减少了对模型的拟人化描述，并增加了模型训练的技术细节说明，包括模型训练数据类型和安全性考虑等，并回应了此前关于知识蒸馏的质疑。

　　DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中，DeepSeek介绍，DeepSeek-V3 Base（DeepSeek-R1的基座模型）使用的数据全部来自互联网，虽然可能包含GPT-4生成的结果，但绝非有意而为之，更没有专门的蒸馏环节。

DeepSeek创始人梁文锋明确否认使用OpenAI模型输出训练

相关内容

点击排行

分享到微信朋友圈×

﻿DeepSeek创始人梁文锋明确否认使用OpenAI模型输出训练

相关内容

点击排行

分享到微信朋友圈×

DeepSeek创始人梁文锋明确否认使用OpenAI模型输出训练