大公网

大公报电子版
首页 > 新闻 > 内地 > 正文

DeepSeek创始人梁文锋明确否认使用OpenAI模型输出训练

2025-09-19 05:02:44大公报
字号
放大
标准
分享

  据中通社报道:由DeepSeek团队研发、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,近日荣登国际权威期刊《自然(Nature)》封面。这是全球首个经过同行评审的主流大语言模型,填补了业内空白。

  综合媒体18日消息,《自然》评价指:“目前几乎所有主流大模型尚未经过独立同行评审,这一空白终于被DeepSeek打破。”相较今年1月发布的初版论文,新论文披露了更多模型训练细节,并正面回应了模型发布初期的质疑。

  使用的数据全部来自互联网

  在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。

  DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。

相关内容

点击排行