大公网

大公报电子版
首页 > 简体站 > 报纸新闻 > 正文

DeepSeek如何成为巨人杀手?

2025-01-28 05:02:01大公报
字号
放大
标准
分享

  测试表现

  全面压倒

  •1月20日正式发布的推理大模型DeepSeek-R1,经多位科技界权威人士测试,证实其在数学、编程和推理等关键领域的表现,能与OpenAI推出的号称“人类史上最强推理模型”的o1“掰手腕”,总体API调用成本却低95%左右。

  硬件要求

  1/8

  •研发DeepSeek大模型只需2048块性能远低于H100与Blackwell的H800芯片,用时仅53天。全球AI第一梯队头部公司至少也要动用1.6万张以上GPU训练。

  研发费用

  5%

  •DeepSeek-V3模型以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元,而GPT-4o的约为1亿美元,使用25000个GPU芯片。

  服务定价

  便宜98%

  •DeepSeek每百万个token的查询成本仅为0.14美元,而OpenAI的成本为7.50美元,成本降幅高达惊人的98%。 大公报整理

点击排行