DeepSeek如何成为巨人杀手？

2025-01-28 05:02:01大公报

　　测试表现

　　全面压倒

　　•1月20日正式发布的推理大模型DeepSeek-R1，经多位科技界权威人士测试，证实其在数学、编程和推理等关键领域的表现，能与OpenAI推出的号称“人类史上最强推理模型”的o1“掰手腕”，总体API调用成本却低95%左右。

　　硬件要求

　　1/8

　　•研发DeepSeek大模型只需2048块性能远低于H100与Blackwell的H800芯片，用时仅53天。全球AI第一梯队头部公司至少也要动用1.6万张以上GPU训练。

　　研发费用

　　•DeepSeek-V3模型以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元，而GPT-4o的约为1亿美元，使用25000个GPU芯片。

　　服务定价

　　便宜98%

　　•DeepSeek每百万个token的查询成本仅为0.14美元，而OpenAI的成本为7.50美元，成本降幅高达惊人的98%。大公报整理

﻿DeepSeek如何成为巨人杀手？