OpenAI再推开源模型被讽“无效更新”

2025-08-07 05:02:15大公报

字号: 放大; 标准

　　图：Meta创办人朱克伯格（左）和妻子普莉希拉．陈。\路透社

　　当地时间8月5日，OpenAI宣布推出两款全新开源模型。这是自2019年发布GPT-2以来，OpenAI再次释出开源模型。外界认为，近年来中国AI公司如DeepSeek、阿里巴巴等在开放AI领域发展迅猛，Meta近期又以重金挖走多位OpenAI研究人员，再加上新一代模型GPT-5迟迟未能面世，面对各方种种压力，OpenAI不得不被迫转型。公司CEO阿尔特曼早前坦言，在是否开源的问题上，OpenAI站在了“历史错误的一边”。

　　【大公报讯】OpenAI于8月5日推出两款开源模型，GPT-oss-120b和GPT-oss-20b，可在开源技术平台Hugging Face上免费下载。这也是OpenAI自2019年发布GPT-2以来，时隔6年再次释出开源模型。

　　不过，由于新模型在性能上未有质的飞跃，此次释出的两个开源模型也被网友戏称是“挤牙膏式无效更新”。

　　“AI幻觉”多未公开训练数据

　　根据科技媒体TechCrunch披露的技术数据，在多项测试中，GPT-oss-120b和GPT-oss-20b的表现均逊于OpenAI的o3和o4-mini模型。

　　此外，这两款新模型回答问题时出现“AI幻觉”的比例分别高达49%和53%，是o1模型（16%）的三倍多，也高于o4-mini模型（36%）。

　　虽然OpenAI并未透露用于训练新模型的数据，因此还未能达到完全“开源”的标准，但其自2022年发布聊天机器人ChatGPT并引发AI热潮以来，便对自家技术严格保密，此次发布开源模型可以说是一次巨大转变。

　　当被问及“为什么突然又开源”时，OpenAI称是为了“加速前沿研究，促进创新，并推动在广泛应用场景下实现更安全、更透明的AI开发”。

　　但外界认为，种种压力之下，OpenAI不得不作出改变。

　　中国开源模型的爆发式发展很难不触动OpenAI以及硅谷的神经。今年年初，中国AI初创公司深度求索（DeepSeek）释出震撼硅谷的开源模型R1，此后大批中国模型走上开源之路。

　　以阿里巴巴集团开发的AI模型Qwen为例，Qwen2.5去年在Hugging Face上的下载量甚至超过美科企巨头Meta旗下的Llama系列，成为全球下载量最多的开源模型。

　　在美国国内，自6月以来，Meta创办人朱克伯格对OpenAI展开大规模挖角，迄今已聘用其中至少10人，加入自家AI研发团队“超级智能实验室”。

　　中国开源AI领跑美业界难追

　　除外部压力，OpenAI自身也面临困境，其最新模型GPT-5已“难产”数月。为缓解外界焦虑，OpenAI只得一次次释出新产品。

　　分析指出，全球科企在AI方面的竞争已趋白热化，美国公司在开源模型方面已落后于中国同业。

　　全球知名AI基准测试机构Artificial Analysis发现，在排名前15的AI模型中，仅有5个为开源，且全部来自中国的AI公司。

　　随着开源AI浪潮席卷全球，业界预估，到2030年，先进AI模型的平均开发成本预计下降40%，令更多小企业能够负担得起。

　　8月4日，美国业界正式启动了一项名为“美国真正开源模型”（ATOM）的新计划，拟集中资源开发强大的AI开源模型。但有评论指出，这项计划虽然雄心勃勃，但仍存在人才缺失、协调不足和成本高昂等问题。

　　（综合报道）

OpenAI再推开源模型被讽“无效更新”

点击排行

分享到微信朋友圈×

﻿OpenAI再推开源模型 被讽“无效更新”

点击排行

分享到微信朋友圈×

OpenAI再推开源模型被讽“无效更新”