沧海桑田/国产大模型急起直追中资AI板块价值重估\倪相仁

2025-01-26 05:01:39大公报

字号: 放大; 标准

　　过去一周的政经大事不少，对港股的影响也是落地有声。从周一美国新任总统特朗普正式上任，并迅速打响头炮：推出涉资5000亿美元的“星际之门”AI基建大计，到周五中国政府六部委联合印发《关于推动中长期资金入市工作的实施方案》，助力股市长远健康发展。尽管市场最为关注的加征关税、财政刺激计划等议题，仍在云里雾里，但中美两地市场，却在AI领域出现共振。如果“星际之门”开展顺利，而中国几大互联网巨头又同时加大AI的天量投资，相信对今年的港股市场而言，AI板块（从数据中心、算力到引用）将会出现一个百花齐放的局面。

　　在AI领域，中美的发展存在着一定的时间差，美国在前中国在后。去年美国大力投资AI算力、建大模型，今年则轮到中国急起直追。从去年底开始，内地的AI领域突然出现了一个个质变，让原先以为中国在AI大模型的研发已被美国“遥遥领先”的看法，出现了一些疑问。首先是字节跳动（抖音母公司）推出的豆包（AI聊天智能对话问答助手），在内地市场大受欢迎，上客量已跃至全球第二位。接着，由一家年轻初创公司幻方量化推出的AI大模型DeepSeek不鸣则已，一鸣惊人。上周一（20日）国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会，听取对《政府工作报告（征求意见稿）》的意见建议，DeepSeek创始人梁文锋出现在8名发言人名单之中，令幻方量化的知名度更上一层楼。

　　在参加总理会议的同一天，DeepSeek在官微上，发布了新版本DeepSeek-R1，其性能对标OpenAI o1正式版。其中R1的32B和70B版本，性能超过OpenAI的GPT-4o，并逼近o1-mini。

　　DeepSeek开创新训练思路

　　根据业界的看法，自ChatGPT问世两年以来，DeepSeek R1是国产LLM大模型第一次追平了世界最强大模型的性能。OpenAI定义了大模型训练的四个阶段：预训练，监督微调，奖励建模，强化学习。自从OpenAI公布ChatGPT以来，大模型的训练大致按照这四步训练法。DeepSeek的惊艳之处，在于直接提出了一个全新的训练思路：去除或极端弱化第二个步骤（监督微调），直接跳至第四个步骤：强化学习。通俗来说，“监督微调”就是把人类的正确做题结果（问题＋答案）用来调教大模型。而DeepSeek则不用人类知识去调教大模型，而是让AI自己和自己PK寻找变强的路径。

　　AI应用领域今年将展升浪

　　中国在AI芯片受制下，仍能够在大模型方面急起直追，不仅给国人带来希望之光，也让投资者更有信心去重估中资AI板块的价值。须知，首先要建立强大的AI大模型，才有力量推动AI在各方面的引用。另一方面，外媒称字节跳动今年已规划资本开支1500亿元人民币，其中很大一部分将集中于人工智能领域。此前，字节跳动已经是英伟达H20 AI芯片的最大买家，此次1500亿资本支出的主要受益方为寒武纪（A股上市公司）、华为以及英伟达。

　　周五市场所见，沉寂一段时间的AI应用板块，亦出现普升。如果去年底的升浪只是预演，今年随内地AI大模型能力的提升，AI应用领域将会有更好的表现。

沧海桑田/国产大模型急起直追中资AI板块价值重估\倪相仁

点击排行

分享到微信朋友圈×

﻿沧海桑田/国产大模型急起直追 中资AI板块价值重估\倪相仁

点击排行

分享到微信朋友圈×

沧海桑田/国产大模型急起直追中资AI板块价值重估\倪相仁