过去一周的政经大事不少,对港股的影响也是落地有声。从周一美国新任总统特朗普正式上任,并迅速打响头炮:推出涉资5000亿美元的“星际之门”AI基建大计,到周五中国政府六部委联合印发《关于推动中长期资金入市工作的实施方案》,助力股市长远健康发展。尽管市场最为关注的加征关税、财政刺激计划等议题,仍在云里雾里,但中美两地市场,却在AI领域出现共振。如果“星际之门”开展顺利,而中国几大互联网巨头又同时加大AI的天量投资,相信对今年的港股市场而言,AI板块(从数据中心、算力到引用)将会出现一个百花齐放的局面。
在AI领域,中美的发展存在着一定的时间差,美国在前中国在后。去年美国大力投资AI算力、建大模型,今年则轮到中国急起直追。从去年底开始,内地的AI领域突然出现了一个个质变,让原先以为中国在AI大模型的研发已被美国“遥遥领先”的看法,出现了一些疑问。首先是字节跳动(抖音母公司)推出的豆包(AI聊天智能对话问答助手),在内地市场大受欢迎,上客量已跃至全球第二位。接着,由一家年轻初创公司幻方量化推出的AI大模型DeepSeek不鸣则已,一鸣惊人。上周一(20日)国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议,DeepSeek创始人梁文锋出现在8名发言人名单之中,令幻方量化的知名度更上一层楼。
在参加总理会议的同一天,DeepSeek在官微上,发布了新版本DeepSeek-R1,其性能对标OpenAI o1正式版。其中R1的32B和70B版本,性能超过OpenAI的GPT-4o,并逼近o1-mini。
DeepSeek开创新训练思路
根据业界的看法,自ChatGPT问世两年以来,DeepSeek R1是国产LLM大模型第一次追平了世界最强大模型的性能。OpenAI定义了大模型训练的四个阶段:预训练,监督微调,奖励建模,强化学习。自从OpenAI公布ChatGPT以来,大模型的训练大致按照这四步训练法。DeepSeek的惊艳之处,在于直接提出了一个全新的训练思路:去除或极端弱化第二个步骤(监督微调),直接跳至第四个步骤:强化学习。通俗来说,“监督微调”就是把人类的正确做题结果(问题+答案)用来调教大模型。而DeepSeek则不用人类知识去调教大模型,而是让AI自己和自己PK寻找变强的路径。
AI应用领域今年将展升浪
中国在AI芯片受制下,仍能够在大模型方面急起直追,不仅给国人带来希望之光,也让投资者更有信心去重估中资AI板块的价值。须知,首先要建立强大的AI大模型,才有力量推动AI在各方面的引用。另一方面,外媒称字节跳动今年已规划资本开支1500亿元人民币,其中很大一部分将集中于人工智能领域。此前,字节跳动已经是英伟达H20 AI芯片的最大买家,此次1500亿资本支出的主要受益方为寒武纪(A股上市公司)、华为以及英伟达。
周五市场所见,沉寂一段时间的AI应用板块,亦出现普升。如果去年底的升浪只是预演,今年随内地AI大模型能力的提升,AI应用领域将会有更好的表现。