图:华为盘古大模型5.5发布现场。/大公报记者毛丽娟摄
【大公报讯】记者毛丽娟深圳报道:在6月20日下午举行的华为开发者大会2025(HDC 2025)上,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供澎湃算力;宣布盘古大模型5.5正式发布。张平安表示,盘古大模型基于昇腾云的全栈软硬件训练而成的,这标志着基于昇腾架构可以打造出世界一流大模型。
新一代昇腾AI云 算力增50%
华为云新一代昇腾AI云服务基于CloudMatrix 384超节点,首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s(每秒处理令牌数),同时,超节点还可以支持“一卡一算力任务”,将算力有效使用率(MFU)提升50%以上。
盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行升级,提升用户体验。例如,盘古提出了自适应快慢思考合一的技术,实现模型根据问题难易程度自适应地切换快慢思考,简单问题敏捷回复,复杂问题深度思考,整体模型推理效率提升8倍。