大公网

大公报电子版
首页 > 新闻 > 内地 > 正文

昇腾联动鲲鹏 打造超级“AI服务器”

2025-06-21 05:02:20大公报
字号
放大
标准
分享

  图:华为盘古大模型5.5发布现场。/大公报记者毛丽娟摄

  【大公报讯】记者毛丽娟深圳报道:在6月20日下午举行的华为开发者大会2025(HDC 2025)上,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供澎湃算力;宣布盘古大模型5.5正式发布。张平安表示,盘古大模型基于昇腾云的全栈软硬件训练而成的,这标志着基于昇腾架构可以打造出世界一流大模型。

  新一代昇腾AI云 算力增50%

  华为云新一代昇腾AI云服务基于CloudMatrix 384超节点,首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s(每秒处理令牌数),同时,超节点还可以支持“一卡一算力任务”,将算力有效使用率(MFU)提升50%以上。

  盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行升级,提升用户体验。例如,盘古提出了自适应快慢思考合一的技术,实现模型根据问题难易程度自适应地切换快慢思考,简单问题敏捷回复,复杂问题深度思考,整体模型推理效率提升8倍。

点击排行