天博平台官网登录千亿、万亿参数大模型的孵化,推动智算基础设施加快建设,智能算力需求持续爆发。目前中国各地智算中心落地生花,不过也面临供需匹配不平衡、生态建构、节能降碳、商业落地等挑战。在2024中国算力大会上,与会专家对智算中心的发展提出建议。
中国信息通信研究院院长余晓晖在提到技术挑战时说,虽然已经建设了万卡,十万卡集群,但卡越多故障率越高,如何把万卡的能力发挥出来是非常大的挑战。另外一个大的挑战是算力芯片比较碎片化,目前存在几十种芯片,有不同的框架、不同的软件栈、不同的算子库,如何协同是当前要解决的问题。
对于中国各地上马智算中心的热潮,于英涛建议,结合发展实际,客观测算算力需求,统筹安排智算中心的布局;积极强化算力运营模式探索与创新,切实提高智算中心利用率,防止出现算力“空置、空转”。
本次算力大会上中国电信研究院发布的《智算产业发展研究报告(2024)》显示,截至2024年6月,中国已建和正在建设的智算中心超250个。围绕芯片、操作系统、计算框架等产业链关键技术不断突破,国产化能力稳步提升。
智算已经成为高科技角逐的主要赛道。中国各地加快打造自己的人工智能基础设施,北京、广东等多地提出2025年智算规模目标。
根据2023年发布的《算力基础设施高质量发展行动计划》,到2025年,中国算力规模超过300 EFLOPS,其中智能算力占比达到35%。中国工信部总工程师赵志国在算力大会上表示,将面向人工智能等新兴产业制定发展规划,建设一批智算中心,合理配置通算、智算、超算比例。
“万卡集群”指由一万张及以上计算加速卡组成的集群式高性能计算系统。《智算产业发展研究报告(2024)》显示,在中国,超万卡集群的智算中心已达十余个。在算力大会上,河南投资集团总经理朱红兵表示,河南将打造中部最大的万卡智算集群。
在算力大会上,华为携手伙伴展示了在算力、存力、运力、数字能源等领域创新产品和解决方案;联想展示了AI基础设施能力,包括服务器、存储、数据网络、软件及超融合、边缘计算等;浪潮信息发布了元脑企智EPAI一体机服务器,可以支持多种芯片、多种算法。
紫光股份董事长、新华三集团总裁兼CEO于英涛认为,要深化开放合作,持续构建国产算力协同突破的创新格局。要加快推进GPU的横向、纵向联接标准化,消除孤岛,实现集群式突破,积极推进软件生态标准统一化,更好地降低适配成本,赋能产业升级。
“AI经济的规模效应带来远超训练推理的算力需求,万卡乃至十万卡智算集群的算力组网、算电协同和低碳发展将成为创新方向。”中国移动通信集团公司副总经理李慧镝在算力大会上表示。
智能算力已成为算力增长最主要的驱动力。截至2024年6月,中国在用算力中心超过830万标准机架,算力规模达246 EFLOPS(EFLOPS是指每秒百亿亿次浮点运算)。中国通信标准化协会理事长闻库介绍,中国智能算力在算力总规模当中占比不断加大,智能算力的规模今年6月底超过76EFLOPS,比2023年6月底前增长65%。