河北慧日信息技术有限公司

数据中心如何演进为高上架率智算中心?

更新时间:2024年09月25日  2458浏览

据不完全统计,国产大模型数量目前已超过200个,覆盖多个行业领域,应用场景不断拓展。国家互联网信息办公室最新公布的数据显示,截至今年3月,我国共有117个生成式人工智能服务完成备案。

目前,我国大模型数量不断增加,且应用不断加速,这需要海量智算的支撑。受需求影响,我国智算规模持续扩大,据中国信通院,截至2023年底,我国算力规模达到230EFLOPS,其中智能计算占比近30%,规模约69 EFLOPS,相较于2023年6月的50EFLOPS,半年时间规模增加38%。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

伴随智算的快速发展,数据中心也从主要提供通用算力转向提供智算,数据中心向智算中心演进。对企业而言,这意味着巨大的产业机遇,但同时,也有着实际的挑战需要面对。

一是数据中心提供智算并非简单用GPU服务器替换原有服务器,从基础设施上来看,供电、散热、楼层承重等都有可能因此改变,需要进行一系列的优化;一是市场竞争越发激烈,智算中心规模正快速增加,据中国IDC圈不完全统计,截止2024年5月23日,中国大陆已有智算中心283座,目前超过一半(53%,150座)智算中心都处于开工/在建状态(点击了解《283座智算中心的区域分布和规模详情》)。在高涨的智算需求下,可以预见,未来还将建设更多智算中心,如何受到市场认可,提升上架率等问题也摆在企业面前。


智算中心项目整体建设进展

具体来看,数据中心向智算中心演进,其基本的区别在于智算中心搭载的主要是GPU,服务对象主要是人工智能应用,而GPU的功率较高,这就需要适配一整套软硬件设施

如供配电方面,高功率设备需要更大的电流和更高的电压来保证其正常运行,这就要求供配电系统具备足够的容量和稳定性,可能需要优化原有设备。

散热方面高功率对于制冷提出了更高的要求,传统风冷有其散热极限,制冷更高效率的液冷被公认为是智算标配,据《中国液冷数据中心市场深度研究报告》,单机柜密度<20KW,采用风冷可满足散热需求;单机柜密度≥20KW便需要采用液冷技术。

运维方面液冷的应用及供配电等方面的改变会对运维造成较大影响,如液冷与风冷运维方式有较大差异,需要专业人才的检查维护。

除此之外,大量数据的传输、存储,还需要高效传输网络、先进存储的支撑,同样也需要进行在硬件上进行革新,以提升网络带宽、提高存储效率。硬件的应用也不能孤立进行,所有的硬件革新均需要软件层面的适配,以实现更高效的资源利用,提升整体性能。

数据中心向智算中心演进,需要绿色安全、普惠易用,这样才能在符合政策要求下,提升市场竞争力。

绿色方面数据中心是高能耗产业,“双碳”目标下,绿色化是数据中心发展的必然趋势,能耗效率不过关的数据中心正逐步改建、腾退,在数据中心向智算中心演进的过程中,节能低碳将实现进一步发展。

国家也正通过“东数西算”工程等来加快绿色发展,各地方也在限定PUE等一系列举措来推进,以北京市2023年12月发布的地方标准《数据中心能源效率限额》为例,相较于2019年第一次修订后的标准,PUE限定值从1.4降为1.35,先进值从1.2降为1.15。准入值不仅从原来的1.3有所降低,还更为细化,年能耗≤2万吨标煤的PUE准入值为1.25,年能耗>2万吨标煤的PUE准入值为1.2,

由此可见,只有绿色低碳的智算中心才符合政策标准,实现可持续发展。从行业来看,提升绿电使用比例、促进储能发展,提升液冷应用等,均是推动智算中心绿色化的重要举措,目前也已经在被逐步应用。

安全方面智算中心是指通过使用大规模异构算力资源,包括通用算力和智能算力,主要为人工智能应用提供所需算力、数据和算法的设施。

在提供算力、数据、算法的过程中存在数据、网络与设备安全隐患等问题,需要加强通信网络安全防护管理,提升网络安全防护能力水平,创新数据中心灾备建设,加强网络稳定性监测,确保数据传输安全,建立健全算力网安全风险研判、防控协同、防范化解机制等

普惠易用方面即智算成本低廉,且便于用户使用,这是获得更大市场的必要条件。

目前来看,想要实现这一点,需要从多方面入手,从企业自身出发,可以通过应用液冷技术、优化建设布局,运用智能运维等提升算力有效供给。如在用电成本较低的地区建设智算中心。用电占据着数据中心运营过程中的主要成本,智算中心同样如此,如果用电投入减少,算力成本也就降低,能投推动算力的应用,提升上架率。从地理位置上来看,我国西部地区在电价上有较大优势,伴随着“东数西算”工程的启动与深入,西部枢纽智算中心建设正在加快,目前项目数量已达到56个(点击了解《283座智算中心的区域分布和规模详情》),将有效推动智算成本的降低。


图:智算中心东西部地域投资额和算力规模

从行业出发,算力调度的优化、算力券的发布等都是降低智算成本的有效举措,而这需要多主体共同协作,包括政府部门、算力服务方、算力调度方、算力用户等,这能够积极促进智算消纳,形成良好的供需关系,提升智算中心的上架率,实现智算的即需即取。

综合来看,大模型等人工智能快速发展下,数据中心加速向智算中心演进,这其中有着巨大的机遇,但也有着诸多挑战,企业想要从中获益,需要清晰的了解数据中心与智算中心的区别,明确如何进行优化革新,同时还要积极响应政策,推动智算中心的绿色安全、普惠易用,以提升自身竞争力,推动智算的有效供给。

文章来源:中国IDC圈



微信扫码关注

Tel  :400-0311-765

Add:石家庄市高新区物联网大厦一层