
Gartner 近期发布的 2024 年 CIO 和技术高管调研显示,超过 60% 的中国企业计划在未来 12 至 24 个月内部署生成式人工智能(GenAI)。由于中国企业倾向于在本地而非通过公有云部署 GenAI,目前的基础设施环境无法支持 GenAl 项目,这将推动中国企业数据中心的设计转型。
Gartner 研究总监张吟铃表示 :“由于安全和数据隐私方面的担忧以及监管要求,一些企业更倾向于在本地部署 GenAl 解决方案或微调大语言模型(LLM)。在本地部署 GenAl 对于数据中心来说并不仅仅是一个简单的托管需求,而是可能改变企业数据中心的战略,因为模型训练需要大规模的 GPU 集群。”
Gartner 定义了五种 GenAl 部署方法(见图 1)。根据企业选择的 GenAI 部署方法,中国的首席信息官(CIO)及基础设施和运营(I&O)领导者需要了解 GenAI 部署的影响以及如何采取行动。
图1:生成式人工智能部署的五种方法
中国的 CIO 及 I&O 领导者须为应对这一技术对数据中心的影响做好准备。
本地部署GenAI将迫使I&O领导者改变托管环境的设计方式
部署 GenAI 对数据中心的影响取决于所运行的工作负载类型,因为某些 GenAI 工作负载需要使用高端图形处理器(GPU)。由于中国市场上的高端 GPU 供应有限,I&O 领导者要在本地部署 GenAI 就需要改变托管环境的设计方式。
I&O 领导者无法独自解决供应短缺问题,必须与业务、AI 工程师和职能团队合作应对这一挑战。
部署大规模GPU集群需要改造并升级数据中心基础设施和设备
从零开始构建基础模型或微调模型需要部署大规模GPU 集群,这将对现有数据中心带来颠覆。因为 GenAI 模型的训练需要高吞吐量、低延迟和无损的基础设施。为了支持此类高性能计算集群,必须对网络、存储、电力供应和冷却系统进行升级。在某些情况下,需要对现有设施进行改造,以承载升级后的基础设施(见图 2)。
图2:大规模GPU集群对数据中心的影响