AI基础设施新版图:稀缺性如何重塑全球创新格局
全球AI基础设施正经历一场深刻变革,由于算力稀缺与成本攀升,印度、非洲、巴西、阿联酋等新兴市场正摆脱对传统科技中心的依赖,积极构建自主可控的本地化AI生态系统。
印度、巴西、阿联酋和非洲等地正涌现新的AI基础设施,其本地化技术栈旨在克服算力稀缺的挑战。
Dizzaract创始人兼首席执行官伊尔曼·沙扎耶夫(Ilman Shazhaev)指出,该公司是一家总部位于阿布扎比的AI与游戏基础设施公司。
多年来,业界普遍认为,重量级人工智能基础设施建设将集中在超大规模云计算、开发者密度和资本已高度集中的区域,如硅谷、西雅图、伦敦等少数几个科技中心。
这种地理集中并非偶然。大规模训练和部署AI需要数据中心、算力、网络容量、能源以及先进的基础设施。随着时间推移,这种依赖性固化了市场集中度。目前,亚马逊、微软和谷歌三巨头几乎占据了全球企业云基础设施支出的三分之二。
然而,过去的逻辑正在失效。算力正变得日益昂贵、能耗密集,且除了少数主导供应商外,获取难度也越来越大。建设者们开始直面一系列关键问题:电力供应如何保障?芯片能否顺利运抵特定司法管辖区?数据一旦转移,将受何种法律管辖?
如今,这些问题的答案正越来越多地在硅谷以外的地区被发现。
在成熟的云计算市场中,应对日益增长的AI需求的传统方式是:通过签订更大规模的云合同、建设更密集的数据中心,以及进一步深化对现有集中式技术栈的依赖来增加容量。
数据中心在2024年消耗了全球约1.5%的电力,这使得能源成为AI基础设施的关键压力点之一。预计到2030年,这一比例将升至接近3%,届时,算力将难以再被视为AI产品背后的“隐形层”。
建设者们通常无法将算力获取、电力供应和分发视为无关紧要的问题;他们必须将其纳入设计考量。
在广大的发展中世界,这种压力往往是起点。那里的建设者们几乎从未有过将算力接入、电力和分发视为他人问题的选择;他们从一开始就必须为之设计。因此,重要的AI基础设施如今正兴建于那些将稀缺性视为设计核心挑战而非事后考量的地区。
AI基础设施的全球新中心
这一趋势在四个地区尤为明显。在印度,Yotta Data Services公司在其Shakti Cloud上部署了超过16,000块英伟达H100图形处理器,并计划进一步扩充。印度AI国家使命——一项旨在构建本土基础模型的政府计划——超过一半的算力都运行在Yotta的硬件上。今年早些时候,多语言平台Bhashini从海外超大规模云服务商迁移至Shakti Cloud。Bhashini支持11种印度语言的实时翻译,而其背后原因在于,他们认为无法自主掌控的基础设施是不可接受的。
在非洲,由津巴布韦企业家斯特莱夫·马西伊瓦(Strive Masiyiwa)创立的Cassava Technologies公司,正在南非、埃及、肯尼亚、摩洛哥和尼日利亚的数据中心部署12,000块英伟达GPU。Cassava是非洲大陆首个英伟达云合作伙伴;在此次建设之前,英伟达估计其在非洲大陆安装的GPU数量仅为80块左右。这里的限制不仅是价格,更是先进芯片的匮乏。Cassava的应对方案是构建一个运行在自有光纤骨干网上的泛非洲网络,确保非洲的初创企业、研究人员和政府无需再通过欧洲或美国来训练和部署AI。
新的版图将在那些学会了在算力昂贵且具战略意义、技术栈控制权至关重要的地方进行建设的区域绘制。
在巴西,政府的“SoberanIA”项目为皮奥伊(Piauí)州的一家主权AI工厂预留了500兆瓦电力,该工厂将完全由可再生能源供电。Scala Data Centers是其主要的基建合作伙伴。巴西承诺在未来十年内吸引高达3700亿美元的数据中心投资,并为100%采用可再生能源的项目提供税收激励。目前,约65%的巴西数据仍储存在海外。巴西的策略是,其丰富的水电和太阳能资源将为主权算力提供一个比那些数据中心电力仍严重依赖天然气或煤炭的市场更清洁的起点。
阿联酋则选择了成本最高的路径。G42集团旗下的Core42公司提供基于英伟达和高通芯片混合架构的推理算力服务。此外,阿联酋与美国合作,承诺建设一个占地10平方英里、拥有5吉瓦电力容量的AI园区,预计将在本十年末部分投入运营。阿联酋的策略直接明了:那些渴望实现主权AI但无法自行构建底层技术栈的国家,可以从一个友好的政府那里租赁服务。这是一种深思熟虑的垂直整合策略——一次性掌握芯片、电力、数据中心和对外关系。
所有这些项目都基于一个共同的初始假设:算力获取、电力、土地和芯片供应是首要的设计问题,而非外部因素。这一假设催生了截然不同的基础设施格局。
训练大型模型仍需依赖密集的算力集群、庞大的资本投入和先进芯片的获取。这类工作短期内不太可能离开超大规模设施。
然而,推理(Inference)则有所不同。模型被客户、设备、代理和企业系统持续调用。有分析预计,到2030年,推理算力将在AI数据中心中超越训练算力,届时将占据AI总算力的一半以上,并构成数据中心需求的约30%至40%。
对于推理而言,核心问题在于算力应部署何处、响应速度如何、工作负载如何可靠地路由,以及何种法律管辖数据。这些问题具有深远的地理影响,超大规模集中式架构难以有效应对,尤其对于数十亿居住在难以享受到美国或欧洲数据中心低延迟服务的人群而言。
推理需求所驱动的算力网络远超单一超大规模云所能提供。分布式GPU容量、区域性推理集群、主权云以及孟买、内罗毕、圣保罗和阿布扎比等地新兴的“新云”(neocloud),并非超大规模云的替代品——它们是超大规模云自身无法有效服务的补充层。
过去,AI基础设施的版图围绕着云容量已高度集中的区域展开。当算力廉价且充裕时,这张版图是合理的。然而,新的版图将呈现出截然不同的面貌。它将围绕那些在算力昂贵且具有战略意义、技术栈控制权更为重要的背景下学会构建基础设施的地区而绘制。那些正在勾勒新版图的企业和政府并非在追赶硅谷;他们之所以能先行一步,是因为他们不得不如此。