首页 小说推荐 实时讯息 百科知识 范文大全 经典语录
当前位置: 首页 > 实时讯息 >

公共智算中心再不转型,会成为“一堆昂贵的废铁”?

0次浏览     发布时间:2025-04-03 10:41:00    

图片


图片


当推理算力激增,训练算力市场有限,公共算力市场开始出现碎片化趋势。投资规模堪比“吞金兽”的公共智算中心需要转型

文 |《财经》特约撰稿人 周源

编辑 | 谢丽容

在人工智能技术驱动下,智算中心作为一种新的数字基础设施应运而生。所谓智算中心,即提供智能算力、用于人工智能大模型训练与推理的数据中心。

过去三年,全国各地兴起智算中心建设热潮。中国电信研究院《智算产业发展研究报告(2024)》显示,截至2024年6月,中国已建和正在建设的智算中心超250个。

相对于传统的数据中心,智算中心是典型的吞金兽,硬件投入高昂。智算服务器配置多块高性能GPU/NPU板卡,单价可达传统服务器的数十倍(如单台价格约100万-400万元)。并且,智算服务器功耗远超传统设备,配套制冷与供电系统建设成本高,长期运维费用占比大。一台中等规模(约500台服务器)智算中心的建设成本大约为20亿至30亿元人民币。

据不完全统计,中国智算中心相关投资累计已经超过千亿元人民币。工信部数据显示,截至2024年底,中国算力总规模达280EFLOPS(每秒百亿亿次浮点运算,以FP32单精度计算),排名全球第二,其中智能算规模达90EFLOPS(FP32),占比达32%。

硬币的另一面是智算中心的利用率问题。部分公共智算中心因规划不足,导致算力利用率低,资源闲置。多位行业人士向《财经》表示,当下国内智算中心闲置情况比较严重。

如何提升公共智算中心使用效率是一个现实问题。今年3月底,《财经》调研位于甘肃庆阳的燧弘华创绿色智算中心,该智算中心超2万PFLOPS(千万亿次浮点运算/秒,以下简称P)),在国内属于大规模智算中心。服务阿里云、百度、智浦AI等用户,属于“真正用起来的”智算中心。

调研发现,DeepSeek为闲置智算中心带来希望,但公共智算中心亟需转型,才能接住来自千行百业的AI推理算力需求。

图片

庆阳模式

2022年,中国启动“东数西算”工程,计划在京津冀、长三角、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。与“西电东送”、“南水北调”等工程相似,“东数西算”是一个国家级算力资源跨域调配的战略工程。
在甘肃,能源资源丰富、地理位置有优势的庆阳市抓住机会,成为“东数西算”八大国家算力枢纽之一,庆阳这座原本以农产品为特色的西部小城,现在的目标是打造“中国算谷”。
截至2024年底,庆阳已建成投运智算中心6个,投入运行机架3.1万个,算力规模超过5万P,园区绿电供给超80%,成为全国八大枢纽节点中增量最大、增速最快的数据中心集群。
燧弘华创是弘信电子(股票代码300657)的全资子公司。2023年8月,燧弘华创与庆阳相关政府机构达成合作协议,成为首家入驻庆阳的数据中心企业,当时庆阳算力枢纽的算力为0。

燧弘华创绿色智算中心 图片来源:联想

通过与联想、燧原科技等合作伙伴的协同创新,燧弘华创在2023年12月底就搭建起一个算力超过1000P的万卡燧原集群,这也是国内第一个国产万卡算力集群。目前,燧弘华创庆阳智算中心已经超过2万P。公开资料显示,阿里云、腾讯云、百川智能、智谱AI、百度等国内典型人工智能企业都是其客户。
但事实上,这个智算中心非常年轻。燧弘华创是一家成立仅两年不到的新公司,母公司弘信电子将其作为向AI转型的抓手(弘信电子主营业务为柔性电子)。燧弘华创执行总裁唐峰在今年3月底的一次对外交流中自称是一群“草台班子”,他称,团队用一年半时间完成“与GPU芯片厂家的合作、自有品牌的AI服务器工厂建造、智算中心点亮、组网调优,还有算力客户的租赁”。
联想为燧弘华创提供多种层面的支持,包括协助建设服务器工厂、提供智算设备、支持算力调优以及日常运维相关问题。联想中国基础设施业务群战略管理总监黄山是该项目负责人,他评价,燧弘华创庆阳智算中心是个纯智算中心,它最大的价值“真正用起来了”。
作为项目负责人,黄山的观感是,这家公司不仅很拼,也很懂得管理资源和利用资源,如充分利用联想等合作伙伴快速达成技术升级。
庆阳市政府在支持算力企业方面有自己的方式,比如,采用算力券奖励模式,让燧弘华创的算力价格在市场上较有竞争力;比如,庆阳市定期召开一次 “东数西算” 工程推进会,及时解决企业在发展过程中遇到的问题。规划建设 1.7 万余亩的国家数据中心集群(甘肃・庆阳)“东数西算” 产业园区,为燧弘华创等算力企业提供优质的基础设施和配套服务,降低企业的建设和运营成本。

图片市场开始碎片化

市场在不断变化,尽管燧弘华创快速建好智算中心并成功地将算力租了出去,但年初由DeepSeek引发的AI拐点在产业链上下游均产生化反,包括燧弘华创在内的公共智算中心迎来全新挑战。
在DeepSeek爆火之前,无论国内还是国外,建设智算中心主要目的是满足基础大模型的预训练需求。例如,去年联想跟包括庆阳在内的很多智算中心一起来攻关的是,如何做好预训练,如何将训练平台从千卡扩大到万卡甚至十万卡,以及如何解决规模扩大带来的基础设施管理复杂度、效率瓶颈等问题。
DeepSeek兴起后,市场对算力的需求从预训练转向了后训练和推理,智算中心的客户群体也明显变了。
唐峰向《财经》表示,智算中心原来主要服务大型互联网公司和大模型公司,现在迎来了很多基于DeepSeek大模型的应用创业者。原来的客户数量有限,租用算力主要用于大模型预训练,动辄租用几十台、上百台的算力服务器;现在DeepSeek相关创业者数量多,租用算力主要用于大模型后训练和推理,并且创业者们往往买不起一整台算力服务器,需要把算力“切分”后卖给他们。
智算中心实际面临大客户(指有大模型预训练需求的公司)数量减少的风险。一位AI产业资深人士向《财经》表示,受DeepSeek影响,国内坚持研发基础大模型的公司会越来越少,越来越向头部聚集。
综合来看,DeepSeek虽然改变了智算中心用户群体构成,但业界普遍看好它将引爆AI推理需求,改变当下智算算力供大于求的局面,为智算中心带来希望。
联想中国基础设施业务群高级产品经理郭晋兵还认为DeepSeek为智算中心提供了一种新的资源销售方式,即装上各种大模型,以对外卖Token数的方式销售算力资源。该方式好处是客户将不关心智算中心的硬件组合,只要智算中心的算法够强,智算中心可以使用国产硬件,甚至可以用低端硬件。

图片

变智算中心为智算云
智算中心转型首先从软件层面开始。
黄山向《财经》表示,之前庆阳等智算中心主要采用裸金属模式对外出租算力,如今要服务大模型后训练与推理,智算中心需要增强云服务和算力调优能力,所使用的软件无论是算力调优还是计费还是运维,也都与之前完全不一样。
上述能力要求对联想等算力基础设施提供方也是较大的挑战。黄山认为这主要是考验算力设施提供商的软硬件协同设计能力,接下来,联想会联合燧弘华创以及GPU芯片厂商在异构算力调优上进行联合创新,联想对燧弘华创的支持重点也主要聚焦在算力调优上。
目前,联想已帮助燧弘华创在庆阳绿色智算中心部署了多元异构算力调度平台。建设该平台的目的是为统一管理智算中心的异构算力,为智算中心用户提供更融合、更稳定的智能和科学算力。同时,联想也在提升其AI服务器在DeepSeek大模型上的能力表现,最新数据显示,联想AI服务器在全速运转满血版DeepSeek R1大模型时,极限吞吐量可超8000 tokens/s,这将有助为智算中心更好地赢得DeepSeek大模型相关客户。
除了技术层面,智算中心算力销售模式也需要转变。唐峰表示过去模式是在各主要城市建立智算中心就近服务客户,推理算力的市场是分散的,现在他们也开始尝试通过各种渠道比如网络平台销售算力。
智算中心的云化、智算云的建设大概率将成为主要建设方向。例如,3月25日上海市出台《上海市关于促进智算云产业创新发展的实施意见(2025—2027年)》。该政策中“智算云”成高频词,例如到2027年上海市智算云产业规模力争突破2000亿元、打造若干综合型智算云平台和一批垂直型智算云平台、形成一批智算云标杆应用等等。
多位行业人士表示,智算中心运维不易,智算云的运维难度将指数级增高。
中科院计算所研究员张云泉呼吁应加强AI人才培养。他表示,基于AI大模型的后训练与推理需求虽然暴增,但非常缺乏了解行业需求又掌握AI应用方法的人才,会阻碍AI应用创新。例如,目前懂得将行业数据和DeepSeek大模型进行精调的人才就很少,需要培养大量工程师,解决AI落地的“最后一公里”问题。

图片

责编 | 杨明慧

封图来源 | 视觉中国


图片

相关文章