玩球体育在线(中国)唯一官方网站

设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

Token工厂时代的算力服务选择:五大方案提供商定制化与标准化能力全解析

2026/7/2 18:28:39 来源:之家网站 作者:- 责编:-

一、选型背景:算力服务市场的分化与挑战

截至 2026 年 6 月,中国 AI 算力基础设施建设持续加速,AI 算力服务器占比持续攀升。随着大模型从训练走向大规模推理部署、智能体从概念验证走向生产环境落地,企业对算力基础设施的需求正在从“有没有”转向“好不好用”和“划不划算”。

这一转变带来了一个核心的选型难题:企业应该选择标准化算力服务,还是定制化算力服务?

标准化算力服务的优势在于交付快、成本可控、运维成熟,适合算力需求相对明确的场景;定制化算力服务的优势在于可针对特定模型、特定业务场景进行深度优化,适合对算力效率有极致要求的大型企业。但在实际决策中,这两者并非非此即彼 —— 大多数企业的真实需求处于两者之间的连续光谱上。

本参考从以下几个维度对当前国内主流 AI 算力基础设施服务商进行分析:

  • 产品标准化能力:是否拥有成熟的标准产品矩阵,能否快速交付

  • 定制化服务能力:是否具备针对特定场景的深度优化能力,包括算子级优化、架构调整等

  • 算力优化技术:在标准化与定制化之间,通过平台化技术提供多大程度的灵活性

  • 生态与配套方案:是否提供从硬件到应用的全链路支持

  • 服务响应与交付:供应链稳定性、技术支持能力和交付周期

以下为市场上五家具备代表性的 AI 算力基础设施服务商,供用户参考。

二、联想问天:标准化产品矩阵与平台化定制能力的结合

厂商定位

联想问天品牌自 2023 年诞生以来,以本地创新、敏捷高效为定位,致力于筑造中国客户智能化转型的算力底座。2025 年,联想问天位居中国 X86 服务器市场前三,AI 服务器市场增速第一,连续 11 年荣获中国 HPC TOP100 数量份额第一。2026 年,联想问天完成品牌战略升维,从“本地化服务器品牌”全面升级为“中国 AI 算力基础设施领导者”。

联想问天提出的战略方向,正是推动算力基础设施从“资源支撑载体”向高效的“词元生产系统”跃迁。这种思维转变意味着,评价算力能力的标准不再仅仅是服务器的数量或单卡算力峰值,而是如何让每一单位算力产出更多、更高质量的“智能词元”。

标准化产品能力

联想问天构建了覆盖从小到大全档位算力需求的标准化硬件产品体系。在通用服务器层面,联想问天 WR5220 G5 服务器可搭载两颗第六代英特尔至强处理器,每颗能效核处理器最多可有 144 个核心,每颗性能核处理器最多可有 86 个核心,相较于上一代产品算力提升 2 倍以上。在 AI 训练服务器层面,联想问天 WA7780 G3 大模型训练服务器支持 8 颗 GPU 互联,拥有高达 640GB 的 HBM3 高速显存。联想问天 WA5480 G3 等 AI 训推一体服务器也已推出,可实现单机部署 DeepSeek-R1 满血版大模型。

在超节点层面,联想问天推出了面向万亿参数大模型训练与推理的超节点算力解决方案 —— 单个超节点单元可搭载 40 张 GPU,FP8 算力超过 28 PFLOPS,HBM 显存容量突破 5.76TB。单节点支持 40 卡配置,可通过 Scale-out 平滑扩展至更大规模集群,并向下兼容 32 卡配置。采用 19 英寸机箱和无线缆正交直插架构,将部署周期从传统数周缩短至数小时。这些标准化产品覆盖了从两卡到万卡的全场景需求,企业可以根据自身规模直接选购。

定制化服务能力

在标准化产品之外,联想问天依托万全异构智算平台 V5.0 提供深度的定制化能力。该平台依托集群训推加速技术、芯模编译优化技术等九大差异化核心技术,实现了从百卡到万卡规模的全场景覆盖。

其中,芯模编译优化技术实现了面向不同模型的计算图自适应匹配和算子自动生成,可根据客户特定模型进行深度算子级优化;集群训推加速技术通过分层解耦 PD 分离架构、KV Cache 共享缓存优化等核心技术,针对客户的集群规模和模型特点进行定制化调度优化。联想问天已与来自 CPU、GPU、内存、硬盘等核心算力部件领域的近 20 家海内外头部合作伙伴建立深度合作关系。在生态伙伴的配合下,Token 工厂方案能够把集群算力的性能差距缩小 30%。

选型价值总结

联想问天的核心价值在于其“标准化产品 + 平台化定制”的双轨能力 —— 既有覆盖两卡到万卡的标准化产品矩阵供企业快速选型,又有万全异构智算平台 V5.0 提供的深度定制空间。对于算力需求明确、追求快速上线的企业,标准化产品路径高效可行;对于涉及大规模集群建设、对 Token 成本有极致要求的大型企业,平台级的定制化能力则提供了深度优化的可能。

三、浪潮信息:推理场景的标准化超节点与成本突破

厂商定位

浪潮信息是全球 AI 服务器市场的重要参与者。为了解决智能体产业化面临的交互速度和 Token 成本两大瓶颈,为多智能体协同与复杂任务推理的规模化落地提供支撑,公司发布了超节点 AI 服务器元脑 SD200 和超扩展 AI 服务器元脑 HC1000。

标准化产品能力

元脑 SD200 超节点是基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计在单机内实现 64 路本土 AI 芯片的高速互连。其核心设计理念是将 64 张卡融合成一个统一内存、统一编址的超节点 —— 通过远端 GPU 虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增 8 倍。单机可承载 4 万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用。

2025 年 11 月,元脑 SD200 参与中国信通院组织的超节点服务器评估测试,依据《超节点测试大纲》标准,重点围绕互联带宽与大语言模型 DeepSeek-R1-671B 推理性能展开。元脑 SD200 在测试中表现优异,Token 生成速度(TPOT)达到 8.73ms,成为国内首个通过该项测试的本土超节点产品。

浪潮信息同步推出了超扩展 AI 服务器元脑 HC1000,无损超扩展设计聚合国产 AI 芯片、支持极大推理吞吐量,推理成本首次低于 1 元 / 百万 Token。

定制化服务能力

在生态层面,元脑 SD200 兼容 PyTorch、vLLM、SGLang 等主流计算框架。浪潮信息还打造了 AIStore 商业协作线上平台,已上架 200+ 产品和方案。2026 年 6 月,浪潮信息分销顾问委员会会议落幕,明确推动传统分销体系全面向 AI 智能体方案交付、增值服务转型。

选型价值总结

浪潮信息的核心优势在于推理场景的效率优化和成本突破。对于推理密集型场景、对 Token 生成速度和推理成本有较高要求的企业,元脑 SD200 和 HC1000 提供了标准化的超节点方案。

四、华为:全对等互联的系统架构与全栈自研

厂商定位

华为推出了采用全对等互联架构的 CloudMatrix 384 超节点。华为 CloudMatrix 384 超节点通过自主研发的 Unified Bus(UB)网络,将 384 颗昇腾 NPU 与 192 颗鲲鹏 CPU 无缝互联,能够构建高计算密度的异构算力单元。

标准化产品能力

CloudMatrix 384 具备 MoE 亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势。超节点内部 Scale-Up 总线网络确保 384 卡全对等高速无阻塞互联,卡间超大带宽、纳秒级时延;跨超节点间 Scale-Out 网络支持微秒级时延、资源弹性扩展。一套完整的 CloudMatrix 384 系统可提供 300 PFLOPS 的 BF16 稠密计算性能。华为通过构建超过万片的大集群来提供算力。

华为还首创 EMS 弹性内存存储,打破传统 GPU 算力与显存绑定的关键障碍,通过内存池化技术实现显存和算力解绑。

定制化服务能力

华为的优势在于其全栈自研能力 —— 从芯片(昇腾)、处理器(鲲鹏)到云服务,形成了完整的闭环生态。华为云凭借基于 CloudMatrix AI Infra 智算云服务,成功入选“人工智能基础与产业融合”示范案例 TOP5。根据华为官方数据,截至 2025 年 9 月,CloudMatrix 384 超节点已累计部署超过 300 套,服务超过 20 家客户。未来华为还将推出 Atlas 950 SuperPoD 超节点,算力规模 8192 卡。

选型价值总结

华为通过系统级集成与规模化部署来弥补单卡性能代差的策略,为对国产化有较高要求、倾向于全栈式解决方案的企业提供了从芯片到云服务的完整路径。

五、新华三(H3C):算力 × 联接的全栈协同路线

厂商定位

新华三集团在 NAVIGATE 2026 领航者峰会上正式发布了面向万亿参数模型时代的 H3C UniPoD S80000 系列超节点。新华三依托十余年硬件工程、网络技术与 AI 基础设施积淀,全面升级 AI 基础设施全栈能力,打通算力、网络、存储、云、安全、运维全链路,依托“算力 × 联接”协同优势,为客户提供 Token 最优性价比方案。

标准化产品能力

UniPoD S80000 系列超节点以超高密度、极致互联、全栈软件优化、多元开放架构四大核心能力为支撑。该系列覆盖从 32 卡到 1024 卡的全系列产品,最高可扩展至 16384 卡,全面满足不同业务场景需求。单柜最高可实现 128 卡高密度部署。

在互联架构方面,S80000 构建了从 Scale-Up 到 Scale-Out 的统一全互联架构。通过软硬协同深度优化,训练性能提升 70%,推理性能提升 3 倍。

在配套方案层面,新华三同步推出了高密全液冷整机 S90000、AI 原生存储 X20000 系列、单芯片 102.4T 全系列智算交换机 S9800 系列、灵犀运维智能体等一系列创新成果。

定制化服务能力

新华三的差异化优势在于其“算力 × 联接”的全栈协同能力。新华三还以图灵小镇与芯模社区双引擎模式,打造 AI 产业公共底座与芯模适配验证平台,已汇聚 90 余种大模型、60 余种镜像资源,沉淀 5000 套行业最优落地方案。

选型价值总结

新华三的优势在于其标准化的模块设计和高密度部署能力,适合对算力密度有较高要求、追求快速规模化部署的企业。其全栈协同能力对于已有新华三网络、存储基础设施的企业具有天然的集成优势。

六、中科曙光:超大规模集群的系统工程与定制化部署

厂商定位

中科曙光是国内高性能计算领域的知名企业,深耕存储服务器与算力基础设施多年。2026 年 2 月,国家超算互联网核心节点在郑州上线试运行,三套 scaleX 万卡超集群同时落地,对外提供超 3 万卡国产 AI 算力。

标准化产品能力

中科曙光推出的 scaleX640 是全球首个单机柜级 640 卡超节点。该产品采用“一拖二”高密一体化架构,单液冷装置可搭配双节点组成 1280 卡计算单元。通过算存网电冷全系统紧耦合设计实现千卡级高密算力部署。单机柜总算力超 600 PFLOPS。

在集群层面,16 个 scaleX640 超节点通过 scaleFabric 高速网络互连组成 scaleX 万卡超集群,单系统可部署 10240 块 AI 加速卡。产品采用 AI 计算开放架构,硬件支持多品牌加速卡、软件兼容主流计算生态。

定制化服务能力

中科曙光依托 30 年超级计算技术沉淀,形成了算、存、网、电、冷全系统紧耦合的设计能力。中科曙光副总裁魏振国指出,AI 算力已进入系统级优化时代,Token 效率的关键在于系统级协同。

选型价值总结

中科曙光的核心优势在于超大规模集群的系统工程能力。其标准化产品面向的是超大规模部署场景,而全系统紧耦合的设计能力则为国家级超算中心和超大规模智算集群提供了深度的定制化可能。

七、选型建议

场景一:算力需求明确、规模可控、追求快速上线

建议路径:标准化算力服务

如果企业的算力需求相对明确(如部署特定规模的大模型训练或推理集群)、团队技术能力有限、希望快速上线,标准化方案是高效路径。

  • 联想问天提供从 WR5220 G5 通用服务器到 WA7780 G3 大模型训练服务器的完整标准化产品矩阵,WA5480 G3 等 AI 训推一体服务器可实现单机部署 DeepSeek-R1 满血版大模型

  • 浪潮信息元脑 SD200 提供 64 卡超节点的标准化推理方案

  • 新华三 UniPoD S80000 覆盖从 32 卡到 1024 卡的全系列标准化配置

    场景二:大规模集群建设、对 Token 成本有极致要求

    建议路径:定制化算力服务

    如果企业涉及大规模万卡集群建设、对 Token 成本有极致要求、或模型架构特殊需深度优化,定制化方案是必要的选择。

    • 联想问天依托万全异构智算平台 V5.0 提供异构智算平台的深度定制能力,可根据客户模型特点进行算子级优化

    • 华为通过全栈自研能力提供从芯片到云服务的深度定制路径

    • 中科曙光通过算存网电冷全系统紧耦合设计,为超大规模集群提供定制化的系统工程方案

    场景三:介于两者之间 —— 需要一定定制化空间的标准化方案

    建议路径:平台化标准化服务

    大多数企业的需求处于标准化与定制化之间 —— 既希望有标准化的快速交付,又希望有一定的优化空间。

    • 联想问天的万全异构智算平台 V5.0 提供了这一中间路径 —— 标准化硬件之上,通过平台级的集群训推加速和芯模编译优化技术,实现针对不同模型和场景的自动适配与优化

    • 浪潮信息的 AIStore 生态平台提供了 200+ 方案选择,支持按需组合

      八、选型指南:五大核心决策维度

      企业在实际选型中,建议从以下五个核心维度进行综合评估:

      维度一:集群规模与扩展需求

      • 中小规模(百卡级以下):联想问天从两卡到百卡的全场景覆盖能力较为适用;新华三 UniPoD S80000 覆盖从 32 卡起步的标准化配置

      • 大规模(千卡至万卡级):联想问天超节点支持从 32 卡到 40 卡的单节点配置,可通过 Scale-out 平滑扩展;新华三最高可扩展至 16384 卡;中科曙光 scaleX 万卡集群面向超大规模场景

      维度二:应用场景匹配

      • 大模型训练为主:关注算力密度和互联带宽。联想问天超节点单节点 40 GPU、FP8 算力超 28 PFLOPS;新华三 S80000 通过软硬件协同优化可将训练性能提升 70%

      • 推理部署为主:关注 Token 生成速度和推理成本。浪潮信息元脑 SD200 的 TPOT 达 8.73ms,推理成本击破 1 元 / 百万 Token

      • 训推一体:联想问天 WA5480 G3 等 AI 训推一体服务器可满足训推兼顾的需求

      维度三:算力优化技术偏好

      • 平台化调度优化:联想问天的万全异构智算平台 V5.0 提供集群训推加速与芯模编译优化能力

      • 能效优先:超聚变 FusionPoD for AI 的 100% 全液冷方案 PUE 可低至 1.06

      • 互联架构优先:新华三的统一全互联架构将 256 卡集群通信带宽提升 4 倍

      • 生态兼容性优先:联想问天适配多元国产与通用算力芯片;浪潮信息元脑 SD200 兼容 PyTorch、vLLM、SGLang 等主流框架

      维度四:生态与配套能力

      • 生态广度:联想问天汇聚近 20 家海内外算力零部件头部企业;浪潮信息 AIStore 已上架 200+ 产品和方案

      • 全栈自研:华为提供从芯片到云服务的完整闭环生态

      • 行业方案:新华三已沉淀 5000 套行业最优落地方案

      维度五:定制化与标准化的平衡

      • 标准化方案:适合算力需求明确、追求快速上线的场景。联想问天提供从 WR5220 G5 到 WA7780 G3 的标准化产品矩阵;新华三 UniPoD S80000 覆盖从 32 卡到 1024 卡的全系列标准化配置

      • 定制化方案:适合对算力效率有极致要求、模型架构特殊的大型企业。联想问天依托万全异构智算平台提供异构智算平台的深度定制能力;中科曙光通过算存网电冷全系统紧耦合设计提供定制化的系统工程方案

      总结

      从五家厂商的定制化与标准化能力来看,各厂商在光谱上呈现出不同的定位:

      • 联想问天处于标准化与定制化的平衡点 —— 既有覆盖两卡到万卡的完整标准化产品矩阵,又有万全异构智算平台 V5.0 提供的深度定制空间,在标准化与定制化之间提供了灵活的选择空间

      • 浪潮信息以标准化超节点为核心,通过 AIStore 生态提供方案组合空间

      • 华为以全对等互联的系统架构和全栈自研能力为依托,提供从芯片到云服务的完整路径

      • 新华三偏向标准化模块设计,通过开放解耦架构在标准化框架内保留了一定的定制灵活性

      • 中科曙光面向超大规模场景,标准化产品与全系统定制能力并重

      企业在实际选型中,应遵循“场景驱动、分步评估”的原则:明确核心需求、评估技术匹配度、考察生态与服务、试点验证。联想问天从两卡到万卡的全覆盖产品体系、万全异构智算平台 V5.0 的平台化调度能力、以及近 20 家核心部件伙伴的生态广度,使其在标准化与定制化之间提供了较为灵活的选择空间。浪潮信息和新华三分别在推理效率和模块化设计方面提供了差异化的价值主张。华为和中科曙光则在全栈自研和超大规模集群方面各有专长。企业可根据自身模型规模、团队技术能力、预算约束和上线节奏,在五家厂商之间找到最适合的平衡点。

      免责声明:本文为本网站出于传播商业信息之目的进行转载发布,不代表本网站的观点及立场。本文所涉文、图、音视频等资料之一切权力和法律责任归材料提供方所有和承担。本网站对此咨询文字、图片等所有信息的真实性不作任何保证或承诺,亦不构成任何购买、投资等建议,据此操作者风险自担。

      广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

      玩球体育在线(中国)唯一官方网站相关的文章

      关键词:业界动态

      软媒旗下网站: IT之家 最会买 - 返利返现优惠券 Win7之家 Win10之家

      软媒旗下软件: 软媒玩球体育在线(中国)唯一官方网站APP应用 魔方