浪潮信息发布"元脑SD200"超节点,面向万亿参数大模型创新设计
北京2025年8月8日 /美通社/ -- 8月7日,浪潮浪潮信息发布面向万亿参数大模型的信息向万超节点AI服务器"元脑SD200"。该产品基于浪潮信息创新研发的发布多主机低延迟内存语义通信架构,以开放系统设计向上扩展支持64路本土GPU芯片。元脑亿参元脑SD200可实现单机内运行超万亿参数大模型,超节创新并支持多个领先大模型机内同时运行及多智能体实时协作与按需调用,点面目前已率先实现商用。数大设计在实际评测中,模型元脑SD200运行DeepSeek R1和Kimi K2等全参模型的浪潮64卡整机推理性能实现超线性扩展。
当前,混合专家模型(MoE)的发布高效架构正在驱动大模型参数规模持续扩展,国内外前沿大模型的元脑亿参参数量快速突破万亿规模,这给算力系统架构提出新的超节创新挑战。一方面,点面模型参数量增加和序列长度增加带来的数大设计键值缓存(KV cache)激增,需要智能计算系统具有超大显存空间承载,依靠单芯片或节点的性能提升已难以为继;且其推理过程作为通信敏感型计算,对分布式计算通信延时要求极高,需要构建更大向上扩展(Scale up)高速互连域。另一方面,智能体AI开启多模型协作的新范式,其推理过程需要生成比传统模型多近百倍的数据词元(token),导致计算量激增。
元脑SD200超节点AI服务器是浪潮信息面向万亿参数大模型AI时代而设计,创新研发多主机低延迟内存语义通信架构,基于开放总线交换技术构建,在单机内实现了64路GPU芯片的高速统一互连,成功解决万亿大模型对超大显存空间和超低通信延时的核心需求。在开放架构之上,元脑SD200通过智能总线管理和开放的预填充-解码(Prefill-Decoder)分离推理框架实现软硬件深度协同,智能化管理复杂AI计算任务。
- 在架构层面,元脑SD200基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连;通过创新远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可以提供最大4TB显存和64TB内存,为万亿参数、超长序列大模型提供充足键值缓存空间。同时,依托百纳秒级超低延迟链路,构建64卡大高速互连域统一原生内存语义通信,实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。
- 在系统层面,根据万亿参数大模型计算、通信需求特征,浪潮信息开发智能总线管理系统,实现超节点64卡全局最优路由的自动创建,支持不同拓扑切换,资源按需切分。对于全规约、全聚集(All Gather)等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,实现通信延时进一步降低。同时依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时保持对多元算力的兼容性,实现计算与通信架构的深度协同优化。
元脑SD200超节点AI服务器通过软硬协同系统创新,成功向上扩展突破芯片性能边界,在大模型场景中展示出优异的性能表现。结合优化的PD分离框架,SD200超节点满机运行DeepSeek R1全参模型推理性能超线性提升比为3.7倍,满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。
当前,开源模型的飞跃式进步正在加速智能时代的到来,推动研发范式从封闭走向开放协作。同时,随着大模型参数量的持续提升,对算力基础设施的建设提出了更高要求。浪潮信息通过开放系统架构创新,为开源大模型的规模化落地和应用创新提供关键支撑。
(责任编辑:热点)
-
Last week, my friend asked me to go to the park with him, I was so happy to say yes. But when that d ...[详细]
-
交通运输部规划研究院等单位6月发布的《2024年度中国海港城市港口经济发展报告》显示,2024年福建沿海地区港口经济增加值达到7568亿元,对福建沿海区域GDP贡献率达15.3%,贡献率居全国首位。作 ...[详细]
-
据固原市纪委监委消息:固原市六盘山林业局党组书记、副局长刘志安涉嫌严重违纪违法,目前正接受固原市纪委监委纪律审查和监察调查。原标题:固原市六盘山林业局党组书记、副局长刘志安涉嫌严重违纪违法接受纪律审查 ...[详细]
-
迪玛利亚社交媒体晒全家福 祝所有人2025新年快乐北京时间1月1日,阿根廷球星迪马利亚在自己的社交媒体晒出全家福合影,并配文:祝所有人2025年新年快乐,愿你们新的一年安康充满爱,让我们一起奔向美好的 ...[详细]
-
森林保险上半年工作总结总结是把一定阶段内的有关情况分析研究,做出有指导性结论的书面材料,它能够使头脑更加清醒,目标更加明确,我想我们需要写一份总结了吧。总结怎么写才是正确的呢?以下是小编精心整理的森林 ...[详细]
-
据固原市纪委监委消息:固原市六盘山林业局党组书记、副局长刘志安涉嫌严重违纪违法,目前正接受固原市纪委监委纪律审查和监察调查。原标题:固原市六盘山林业局党组书记、副局长刘志安涉嫌严重违纪违法接受纪律审查 ...[详细]
-
走进位于泉州晋江的梧林传统村落,仿佛踏入一座露天的“华侨建筑博物馆”,漫步其间能够看见,哥特式尖顶与闽南燕尾脊共舞,罗马柱廊与红砖厝相映成趣。村落中的57幢闽南官式大厝、12幢 ...[详细]
-
Ready抖音账号注销后多久可以重新注册?抖音账号不想用的话可以直接注销,释放手机号后还可以重新注册账号。下面为大家介绍一下抖音账号注销后,需要等待多久才能再次注册账号,想要了解的用户可以参考以下的流 ...[详细]
-
2025 精英童模超级联赛全球总决赛在成都圆满落幕。这场汇聚全球顶尖少儿时尚力量的盛会,吸引了全国各省市区及海外赛区的数百名优秀童模同台竞技,孩子们以灵动台步、自信姿态诠释多元时尚美学,为现场观众呈现 ...[详细]
-
Ready作业帮一对一在线辅导收费是多少?作业帮是一款在线辅导学习的软件,用户可以使用一对一辅导来获得更加详细的讲解,但是价格也会比较贵一些。下面为大家介绍一下在线辅导的收费标准,想要了解的用户可以来 ...[详细]