你的位置:万博manbext体育官网(中国)官方网站登录入口 > 新闻资讯 > 万博manbext体育官网app官网两种变体算计 240 个线程-万博manbext体育官网(中国)官方网站登录入口

新闻资讯
万博manbext体育官网app官网两种变体算计 240 个线程-万博manbext体育官网(中国)官方网站登录入口
发布日期:2025-09-23 14:06    点击次数:94

开头:半导体行业不雅察万博manbext体育官网app官网

如若您需要一个能够相沿数十 TB 内存、数十个 PCI-Express 外围树立插槽、数千个径直联合的存储树立的大型、刚劲的盒子,所有这些都将输入到数百个不错越过该内存占用空间并具有大批带宽的内核中,那么您莫得太多采用。

这即是为什么 IBM 仍然领有基于其 Power 系列 RISC 处理器的 Power Systems 奇迹器业务的原因之一。该系列处理器相沿 IBM 自主研发的 Unix 变体、其特有且备受珍摄的 IBM i(往时称为 OS/400)以及 Linux 操作系统。而这款“大型机”的盈利智商,以及需要大型 NUMA 机器的客户对这些机器的皆备依赖,使其能够相沿海量事务型数据库解决系统偏抓邻近应用步骤,恰是蓝色巨东说念主仍然有智商投资 Power 处理器的原因。

因此,Power11 处理器于上周推出,并将于 7 月 25 日起先在一系列初学级、中端和企业级奇迹器上发售。

从某种进度上来说,Power11 芯片是 2021 年 9 月初次亮相的 Power10 芯片的深度分类。

Power10芯片资历了一段粗重期间,芯片代工结搭伙伴GlobalFoundries先后取消了10纳米和7纳米制造工艺。不异的工艺转型对英特尔来说亦然一次史诗级的失败,而制造工艺的一次又一次推迟,让AMD有契机凭借其兼容的Epycs芯片突出Xeon X86奇迹器芯片,AMD的商场份额也从此不断增长。

格芯于 2014 年 10 月收购了 IBM 微电子公司,并郑重其时正在进行的蓝色巨东说念主 14 纳米工艺的家具化。据咱们所知,GlobalFoundries 给与 14 纳米工艺蚀刻的 Power9 芯片上市晚了大要一年,而 IBM 花了一整年的时候才在 2018 年提高产量。(首批 Power9 芯片于 2017 年底委派,折柳用于橡树岭国度实验室的“Summit”超等计较机和劳伦斯利弗莫尔国度实验室的“Sierra”超等计较机,并通过 NVLink 互连配对,与 Nvidia“Volta”V100 GPU 加快器分享内存。已经应该有一个 Power9' - 这是一个“素数”记号,用于暗示低于“+”的更新,频繁意味着工艺逍遥,而且频繁意味着 Power 处理器系列中插槽中的芯片数目翻倍 - 但这从未发生过。(Power8' 是将 Power8 芯片与 NVLink 端口致密耦合到 Nvidia“Pascal”P100 GPU 加快器的测验台。)

正如咱们在 2021 年 6 月 IBM 告状 GlobalFoundries 失约时所商议的那样, Power10 的原始筹办是转向 10 纳米工艺和新的 Power 微架构,使中枢数目比 Power9 翻一番。这意味着 24 个中枢,每个中枢 8 个线程(IBM 称之为 SMT8),或者 48 个中枢,每个中枢 4 个线程(IBM 称之为 SMT4)。该芯片筹办于 2020 年上市,配备更快的 OpenCAPI 和 NVLink 径直 I/O 以及内存分享端口。后续的 Power11 筹办在此之后几年推出,好像给与 7 纳米工艺,而且其中枢中详情会配备更宽的矢量处理引擎。

在此经过中,GlobalFoundries 示知 IBM,由于 10 纳米工艺的蔓延,它将径直跳到 7 纳米,IBM 不得不再行计算 Power10 的计算。在 7 纳米节点,咱们所看到的 IBM 道路图标明,蓝色巨东说念主将使用 GlobalFoundries 的 7 纳米工艺,提供 60 个 SMT4 中枢和 30 个 SMT8 中枢的 Power10 变体,两种变体算计 240 个线程。2018 年 8 月,GlobalFoundries 加大了双管皆下研发 7 纳米工艺的力度(一种使用程序浸没式光刻期间,另一种使用更不菲的极紫外 (EUV) 期间),这让蓝色巨东说念主不得不为其 Power 和 System z 大型机 CPU 寻找代工场。

IBM 采用了三星,后者坐褥我方的智妙手机芯片,而且荒谬但愿在 7 纳米及更小的节点上为更大的计较引擎打造高性能工艺。IBM 是学习该工艺的理思运行客户,因为它在芯片拓荒和制造方面领稀有十年的专科劝诫。

看成向三星转型的一部分,IBM 入辖下手改良 Power 的教唆集和架构,并在 Power 计算中已有的整数中枢和浮点向量中枢中加多了矩阵数学单位。咱们以为,如若不是因为制造问题导致 Power10 和 Power11 的发布蔓延,这项改良本应在 Power11 中已毕。新冠疫情也为 IBM 提供了掩护,使其能够稳固不迫地拓荒 Power10,并作念好它。从这个真谛上讲,委派的 Power10 恰是咱们思象中的 Power11 的模式。因此,如若概括地斡旋,Power10 履行上即是 Power11,而 Power11 履行上是 Power11+。

Power10 和 Power11 芯片出厂时都领有 16 个中枢,晶体管数目不异为 180 亿;区别在于中枢的使用方式和时钟频率。Power10 芯片不异领有 128 MB 三级缓存,蚀刻在两个缓存体中,SMT8 中枢环绕其外,每个中枢配备 2 MB 二级缓存。最大的区别在于,Power11 的所有 16 个中枢都不错激活运行操作系统,而 Power10 最多只可使用 15 个中枢,因为在三星率先的 7 纳米工艺中,至少有一个中枢会失效。而且凭证 Power10 的 SKU 来看,似乎还有不少中枢失效了。(英特尔和 AMD X86 奇迹器处理器亦然如斯,SKU 堆栈的内核数目因此会缩减。)

借助 Power11,关于具有一或两个插槽的所谓“横向推广”系统,IBM 领有具有四个、八个、十个、十二个或十五个可用内核的 Power11 芯片,并通过单芯片模块(称为 SCM)和双芯片模块(称为 DCM)来欺诈这些内核。DCM 的频率限度为 2.4 GHz 至 4.15 GHz,SCM 的频率限度为 3 GHz 至 4.2 GHz。DCM 还有一种特殊变体,其中插槽中的第二个芯片的所有内核均已停用(特意或由于良率低),但芯片的所有 I/O 功能均可使用。因此,这种初学级 SCM(IBM 称之为 eSCM)在一个芯片上有四个或十个行为内核,而第二个芯片上莫得行为内核,但 I/O 智商却是预期的两倍。

咱们看到的一些文档中,有一些表格炫耀 Power11 芯片领有 300 亿个晶体管,时钟频率限度为 3.8 GHz 至 4.4 GHz,芯单方面积为 654 平方毫米,而Power10 芯单方面积为 602 平方毫米,时钟频率限度为 3.75 GHz 至 4.15 GHz。咱们不知说念这些表格中更高的晶体管数目和芯单方面积从何而来,并已关联 IBM 寻求表现。据咱们所知,Power10 和 Power11 芯片的芯片尺寸和晶体管数目调换;但这些晶体管中可用的数目详情发生了变化。

在体型宽敞、性能倒霉的 Power E1180 奇迹器上,该机器与 2021 年发货的 Power E1080 险些皆备调换。一个很大的区别是,Power E1180 默出嫁备 DDR5 内存,这是 Power E1080 末期的一个升级选项,而 Power E1080 率先配备的是 DDR4 内存。购买了 E1080 并破钞大批资金购买 DDR4 内存的客户不错将其处理器升级到 Power11,但保留 DDR4 内存,这么不错通过葬送一些性能规格来简陋一大笔钱。IBM 之是以能够作念到这少许,是因为它通过 OpenCAPI 内存接口 (OMI) 已毕了与其内存的互异化接口,DDR4 或 DDR5 公约是在内存芯片上已毕的,而不是在 Power10 或 Power11 芯片上的为止器上已毕的。

这是已毕主存储器的一种贤达步骤,业界不错从 IBM 在 Power Systems 上使用 OMI 存储器的作念法中学到一些东西。

Power11 芯片的外不雅如下,它看起来应该和 Power10 一样练习:

底下是 Power11 SCM 各通说念的框图,它与 Power10 SCM 调换,但进行了一些封装调理以提高动力遵守:

Power11 芯片的 SCM 模块顶部有 72 个 I/O 通说念,可相沿单节点内 CPU 插槽之间的 X-bus 互连,以及跨多节点的 A-bus NUMA 链路。现时尚不明晰 Power11 中 X-bus 链路的运行速率,但咱们忖度是 50 Gb/秒;咱们知说念 A-bus 链路的运行速率是 32 Gb/秒。

Power E1180 每个节点有四个插槽,单个分享内存系统包含四个节点,最多可提供 256 个 4.4 GHz 中枢,以及高达 64 TB 的主内存。计划到内存本钱,咱们瞻望履行应用中的大型 Power E1180 机器(即使是运行 SAP HANA 内存数据库偏抓应用步骤的机器)的内存容量最高也只好 16 TB,偶尔致使会达到 32 TB。除非果然有买卖用途,不然内存本钱的确太高,不值得铺张。

这是一个荒谬大的机器,而且 I/O 和内存与计较智商已毕了致密的均衡。AMD 系统最多可在一个 NUMA 集群中建设两个 CPU,其中配备Zen 5 中枢的通常版“Turin” Epyc 9005领有 128 个中枢和 256 个线程,运行频率为 2.7 GHz;而配备“Turin” Zen 5c 的变体则领有 128 个中枢和 256 个线程,运行频率为 2.25 GHz,通过将芯片上使用的 L3 缓存大小减半,中枢数目翻倍。现时,假定这台机器运行全速 6.4 GHz DDR5 内存,不错提供 1.5 TB/秒的内存带宽。如若使用 64 GB DDR5 DIMM(咱们以为由于价钱原因这是一个履行的上限),这台机器将领有 3 TB 的内存。

IBM 大幅裁汰了 DDR5 内存的速率,并在 Power11 芯片上装配了 16 个内存为止器,从而使内存运行温度更低、更可靠,从而从 16 路 Power11 奇迹器中赢得 12.8 TB/秒的内存,并使用 64 GB 差分 DIMM 在 16 个插槽上赢得 16 TB 的内存。(它有 32 GB、64 GB、128 GB 和 256 GB 的 D-DIMM 可供采用。)

一台使用英特尔“Granite Rapids”至强 6 处理器的八路奇迹器,每个插槽最多可容纳 86 个中枢,或在所有这个词 NUMA 机器上最多可容纳 688 个中枢,但这些中枢的运行频率仅为 2 GHz。如若使用 64 GB DDR5 DIMM 内存,运行频率为 6.4 GHz,那么这台英特尔至强 6 系统将为机器中的所有内存为止器提供 8 TB 的容量和 5.5 TB 的带宽。

多年来,IBM 一直在暧昧内存、I/O 和加快器之间的范围。早在 2018 年 8 月,咱们就展示了IBM 不错用 Power9 处理器已毕的一些真谛的选项。在 Power 奇迹器中,相干于内存带宽,调低中枢数目很容易——只需购买带有大批无效中枢的处理器模块即可。您不错凭证 DIMM 的容量来调理系统的内存容量。带宽即是带宽。您不错通过填充内存插槽来加多带宽,也不错通过不填充内存插槽来减少带宽。

关联词,如若相干于内存容量或内存带宽而言,需要更多的计较智商,那么加多中枢数目就会很贫寒。因此,咱们提出 IBM 创建一种称为推广 DCM(xDCM)的东西,它将系统上的部分 OMI 内存端口和 OpenCAPI 端口调遣为 X-bus 和 A-bus NUMA 链路,从而通过将 Power E1180 节点推广到四路 NUMA 以上来提高高端 Power11 机器的可推广性,或者通过在机箱中添加更多 NUMA 节点来提高系统可推广性。咱们怀疑后者可能后果更好。

无论怎么,以下是基于 Power9、Power10 和 Power11 处理器的最近三代高端 Power Systems 机器的堆叠情况,以及表面上的 Power E1185 和 Power E1185X 的比拟情况:

咱们不知说念这么的调清爽有多不菲,但加多更多核情意味着 IBM 不错在机箱中添加更多捏造机,从而匡助将企业使命负载整合到大机箱中。

参考流畅

https://www.nextplatform.com/2025/07/16/the-worlds-most-powerful-server-embiggens-a-bit-with-power11/万博manbext体育官网app官网



Powered by 万博manbext体育官网(中国)官方网站登录入口 @2013-2022 RSS地图 HTML地图