英特尔最强服务器CPU来了!AI性能直接翻倍

2024-11-21 10:14:57 来源:今日热点网

打印 放大 缩小

英特尔最强服务器CPU来了!AI性能直接翻倍

服务器CPU领域持续多年的核心数量大战,被一举终结了!

英特尔最新发布的至强® 6 性能核处理器(P-core系列),超越了过去单一维度的竞争,通过“升维”定义了新的游戏规则:

在过去,CPU升级换代往往要在单个芯片上集成更多的核心,但这难免会受到工艺和芯片尺寸的限制,更别提与IO和内存的匹配难题。

这一次,至强® 6 性能核处理器采用了计算芯片单元与I/O芯片单元解耦的分离式模块化设计,可以灵活组合不同数量的计算单元,实现核心数量的扩展及内存和IO的同步强化,保证更优的整体性能和能效。

用最直观的方式感受一下:

2023年12月15日,英特尔数据中心与人工智能集团副总裁陈葆立从裤兜里掏出第五代至强® 可扩展处理器,还只有64个核心。

2024年9月26日,还是陈葆立,同样从裤兜里掏出至强® 6 性能核处理器,却直接翻倍到128核心

两款处理器外形大小相似,都能轻松放入口袋,但性能却发生了质的飞跃。

具体来说,刚刚登场的是至强® 6性能核处理器大家族中的先锋+顶级战力——英特尔® 至强® 6900P系列。

拥有多达128个性能核和504MB的超大L3缓存,更大、更宽的内存支持,更多、更快的IO能力。非常适用于各种数据和计算密集型应用任务,比如科学计算、海量数据处理,还有AI。

看到这里,可能很多人会有疑问:你们又要说用CPU跑AI?是GPU它不香了么?

NoNoNo,我们是想说:有了这款CPU,你的GPU或其他的AI加速器,会更香!

谈到这个话题,就要先说说AI服务器。

在生成式AI应用百花齐放的当下,AI服务器的重要性可谓是不言而喻,无论是对于大规模的训练、推理,亦或是RAG等任务,都对其提出了更高的要求。

也正如综合市场预测数据从侧面反应出来的那般:

我们都知道AI服务器里GPU或AI加速器很重要,却很容易忽视其中CPU的作用。一个真正为AI服务器或AI数据中心基础设施设计的出色的CPU,应该是什么样的?

英特尔® 至强® 6 性能核处理器,可以说是给出了一个正解。

外媒甚至评测过后,对英特尔这次的新CPU给予了极高的评价:

嗯,用中文来说的话,就是英特尔至强,这次是真的至强(达到最强)了。

那么英特尔® 至强® 6 性能核处理器是如何解锁这种认同的呢?

至强,何以至强

首先要说的是算力。

英特尔® 至强® 6900P系列产品此次最亮眼的128核(三个计算芯片单元),这就是它看似符合此前游戏规则的一大技术亮点。

通过核心数量的不同排列组合方式,至强® 6 性能核处理器可以应对不同的场景来提供不同核心的型号,除了最高128核的产品系列(6900P)外,还有最高86核(2个计算芯片单元),最高48核(1个计算芯片单元)和16核(1个计算芯片单元)的产品系列。

用来做这种排列组合的模块中,计算芯片单元采用的是Intel 3制程,包含一体式网格、核心、缓存、内存控制器等,可以保证数据传输的一致性。

I/O芯片单元则是采用Intel 7制程,包含UPI、PCIe、CXL和加速器引擎等。

不同于第五代英特尔® 至强® 产品,至强® 6是将I/O和计算两个单元进行了解耦,不仅易于做核数的扩展,还有利于验证、重复和灵活使用。

除此之外,英特尔® 至强® 6 性能核处理器的亮点还包括:

6400 MT/s DDR5

8800 MT/s MRDIMM内存

6条UPI 2.0链路;速率高达24 GT/s

96条PCIe 5.0/ 64条 CXL 2.0通道

L3缓存高达504MB

支持FP16数据格式的英特尔® AMX

接下来要说的是存力。

至强® 6 性能核处理器超脱此前游戏规则的亮点就藏在其中。

它同时支持了更快的DDR5内存(6400MT/s)和更“宽”的MRDIMM内存(8800MT/s)。

仅把前者替换成后者,就已经能让科学计算和AI场景的多项任务提升7%-33%不等了。而且相比此前至强® CPU Max采用的HBM,MRDIMM内存的引入,不仅带宽和速度优势更明显,它与CPU解耦的型态,也更利于用户的灵活采购、配置与升级。

存力除了内存本身的性能,还包含CPU与内存之间的互连技术,至强® 6导入了最新的Compute Express Link 2.0 (CXL 2.0) 。

CXL 2.0支持多种设备类型,且可向后兼容,实现对内存和存储设备的灵活扩展。

支持链路分叉、更强的CXL内存分层支持,以及以受控热插拔的方式添加/移除设备,为未来的数据中心架构带来了更多可能性。

更值得一提的是至强® 6独占的“Flat”内存模式,CXL内存和DRAM内存被视为单一的内存层,让操作系统可以直接访问这一统一的内存地址空间。

这样的分层管理可以确保最大限度地提升内存使用效率,并且实现利用好CXL内存扩展而无需修改软件。

如此这般能对内存速度、带宽、容量和可扩展性全面兼顾,已经形成了至强® 6 性能核处理器独树一帜的竞争力。

具体到服务器设计上,CLX2.0可以支持每机提供8TB内存容量扩展,同时提供384GB/s的内存带宽扩展。

当然,作为CPU的至强® 6 性能核处理器并没有忘记自己的本份,把存力与算力的硬指标优势结合起来,转化成真正的优势,才是它被看好的底气。

在算力方面,除了更多内核,它还有内置加速器与指令集更新带来的加成。

主攻AI加速的英特尔® 高级矩阵扩展(Intel® AMX)新增对FP16数据类型的支持,现已全面覆盖 int8、BF16和FP16数据类型。

其在每个内核中的矩阵乘加(MAC)运算速度可达 2048 FLOPS(int8)和1024 FLOPS(BF16/FP16),能大幅提升 AI 推理和训练性能。

英特尔® 高级矢量扩展 512(AVX-512)虽然是员老将了,但在得到如此丰沛的内核资源支持后,也依然是科学计算、数据库和 AI 任务中的矢量计算担当。

这些加速器的升级与焕新带来的成果就是下图这种多负载性能表现普遍倍增的现象,在AI领域,尤其是在Llama2-7B上的提升直接达到了前一代产品的3.08倍。

最后在硬件增强的安全特性方面,英特尔早期的方案为SGX,但从第五代至强® 开始新增了TDX方案。这些看似难以通过Benchmark数值来证明自身价值的技术,实则不可或缺,是确保关键数据和应用更为安全可靠的压舱石。

而安全,恰恰是目前AI数据中心或智算中心这种涉及海量数据、关系万千机密和隐私的环境中较少提及,却最应补足和巩固的一环。

说了这么多,如果要用一句话总结至强® 6 性能核处理器,尤其是6900P系列产品的定位,那就是“更强通用计算,兼顾AI加速”了。

那么新处理器具体都有哪些用法,表现又如何呢?

还请继续往下看。

全能型CPU:加速AI推理,统领异构计算

首先,至强® 6 性能核处理器可以做“独行侠”,直接加速AI推理,助力AI应用普及。

用CPU做AI推理加速,其意义并非在于与GPU或其他专用加速器竞争极致的速度或效率,而是要在一些成本、采购、环境等条件受限的情况下,借助CPU部署更广泛、人才储备更扎实和应用更便捷的优势,让AI能够更快、更有效地落地。

带着这样的整体目标,英特尔在软件生态和工作负载优化方面投入了大量精力,以确保用户能够充分发挥至强® 6 性能核处理器的潜力。

例如,英特尔与TensorFlow和PyTorch等主流深度学习框架进行深度合作,将针对英特尔CPU的优化集成到官方发行版中,从而使得在英特尔CPU上运行深度学习模型时,性能得到显著提升。上文提到的Llama2-7B成绩便是这些努力的成果之一。

另外,至强® 6 性能核处理器还可以做“指挥官”,强化AI系统整体实力。

这其实是很多用户更为熟悉,也是至强® 6性能核处理器更主打的应用方式,所谓“指挥官”,另一个名称就是机头(head-node)CPU或主控CPU。

如果将至强® 6 性能核处理器用作AI服务器的机头CPU,那么其在算力(更强的单线程性能)、存力(对MRDIMM内存和CXL内存扩展能力的支持)以及 I/O(更多的PCIe 5.0通道)等方面的优势和潜能就能更加充分地发挥和释放出来。

使其能够与GPU或专用的AI加速器高效协作,出色地处理数据预处理、数据传输分享和混合工作负载。

我们最初的设问,至此终于拼凑出了一个更为完整的答案,即为何至强® 6 性能核处理器能够被称作AI服务器或AI数据中心的“严选”,甚至是优选CPU ?

这正是由于它既能够单枪匹马地加速AI推理,又可以居中协调以提升异构系统的整体性能输出。

更不必说,它还能够兼顾众多传统但同样不可或缺的应用负载,例如前文提及的科学计算和数据库,以及高性能云基础设施构建等任务。

以Flatiron Institute的案例来说,作为一家科研机构,他们对科学计算有着强烈的需求。通过测试得知,至强® 6 性能核处理器在常见科学计算负载上表现优异。

他们还觉得对MRDIMM内存的支持将进一步突破传统DDR内存的性能瓶颈,推动数据密集型科学发现。

在本次至强® 6 性能核处理器的发布会上,英特尔也展示了本地数据库软件合作伙伴——科蓝软件的成果。

英特尔市场营销集团副总裁、中国区&行业解决方案和数据中心销售部总经理梁雅莉在介绍生态系统支持状况时表示:

值得一提的是,在她分享中出现的中国合作伙伴数量众多且都是各领域的核心力量,英特尔虽然在产品研发上有了更多创新,但在商业模式上仍然非常依赖开放架构平台之上的产业合力。

十数家OEM、ODM、OSV和ISV在至强® 6 性能核处理器发布时同步推出新产品,以及多家云服务提供商的支持,在英特尔看来,才是新品真正走近用户和价值放大的基础。

建好AI服务器,CPU不能是短板

从前面列举的众多数据和用例可以看出,在当前AI应用加速落地、新推理计算范式和合成数据等趋势的推动下,AI算力需求越来越注重推理和复合工作负载。

在这之中GPU或专用加速器固然重要,但CPU作为整个系统的“指挥官”,绝不能成为短板。

大家需要真正兼顾通用计算,以及AI服务器及AI数据中心场景的CPU产品。它不仅能支持广泛的第三方GPU及AI加速器,与它们组合形成强大的异构计算平台,还能在其中补足GPU或专用加速器覆盖不到或不足的地方,为更多样和复杂的场景提供灵活的算力选择,并增强整个AI平台的稳定性、安全性和扩展性。

英特尔® 至强® 6 性能核处理器的出现,就为AI计算带来了这样一个全新的支点。

(梦晨 金磊)

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

责任编辑:ERM523

相关阅读

最新动态

英特尔最强服务器CPU来了!AI性能直接翻倍 算力存力Buff都叠满,至强6最强形态现身!
百信受邀出席2024数字生态大会并揽获两项大奖 齐天战力,直面天命!技嘉《黑神话:悟空》联名显卡正式开售
商用120天,宇视大模型「梧桐」2.0的四大成果 戴尔科技携手合作伙伴,共绘智能时代新蓝图
Dell携手AMD,助力制造业打造“新质生产力” 戴尔科技:夯实AI时代“算力底座”,让每一分算力“物尽其用”
AKG重磅发布N5 Hybrid耳机|参考级音质与AI黑科技对撞,引爆降噪耳机新潮! 茂森让智能手机变身移动数据釆集器
Rokid牵手江西中童镇,为百年眼镜产业注入新势能 一加 Ace 3V 正式发布,售价 1999 起
一加 Ace 3V 售价 1999 起, 打造「年轻人的第一台 AI 手机」 一加Ace 3V挑战中端手机护眼冠军,成就1.5K护眼直屏新标杆
年轻人第一台 AI 手机: 一加 Ace 3V 引领中端手机 AI 时代普及 一加Ace 3V引领旗舰质感普及,材质、工艺、质感全面跨越式升级
一加 Ace 3V 全球首发第三代骁龙7+移动平台,打造中端性能新标杆 行业联名款定制天花板!一加 Ace 3 原神刻晴定制机首销火速告罄
6 城同开,一加 Ace 3 原神刻晴定制机 Pop-up 快闪活动火热开启 一加 Ace 3 原神刻晴定制机正式发布 打造 2024 行业深度定制新标杆
一加 Ace 3 原神刻晴定制机将于 2 月 28 日发布 现已开启电商预约 魅族21成Last Phone?魅族或转型造车?
「知其所以」特别篇 X四川观察|当科技更有温度,AI能否打破老年人的数字鸿沟? 一加 Buds 3发布:搭载旗舰同款“同轴双单元”,打造标杆音质
一加李杰:超长续航将会是一加 Ace 3 的显著优势 一加 Ace 3 将于 1 月 4 日发布,让旗舰性能全面普及
一加 Ace 3 搭载二代骁龙 8 旗舰芯片,引领同档位性能体验 索尼旗舰主摄+超光影旗舰算法,一加 Ace 3让旗舰影像全面普及
没有 LTPO,就不要谈旗舰屏幕!一加 Ace 3 采用行业领先 8T LTPO 电路设计 2024开年首款旗舰耳机一加 Buds 3,1月4日一加Ace3发布会见
一加 Ace 3 官宣 1 月 4 日发布,让旗舰性能全面普及 7家高科技企业落户海曙!第二届宁波海曙“科创中国”赛道明星圆满落幕
小标识大有作为,如何抓住互联万物时代的中国机遇?| 标识应用创新大赛圆满收官 一加 12 开售 5 分钟,斩获第三代骁龙 8 机型首销全天销量和销售额品牌 TOP 2
十年超越之作一加12售价4299元起 产品力超越所有骁龙8Gen3 Pro版旗舰 体验领先行业一年,一加 12 全球首发仿生振感马达 Turbo
开启手机护眼新时代,一加 12 首发医疗级明眸护眼技术 一加 12 携手影像创作官“武王”于适 打造超越Pro的极致影像
一加 12官宣12月5日发布 ,全面超越骁龙8gen3 Pro机型 一加十周年围炉夜话活动定档12月4日,刘作虎将亲自解答网友问题
发展新引擎 宇视受邀参加中国电信数字科技生态展 一加联合京东方推出全世界显示效果最好的屏幕:打破18项DisplayMate记录
来酷科技半年报数字的背后 降本增效提速显著 经营质效双提升 “你好 BOE”首站隆重启幕 携手敦煌画院以创新科技致敬传统文化
BOE(京东方)智能座舱生态论坛成功召开 科技生态绘就未来出行新蓝图 BOE(京东方)亮相2023世界显示产业大会 以创新科技推动产业高质量发展
一加助威中国电竞亚运夺冠 中国区总裁李杰担任火炬手 卓世科技重磅发布知识增强行业模型及MaaS产品系列 引领企业数字化变革新潮流
2023年世界清洁能源装备大会 新品发布会在德阳顺利召开 起猛了!魅族在欢迎Mate系列回归,这格局没谁了!
全新门派“万灵山庄”首曝 《剑网3》十四周年发布会全回顾 2023AI+智能制造创新大会暨Create@阿里巴巴诸神之战“智能制造赛道”全球总决赛圆满收官
上半年国产领衔最畅销折叠屏!新品OPPO Find N3 Flip将发布,更有专业人像镜头 OPPO折叠屏持续热销,斩获上半年销量TOP1,Find N3 Flip即将发布
OPPO超影像大赛获奖作品展登陆北上广深,近距离感受移动影像魅力 移动影像无上限!Find X6系列助力OPPO超影像大赛,获奖作品展登陆北上广深
“AI+”智能制造新标签,Create@阿里巴巴诸神之战“智能制造赛道”全球总决赛即将举行 一加 Ace 2 Pro Pop-up快闪活动7城联动引排队热潮
一加 Ace 2 Pro 预售火爆 打破今年全价位段所有机型预售纪录 历时99天圆满收官!OPPO超影像大赛获奖作品出炉,每一张都惊艳
性能手机引领者一加 Ace 2 Pro 正式发布 售价 2999 元起 一加 Ace 2 Pro 定档8月16日发布 美依礼芽出任实力见证官
一加 Ace 2 Pro 官宣:搭载第二代骁龙8旗舰芯,8月16日发布 IDC最新数据出炉!上半年OPPO销量再登顶,产品力是关键
成都高新智能网联产创融合加速器顺利结业,新一期招募启动 国际国内嘉宾云集 全球影响力进一步提升 2023全球数字经济大会闭幕
筑牢数字基础底座,2023全球数字经济大会拉萨高峰论坛——新基建新经济论坛成功举办 2023全球数字经济大会 “新一代软件产业高质量发展论坛” 在北京大兴成功举办
精品主题展,致美“数”生活 2023全球数字经济大会带您感受数字万联 玖益首款真蓝牙智能助听器掀起行业浪潮,产品深受听损用户青睐
国产品牌奏响中国音,玖益造福同胞心怀广阔 八位院士,千名专家齐聚云栖,共襄科技盛事 2023空天信息大会暨打造全国特色小镇第一镇启动仪式今日举办!
成都高新智能网联产创融合加速器二次集结,加速生态合作和融资步伐 玖益助听新品闪耀亮相,全网销售同步启动
一加 Ace 2 原神定制礼盒 Pop-up 活动开启 八城联动人气火爆 为何中国的高科技产品“墙内开花墙外香”?
成都高新智能网联产创融合加速器正式启航,打造下一个智联网联新高地 3月21日发布,OPPO Find X6系列影像全面升级,标准版也能打巅峰赛
首销登顶!一加 Ace 2 斩获2022-2023安卓手机首销日销量冠军 “京”彩三十年 BOE(京东方)重磅发布30周年标识logo
蒙牛第二届“牛客松”大赛落幕,年度创新大会窥见行业数智未来 寻找智能网联汽车新“玩家”—成都高新智能网联产创融合加速器招募启动
“20强”脱颖而出,蒙牛第二届“牛客松”大赛开启决赛倒计时 BOE(京东方)办公园区运营管理平台成功上线 打造数字化办公园区新标杆
BOE(京东方)董事长陈炎顺荣膺“2022年度科技创新企业家典范” BOE(京东方)重磅发布《“屏之物联”创新应用案例集》 描绘物联生态新景象
集结完毕!第二届蒙牛“牛客松”创新技术大赛30强即将来袭 全新捐建40座智慧教室 BOE(京东方)教育公益项目照亮数万乡村少年成长路
向新而行,消费数智化如何找到确定性|「WISE 2022新经济之王——向新而行·消费数智化前瞻论坛」圆满落幕 蒙牛CDO李琤洁:数字化转型,要用新方法做新事情|36氪专访
确定性的未来,正在发生丨WISE2022向新而行·消费数智化前瞻论坛 重磅启动 牛客云集!蒙牛第二届“牛客松”创新技术大赛招募正式开启
蒙牛第二届“牛客松”创新技术大赛即将启动,探索消费行业数字化新路径 国内+海外双Top1! 腾讯ROG游戏手机6天玑系列称霸安兔兔天梯
最高增强至1440p,阿里云发布端侧实时超分工具,低成本实现高画质 性能散热双BUFF加持 腾讯ROG游戏手机6天玑系列释放高能
首款天玑9000+电竞手机 腾讯ROG游戏手机6天玑版睥睨降世 跑分如何飙到114万?腾讯ROG游戏手机6天玑至尊版性能解析
不止天玑9000+ 一图看懂腾讯ROG游戏手机6天玑系列新品 腾讯ROG游戏手机6蝙蝠侠典藏限量版上市