在数字经济浪潮汹涌澎湃的今天,人工智能技术已跃升为推动各行业数字化转型、激发经济新活力的核心驱动力,大量人工智能应用正在被开发和投入应用。与此同时,数据中心也面临新一轮的升级和重构需求,算力网络正是推动这一变革的主要动力之一。
由于大语言模型对算力需求的不断增长带来了GPU集群规模的不断扩大,从而对网络性能、可靠性及成本效益提出了更为严苛的要求。面对新的挑战,如何构建面向AI应用的新一代智算网络成为不少企业需要面对的问题。
在日前举行的以“算网融合 筑梦智算未来——加速释放AI时代的算力新潜能”为主题的线上活动中,联想产品技术专家们就面向AI时代的数据网络和服务器技术创新、算网深度融合的一体化解决方案等热点话题进行了深度分享。
在AI网络市场,联想能提供端到端智算网络解决方案,从千兆、万兆、25G、100G接入交换机,到100G核心交换机,再到400G核心交换机,可以满足数据中心主流的智算网络建设需求。比如,通过spine-leaf架构可以支持2000台-4000台的组网规模,也能适配小规模HPC&AI网络的组网。
以联想问天NE8570-4C交换机为例,这是一款4U 128端口的板卡式100G交换机,交换容量达到25.6Tbps,转发性能达到8000Mpps。联想问天NE8570-4C交换机采用英特尔至强处理器,可以提供运营商级别的可靠性。同时,由联想问天NE8570-4C交换机和联想问天NE2580E/NE1080E交换机构建的“去二层网络”有以下优势:
能屏蔽广播风暴以及不稳定问题
能支持RoCE,提供更低转发延时
接入Leaf去堆叠,升级不断网,符合主流的技术发展路线
而且联想问天NE8570-4C交换机还是一款高性价比的交换机,在硬件成本上可节约47%,用电成本上节约71%。另外,因为去框式,还可以带来24%的空间节省。
联想还推出了多款国产芯片交换机,以满足客户对自主可控的需求。
联想问天NE6730G交换机就是其中之一,一款48端口万兆交换机,性能上达到了博通Trident 3的水平,交换容量4.8T(双向),包转发2000Mpps,能够满足数据中心的各种主流网络需求,如支持去堆叠的MLAG、VxLAN、MPS VPN等,能实现自动化部署、弹性扩展,支持RoCE以及运维智能化等功能。
在智算数据中心的建设上,联想不只是关注网络产品本身,还在算力侧同步发力,通过算网融合为智算应用赋能。针对当前火爆的AI市场,联想有三款主力AI服务器,搭载英特尔®至强®6处理器,面向大模型训练的联想问天WA7780 G3、训推一体的联想问天WA5480 G3、面向推理的联想问天WA5220 G3。这几款AI服务器分别针对主要面对的应用场景进行了针对性的优化。
英特尔®至强®6处理器与上一代相比,性能得到进一步提升,单处理器核数提升225%,AI工作负载性能提升翻倍,单机柜性能输出提升42%,CPU支持高达650亿个参数模型AI推理。
要充分释放AI服务器的算力潜能,需要配置合适的网络架构。针对联想问天WA5480 G3,联想推荐采用“283架构”,即2颗CPU、8张GPU卡、3张网卡的配置。其中,2张400G的IB或者RoCE网卡负责东西向的数据交换,一张400G或者200G的IB或者RoCE网卡负责南北向的数据传输。
本次活动中还特别邀请了英特尔嘉宾分享了英特尔在AIGC时代的愿景以及英特尔和联想等合作伙伴一起基于英特尔产品打造的AIGC解决方案。
实际上,面对AIGC的需求,英特尔在端、边、云都能提供强大的算力支持。比如,在端侧有酷睿处理器,在边和云端有至强、至强W以及ARC和Gaudi GPU等。同时英特尔还与联想等合作伙伴一起为客户打造算网融合的一体化智算解决方案。以Arc GPU为例,这是一个面向游戏、视频渲染以及视频分析场景的产品,现在大量应用于大语言模型的推理上。基于Arc的智算方案因为是基于高性能至强处理器打造,不仅高性能而且更稳定。同时,生态开源,能带来更低的TCO,这使得整体方案具有更高性价比。
当前,人工智能以及大语言模型等技术仍处于飞速发展,对于算力的需求还将持续增长,作为支撑技术的算力网络也需要齐头并进。显然,在智算网络演进过程中,能提供更高带宽、更低延时、更高可靠性和可扩展性,同时具有更高性价比的智算网络方案才能在这一波AI浪潮中立于潮头。
而联想“与时俱进”发布全新的网络产品线并打造场景化和定制化的解决方案,将助力联想和英特尔合作伙伴一起以全新的创新力和产品力,打造出更高品质的智算网络,助力构筑坚实网络底座。