联想陈振宽:异构智算 释放AI基础设施新动能

4月18日,以“AI for All,让世界充满AI”为主题的联想创新科技大会(2024 Lenovo Tech World)在上海举办。

联想集团副总裁、联想中国基础设施业务群总经理陈振宽以《异构智算 释放AI基础设施新动能》为主题进行了演讲,分享联想在AI基础设施领域的战略布局、核心能力与技术创新成果。

“在人工智能1.0时代,基于全球智慧和本地创新,联想打造了全面的基础设施产品组合,包括计算、存储、网络、边缘和超融合,并在通用计算、科学计算和AI计算等不同算力领域获得大量的最佳实践,帮助千行百业的客户取得成功。”陈振宽表示,如今大模型开启的AI 2.0时代已经迈着大步朝我们走来,我们需要重塑过去积累的技术,来升级联想基础设施。

联想陈振宽:异构智算 释放AI基础设施新动能

联想集团副总裁、联想中国基础设施业务群总经理陈振宽

为解决用户面临的挑战,联想AI基础设施将聚焦三大领域实现科技创新,即超强算力、核心算法和液冷创新,释放AI基础设施新动能。他介绍说,基于三大领域,联想已经积累了八项核心能力,包括高性能、高可靠性以及液冷技术等。他重点分享了针对AI 2.0时代的五大创新技术,包括:算力匹配魔方、GPU内核态虚拟化、联想集合通信算法库、AI高效断点续训技术、AI与HPC集群超级调度器。

此外,陈振宽在大会上正式发布了联想万全异构智算平台。“联想万全异构智算平台是AI 2.0时代联想中国基础设施战略框架的核心。”他说,作为联想“全栈AI”战略布局的中坚力量,联想中国基础设施业务正以“一横五纵”战略框架,通过构建布局完整、稳定高效的AI导向的基础设施,为企业智能化转型打造坚实可靠的智算底座。

联想AI基础设施聚焦三领域,应对AI 2.0时代的算力挑战

过去40年,联想积累了包括全球供应能力、全球研发能力以及全球生态能力的全球智慧,并引领了一个又一个的中国IT技术发展浪潮。在通用计算领域,联想的x86服务器可靠性连续9年第一,截至2023年底已斩获536项性能世界纪录;在科学计算领域,联想9次实现中国HPCTOP 100 NO.1,助力中国在科学计算、仿真、气象等前沿领域的创新突破;联想基于中国特色需求设计了完整AI基础设施组合,助力中国客户赢得AI 1.0时代的发展。

在AI 2.0时代,AI大模型具备超强的泛化、生成能力,促使人工智能进入更广的应用场景和更深的业务流程中。陈振宽提到,在制造、金融、医疗、交通、能源、政府等各行业中,大模型在产品设计、金融评估、办公辅助、自动驾驶、能源调配等方方面面,颠覆式地改变生产方式,极速促进生产效率。然而,陈振宽也认为,随着AI 2.0时代对于AI算力的需求快速增加,算力使用者在使用AI基础设施的时候正在面临巨大的挑战。

陈振宽进一步介绍了AI 2.0时代用户在AI基础设施领域面临四大挑战:

如何选择和匹配算力是第一大挑战。陈振宽指出,目前已经有五种以上主流算法框架和十种以上算子库来支持不同的应用场景。同时,不同类型的GPU、服务器、存储和网络组成了上百种不同的集群配置。场景、算法和集群之间的选择和验证,不但技术繁杂而且周期长。

其次是如何减少故障中断时间。陈振宽强调,目前千卡集群每月至少有15次的故障断点。在常规的断点续训手段下,每次恢复训练需要几个小时,产生的额外费用超过百万元。随着AI集群规模从千卡到万卡,故障中断次数及恢复所需时间呈指数级增长。

第三大挑战是如何改善AI算力利用率。陈振宽引用行业通用的指标MFU(模型算力利用率)来作阐述,他指出当前业内MFU普遍在30%左右,顶尖的集群利用率也只能做到50%。行业需要解决GPU卡利用率,集群通讯效率,AI故障恢复,算法匹配度等系统性问题。

第四大挑战是如何突破散热瓶颈,降低PUE。陈振宽指出,在算力升级带来的能耗飙升的情况下,如何通过先进的散热技术,突破芯片在系统中的散热瓶颈,同时提升能效,降低数据中心PUE。

联想陈振宽:异构智算 释放AI基础设施新动能

联想AI基础设施持续聚焦三大领域

为解决上述用户面临的挑战,陈振宽强调,联想AI基础设施持续聚焦三大领域,实现科技创新。首先是超强算力,智能匹配:为用户匹配经过验证优化的最佳算力;其次是核心算法,极致提效:以核心算法挖掘算力潜力,提升计算效率。第三,液冷创新,算力绿化:以先进的液冷技术帮助用户节能增效,并突破芯片散热的瓶颈。

公布五大技术创新,首发万全异构智算平台

“联想在这三大领域里面长期耕耘,积累了八项核心能力。”陈振宽重点介绍了联想为AI 2.0时代带来的五大技术创新:

第一,用户智能匹配算力的算力匹配魔方。基于海量的硬件评测和AI算子算法集成工作,联想构建了AI场景与算法与集群硬件三者匹配关系的算力魔方知识库,来标识AI场景、算法、集群配置这三者的匹配关系。用户只需输入场景和数据,算力魔方即可自动加载最优算法,并调度最佳集群配置。

联想陈振宽:异构智算 释放AI基础设施新动能

陈振宽介绍联想五大技术创新

第二,逼近GPU算力极限的GPU内核态虚拟化。联想研究院开发了在GPU驱动层的内核态虚拟化算法,新算法可以将虚拟化造成的GPU算力损耗降到5%以下,极致情况可以降到1%以下,大幅提升GPU利用率。

第三,提升网络通信效率的联想集合通信算法库。可实现对多类型网络拓扑的实时感知,并以先进算法使数据在拓扑中以最佳路径进行传输。以千卡规模集群为例,采用集成了联想集合通信库的联想异构智算平台做管理调度,可使网络通信效率提升超10%,并且集群规模越大,效果越显著。

第四,减少AI训练中断时间的AI高效断点续训技术。联想异构智算平台对大量的AI训练故障进行了特征采样,开发了预测AI训练故障的AI模型,实现“用AI来预测AI”。在断点前提前优化备份,由此能将断点续训恢复时间缩减到分钟级,大幅提升了训练效率,以千卡集群为例,每月可节约上百万元算力费用支出,让宝贵的AI算力持续可用。

第五,AI与HPC集群超级调度器。这是针对混合集群做资源共享的前沿技术。联想AI与HPC超级调度器架构于AI和HPC调度之上,能够切换AI和HPC的调度沟通,能全局监控任务和动态共享资源,使得用户可以充分利用基础设施的每一分算力。

除了公布以上五大技术创新,陈振宽还在大会上正式发布了“联想万全异构智算平台”。他表示,联想万全异构智算平台是AI 2.0时代联想中国基础设施战略框架的核心,它融合了联想的五大技术创新,是AI 2.0时代大模型训练和推理的基础设施底座。

对于未来的研究方向,陈振宽透露,联想将挑战超过万卡规模集群的通讯算法优化,挑战秒级的断点续训,深入研究相变式液冷技术,布局模块化液冷数据中心。这些技术帮助AI算力朝着更强大、更稳定、更高效和更绿色的方向,高质量发展。

“人工智能技术给我们带来的新时代是百花齐放,百舸争流的时代,也将是英雄辈出的时代。”陈振宽表示,联想将持续投入,坚持创新,持续升级万全之力,为英雄助力,成就英雄。加速中国智能化转型,释放社会进步新动能。

延伸阅读:

  • 本文素材来自互联网,如有侵权,请联系将及时删除!

WEEX唯客是一家安全易用的加密货币交易所,由新加坡顶级区块链投资机构斥资1亿美元打造,注册用户超百万,日均交易额超15亿美元,已获得美国MSB、加拿大MSB、SVGFSA金融牌照。

WEEX唯客平台所有数据皆于海外数据库严格保存,服务器多地部署和备份,并采用满足银行级安全需求的亚马逊AWS及高速高稳定性的香港CDN,为全球用户提供最安全、最专业、最具隐私性的交易服务。

WEEX唯客是全球交易深度最好的合约交易所之一,位居CMC交易所流动性排名前五,订单厚度、价差领先同行,微秒级撮合,零滑点、零插针,最大程度降低交易成本及流动性风险,让用户面对极端行情也能丝滑成交。

在WEEX唯客,用户不仅能享受行业最低的交易手续费(Taker 0手续费,Maker 0.06%),还可零门槛一键跟随专业交易员操作,复制高手的交易策略,平台严格甄选数5,000多名优秀交易员供用户挑选。

为保障用户资金安全,WEEX唯客设立了1,000 BTC投资者保护基金,以在非用户自身原因的情况下有效补偿用户资金出现的意外损失,并公示资金池热钱包地址,让用户交易安心无忧。

WEEX官网:weex.com

你也可以在 CMCCoingecko非小号X (Twitter)中文 X (Twitter)YoutubeFacebookLinkedin微博 上关注我们,第一时间获取更多投资资讯和空投福利。

在线咨询

WEEX华语社群:https://t.me/weex_group

WEEX英文社群:https://t.me/Weex_Global

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情

    暂无评论内容

随即推荐
WEEX交易所正式获得SVGFSA牌照 加速推动全球化战略布局-H5资源网

WEEX交易所正式获得SVGFSA牌照 加速推动全球化战略布局

WEEX交易所继取得美国MSB、加拿大MSB牌照之后,正式获得的第三张全球监管牌照,将有助于加速推动WEEX交易所是继欧易OKX、CoinW币赢等平台之后,少数几个受到该国政府监管与认可的运营透明度的紧...
5个月前
03114
微商助手 v3.2.2 ,僵尸粉检测等多功能、高级版-H5资源网

微商助手 v3.2.2 ,僵尸粉检测等多功能、高级版

微商助手软件拥有海量的微商工具,微商助手是微商、群发、拓宽人脉的营销神器,微商助手有群发消息图片,让你群发消息推广快人一步,严格按照微信官方使用规则操作,基于安全稳定的情况下,为微...
1个月前
0406
81节受益终身身心课程-H5资源网

81节受益终身身心课程

中医学家肖然携然健康团队·准备了一套独家研发的家庭身心保健课,辨、通、调、养四位一体的家庭保健方法解决你家庭经常遇到的一系列生理健康、心理调节难题。
12个月前
0307
简述电脑系统有哪几种-H5资源网

简述电脑系统有哪几种

电脑系统?可能很多小伙伴的第一反应就是windows操作系统,其实除了windows之外,还有一些其他的电脑系统种类的,最近有些用户想了解一下电脑系统有哪几种,下面小编就给大家详细介绍一下。
11个月前
03513
你早该这么玩Excel视频课程-H5资源网

你早该这么玩Excel视频课程

原来Excel真的这么好玩!我还以为像我这种菜鸟,跟这些方格子就无缘了呢。现在Excel变得听话了,效率也提高了很多,我再也不用“嗷嗷待哺”地等待着高手来帮我调表了,你早该这么玩 Excel!本课...
12个月前
03111
雨林木风系统下载后如何安装-H5资源网

雨林木风系统下载后如何安装

雨林木风系统应该有不少用户都用过吧,现在也有很多用户想要安装这个系统来进行使用,这里就给大家分享雨林木风系统下载后安装方法,感兴趣的用户来学一下吧。
11个月前
02210
简述500g硬盘数据恢复价格和怎么恢复方法-H5资源网

简述500g硬盘数据恢复价格和怎么恢复方法

500g硬盘数据恢复多少钱呢?很多小伙伴使用的电脑硬盘是500g左右大小,但是当出现了故障问题,现在急需将里面的数据恢复,想送给别人修复,担心价格太贵,不知道具体收费标准。下面小编我就给大...
11个月前
04914
电脑操作系统有哪些-H5资源网

电脑操作系统有哪些

所谓的操作系统就是管理电脑硬件与软件程序,所有的软件都是基于操作系统程序的基础上去开发的。其实操作系统种类是很多的,用工业用的,商业用的,个人用的,涉及的范围很广。下面与大家分享我...
12个月前
04315
简述怎么可以删除数据恢复工具软件-H5资源网

简述怎么可以删除数据恢复工具软件

怎么可以删除数据恢复工具?不少小伙伴困惑找不到卸载软件的入口。下载软件容易,有时候卸载软件难。在这里小编教你删除数据恢复工具软件方法步骤,该方法也同样适用于其它软件的卸载哦。
11个月前
0397
洛阳数据恢复工具分享-H5资源网

洛阳数据恢复工具分享

工具/原料:系统版本:windows10系统品牌型号:惠普战66五代好用的数据恢复工具推荐:
11个月前
0386