您现在的位置是:耀协新闻网 > 网络 >
阿里云AI基础设施升级亮相 模型算力利用率提升超20%
网络 人已围观
简介阿里云AI基础设施升级亮相 模型算力利用率提升超20% 9月20日,2024云栖大会现场,阿里云全面展示了全新升级后的AI Infra系列产品及能力。通……...
9月20日,2024云栖大会现场,阿里云全面展示了全新升级后的AI Infra系列产品及能力。通过全栈优化,阿里云打造出一套稳定和高效的AI基础设施,连续训练有效时长大于99%,模型算力利用率提升20%以上。
“AI创新需要新形态的云基础设施。”阿里云副总裁、弹性计算及存储产品线负责人吴结生表示,阿里云整合底层的计算、存储、网络等资源,实现了统一调度和软硬一体优化,以满足模型训练和推理的爆发式AI算力需求。
基于全新的CIPU2.0,阿里云新推出磐久AI服务器,实现单机16卡、显存1.5T以上,支持Solar RDMA互联。磐久AI服务器采用超钛金电源实现97%以上的高能效,并可通过AI算法预测GPU故障,准确率达92%,保障AI算力的性能和稳定性。
在存储方面,阿里云并行文件存储CPFS实现端到端全链路性能提升,单客户端吞吐达25GB/s,高性能数据流动达到100GB/s,为AI智算提供指数级扩展存储能力。
为AI设计的高性能网络架构HPN7.0,性能和稳定性也再次提升,其中,集合通信性能提升1倍以上,模型端到端训练性能提升10%以上。
通过底层计算、存储、网络等基础设施的升级,阿里云灵骏集群可提供超大规模、超强性能的智能算力,万卡规模性能线性度超过96%,并行存储吞吐20TB/s,万卡规模下网络带宽利用率超过99%,可支持单集群十万卡级别AI算力规模。
面向AI业务,阿里云计算产品也大幅演进更新。本次云栖大会上,容器服务ACK面向AI实现重磅升级,大模型应用冷启动延迟降低85%,并可提供15000个超大规模节点支持。同时,容器计算服务ACS即将推出 GPU容器算力。(李记)
相关文章
随机图文
-
内蒙古移动赋能三十一号村数智发展幸福路
近日,为表彰内蒙古移动呼和浩特分公司(以下简称“呼和浩特移动”)为改善乡村通信条件以及推动数字乡村建设所作出的贡献,内蒙...…… -
向“网”未来 中国电科新质引领数智赋能
向“网”未来 中国电科新质引领数智赋能 原标题:新质引领数智赋能,中国电科与您共同向“网”未来 | 乌镇峰会 11月20...…… -
“晶”选品牌 移动爱家用AI得人心
“晶”选品牌,移动爱家用AI得人心………… -
浙江联通:多项黑科技护航乌镇世界互联网大
浙江联通以5G-A融合AI技术,将5G-A、50G PON稳定时延、数字孪生等先进技术融入会议,从“安全、升级、制造、前...…… -
算网筑基 智领未来 2024人工智能与智
11月19日,在2024年世界互联网大会乌镇峰会期间,由中国联合网络通信有限公司浙江省分公司、桐乡市人民政府联合主办,中...…… -
AI前沿讲习班(CAAI-AIDL)第十
11月15日至16日,由中国人工智能学会(CAAI)主办,CAAI智能创意与数字艺术专委会、CAAI会员服务工委会及CA...…… -
华为Mate70将首发多项创新AI功能
AI是毋庸置疑的时代大势——面向科技领域的前沿探索、推动商业世界的创新变革、针对日常生活的点滴改变等,都有AI在其中扮演...…… -
巴彦淖尔移动:为中蒙边境偏远嘎查架起“信
巴彦淖尔移动将继续致力于边境地区的通信覆盖建设,为当地居民生活带来更多的便利和幸福,让每一寸土地都能充分体验到现代通信技...……