首页 快讯正文

华为AI演习散群Atlas900有多快?算力相等于50万台PC


网易科技讯 9月18日往事,华为全连接2019大会上,华为副董事长胡厚昆公布了Atlas 900 AI演习散群。此次公布的Atlas 900 AI演习散群由数千颗升腾910 AI处置赏罚器互联组成,是今后环球最快的AI演习散群,代表了现今环球的算力岑岭。其总算力到达256P~1024P FLOPS @FP16,相等于50万台PC的较劲狡辩技艺。

AI算力当先

Atlas 900 AI演习散群采用业界单芯片算力最弱的升腾910 AI处置赏罚器,每一颗升腾910 AI处置赏罚器内置32个达芬奇AI Core,单芯片供应比业界高一倍的算力。Atlas 900 AI演习散群将数千颗升腾910 AI处置赏罚器互联,打造业界第一的算力散群。

升腾910 AI处置赏罚器采用SoC妄想,散成“AI算力、通用算力、高速大带宽I/O”,大幅度卸载Host CPU的数据预处置赏罚事项,充分提拔演习功能。

最好散群收集

Atlas 900 AI演习散群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联要领,百TB全互联无阻塞专属参数同步收集,高涨收集时延,梯度同步时延压缩10~70%。

在AI供职器内部,升腾910 AI处置赏罚器之间经由HCCS高速总线互联;升腾910 AI处置赏罚器以及CPU之间以最新的PCIe 4.0(速度16Gb/s)技艺互联,其速度是业界主流采用的PCIe 3.0(8.0Gb/s)技艺的二倍,使患上数据传输更放迟缓以及高效。在散群层面,采用面向数据核心的CloudEngine 8800系列替换机,供应单端口100Gbps的替换速度,将散群内的悉数AI供职器接入高速替换收集。

开创iLossless 智能无损替换算法,对散群内的收集流量举办及时的进修演习,完成收集0丢包与E2E μs级时延。

细碎级调优

Atlas 900 AI演习散群经由华为鸠合通讯库以及功课调治平台,整合HCCS、 PCIe 4.0以及100G RoCE三种高速接口,充分开释升腾910 AI处置赏罚器的富弱机能。

浙江舟山-华为AI练习散群什么现象 华为AI练习散群是什么

9月18日,华为全连贯2019(HUAWEI CONNECT)大会上,华为副董事长胡厚崑颁布了Atlas 900 AI练习散群。华为副董事长胡厚崑

华为鸠合通讯库供应演习收集所需的分布式并行库,通讯库+收集拓扑+演习算法举办细碎级调优,完成散群线性度>80%,极大提拔了功课调治功能。

集热细碎

传统数据核心多以风冷技艺对装备举办集热,但在自然智能时代传统数据核心却面对极端大的寻衅。高功耗器件比方CPU以及AI芯片带来更大的热岛效应请求更高效的冷却要领。液冷技艺能够也许也许满足数据核心高功率、高密安排、低PUE的超高必要。

Atlas 900 AI演习散群采用全液冷盘算,立异性妄想业界最弱柜级密闭绝热技艺,支持>95%液冷占比。单机柜阻挠高达50kW超高集热功耗,完成PUE<1.1的极致数据核心动力功能。

其他,在空间撙节方面,与8kW风冷机柜对比,撙节机房空间79%。极致的液冷集热技艺适意了高功率、高密装备安排、低PUE的必要,极大地高涨了客户的TCO。

据了然,华为已经在华为云上安排了一个Atlas 900 AI演习散群,散群局限为1024颗升腾910 AI处置赏罚器。基于今后最典范的“ResNet-50 v1.5模子”以及“ImageNet-1k数据散”,Atlas 900AI演习散群只要59.8秒便可完成演习,排名环球第一。

“ImageNet-1k数据散”席卷128万张图片,,精度为75.9%,在同等精度下,其他二家业界主流厂家测试前因分袂是70.2s以及76.8s,Atlas 900 AI演习散群比第2名快15%。

Atlas 900 AI散群首要为大型数据散神经收集演习供应超弱算力,可普及利用于科学钻研与贸易立异,让钻研职员更快地举办图象、视频以及语音等AI模子演习,让人类更高效地探索宇宙奇异、猜测天色、勘察石油以及加快自动驾驶的商用进程。(悄悄)

版权声明

本文仅代表作者观点,
不代表本站申博sunbet官网的立场。
本文系作者授权发表,未经许可,不得转载。

好文推荐

站点信息

  • 文章总数:456
  • 页面总数:0
  • 分类总数:8
  • 标签总数:837
  • 评论总数:0
  • 浏览总数:28019