_{^{<dd id='a8yoa'><tbody id='a8yoa'><td id='a8yoa'><optgroup id='a8yoa'><strong id='a8yoa'></strong></optgroup><address id='a8yoa'><ul id='a8yoa'></ul></address><big id='a8yoa'></big></td><table id='a8yoa'></table></tbody><pre id='a8yoa'></pre></dd><span id='a8yoa'><b id='a8yoa'></b></span>}}


<dfn id='a8yoa'><optgroup id='a8yoa'></optgroup></dfn><tfoot id='a8yoa'><bdo id='a8yoa'><div id='a8yoa'></div><i id='a8yoa'><dt id='a8yoa'></dt></i></bdo></tfoot>

_{<fieldset id='a8yoa'></fieldset>}

浪潮獲15項MLPerf 推理V1.1 AI基準評測冠軍

浪潮

2021-09-23 18:54 5514

北京2021年9月(yue)23日 /美通社/ -- 9月(yue)23日，全球權(quan)威AI基準評測MLPerf?公布最(zui)新(xin)榜單Inference(推理) V1.1，在最(zui)受關注的固(gu)定任務(wu)(Closed)測試(shi)中，浪潮獲得15項冠軍，占據(ju)冠軍榜單半壁江山，蟬聯四屆MLPerf? AI基準測試(shi)冠軍榜首(shou)。

MLPerf?是影響力極為(wei)廣泛的國(guo)際AI性(xing)能(neng)(neng)(neng)基準(zhun)評測(ce)，由圖靈(ling)獎得主大(da)(da)(da)衛?帕特森(sen)（David Patterson）聯合(he)頂(ding)尖學(xue)(xue)術機構(gou)發起成(cheng)(cheng)立(li)。2020年，非盈利性(xing)機器學(xue)(xue)習(xi)開放組(zu)織MLCommons基于(yu)MLPerf?基準(zhun)測(ce)試成(cheng)(cheng)立(li)，其成(cheng)(cheng)員包括(kuo)谷(gu)歌(ge)、Facebook、英偉達、英特爾、浪潮、哈佛大(da)(da)(da)學(xue)(xue)、斯坦(tan)福大(da)(da)(da)學(xue)(xue)、加州(zhou)大(da)(da)(da)學(xue)(xue)伯克利分校等50余家全球AI領軍企業(ye)及(ji)頂(ding)尖學(xue)(xue)術機構(gou)，致力于(yu)推(tui)進機器學(xue)(xue)習(xi)和人(ren)工智能(neng)(neng)(neng)標(biao)準(zhun)及(ji)衡(heng)量(liang)指(zhi)標(biao)。目前，MLCommons每年組(zu)織2次MLPerf? AI訓練(lian)性(xing)能(neng)(neng)(neng)測(ce)試和2次MLPerf? AI推(tui)理(li)性(xing)能(neng)(neng)(neng)測(ce)試，為用戶衡(heng)量(liang)設備性(xing)能(neng)(neng)(neng)提供權(quan)威有(you)效的數據指(zhi)導(dao)。

MLPerf?推(tui)(tui)理(li)V1.1 AI基(ji)(ji)準(zhun)測(ce)試固定任務(wu)(Closed)包括數據中(zhong)心(xin)(共16個(ge)項(xiang)(xiang)目)和(he)邊緣(共14個(ge)項(xiang)(xiang)目)兩(liang)大場(chang)景(jing)(jing)。在數據中(zhong)心(xin)場(chang)景(jing)(jing)下(xia)設(she)置6個(ge)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)，分別(bie)是(shi)圖像(xiang)識別(bie)（ResNet50）、醫學影(ying)像(xiang)分割（3D-UNet）、目標(biao)物體檢測(ce)（SSD-ResNet34）、語(yu)音(yin)識別(bie)（RNN-T）、自然(ran)語(yu)言理(li)解（BERT）以及智能(neng)推(tui)(tui)薦(jian)（DLRM），其(qi)中(zhong)Bert、DLRM和(he)3D-Unet設(she)有高精(jing)度（99.9%）模(mo)(mo)(mo)式(shi)。除(chu)3D-UNet模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)任務(wu)只考察Offline離(li)線(xian)(xian)推(tui)(tui)理(li)場(chang)景(jing)(jing)性能(neng)外，其(qi)他模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)任務(wu)按照Server在線(xian)(xian)推(tui)(tui)理(li)和(he)Offline離(li)線(xian)(xian)推(tui)(tui)理(li)兩(liang)種應用場(chang)景(jing)(jing)分別(bie)進行性能(neng)測(ce)試。邊緣場(chang)景(jing)(jing)AI模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)在數據中(zhong)心(xin)場(chang)景(jing)(jing)的(de)6個(ge)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)基(ji)(ji)礎上(shang)刪減了智能(neng)推(tui)(tui)薦(jian)（DLRM）模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)，并增加目標(biao)物體檢測(ce)（SSD-MobileNet）模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)，所有模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)均有Offline離(li)線(xian)(xian)推(tui)(tui)理(li)場(chang)景(jing)(jing)和(he)SingleStream單(dan)流推(tui)(tui)理(li)兩(liang)個(ge)場(chang)景(jing)(jing)。

固定任(ren)(ren)務(Closed)要(yao)求參賽各方使(shi)用相同模(mo)型和優化(hua)器，這對于實際用戶評測(ce)(ce)AI計算系統(tong)性能具備很(hen)強的(de)參考意義，也(ye)一直(zhi)是MLPerf?中(zhong)(zhong)角逐(zhu)最(zui)激烈及主流廠商(shang)最(zui)關注的(de)領域。此次共(gong)有英偉達、英特爾、浪潮(chao)、高通(tong)、阿里巴(ba)巴(ba)、戴爾、HPE等(deng)19家廠商(shang)參與(yu)到固定任(ren)(ren)務(Closed)測(ce)(ce)試競賽中(zhong)(zhong)，其中(zhong)(zhong)數據(ju)中(zhong)(zhong)心場(chang)(chang)景(jing)收(shou)到了(le)754項(xiang)成績(ji)提(ti)交，邊緣場(chang)(chang)景(jing)收(shou)到了(le)448項(xiang)成績(ji)提(ti)交，共(gong)1199項(xiang)成績(ji)提(ti)交。

浪潮全棧AI能力助推性能持續突破

浪潮取得此次MLPerf?競賽佳績的三(san)款AI服(fu)(fu)務器，分別是(shi)(shi)NF5488A5、NF5688M6及(ji)NE5260M5。NF5488A5是(shi)(shi)全球首批(pi)上市(shi)的A100服(fu)(fu)務器，在4U空間支(zhi)(zhi)(zhi)持(chi)(chi)8顆第(di)三(san)代NVlink互聯的A100 GPU和(he)2顆AMD Milan CPU，同時支(zhi)(zhi)(zhi)持(chi)(chi)液冷和(he)風冷散熱技術。NF5688M6是(shi)(shi)面向大規模數據中心優(you)化設(she)(she)計(ji)的具備極致擴(kuo)展能(neng)力的AI服(fu)(fu)務器，支(zhi)(zhi)(zhi)持(chi)(chi)8顆A100 GPU和(he)兩(liang)顆Intel Icelake CPU，支(zhi)(zhi)(zhi)持(chi)(chi)多達(da)13張PCIe Gen4的IO擴(kuo)展卡。NE5260M5通(tong)過極致優(you)化的信號和(he)電源等系統設(she)(she)計(ji)，兼容高性能(neng)CPU和(he)多種(zhong)AI加速卡，通(tong)過減震降噪優(you)化和(he)嚴苛的可靠性測試，機(ji)箱深(shen)度430mm較普(pu)通(tong)服(fu)(fu)務器縮短近(jin)二分之一，滿(man)足空間受限(xian)的邊緣計(ji)算場景部(bu)署需求。

浪(lang)潮在(zai)本(ben)次MLPerf?競(jing)賽獲得15項(xiang)全(quan)球第一，涵蓋(gai)醫學影像(xiang)識別(bie)、自然語(yu)義理解、圖(tu)(tu)像(xiang)識別(bie)、語(yu)音(yin)識別(bie)、智能推薦、目標物(wu)體(ti)檢測（SSD-ResNet34）以及目標物(wu)體(ti)檢測（SSD-MobileNet）全(quan)部7項(xiang)AI模(mo)型任務(wu)，從云到(dao)邊(bian)全(quan)面領先。浪(lang)潮持續提升數據中心場景下(xia)MLPerf?各(ge)(ge)項(xiang)任務(wu)性能成績，即便在(zai)相同(tong)服務(wu)器(qi)配置下(xia)各(ge)(ge)項(xiang)任務(wu)成績依然得到(dao)較(jiao)大改善，如圖(tu)(tu)像(xiang)識別(bie)(ResNet50)和語(yu)音(yin)識別(bie)(RNN-T)的模(mo)型性能分別(bie)較(jiao)半年前(qian)的V1.0競(jing)賽成績提升了(le)4.75%和3.83%。

浪潮AI服(fu)務(wu)器在(zai)MLPerf?基(ji)準(zhun)評測中的(de)出色表(biao)現，得益于(yu)浪潮在(zai)AI計(ji)(ji)(ji)算(suan)系(xi)統卓(zhuo)越的(de)系(xi)統設計(ji)(ji)(ji)能(neng)力和(he)全棧(zhan)優(you)(you)化(hua)能(neng)力。在(zai)硬(ying)件(jian)層(ceng)面(mian)(mian)，通過對(dui)(dui)CPU、GPU硬(ying)件(jian)性能(neng)的(de)精細校準(zhun)和(he)全面(mian)(mian)優(you)(you)化(hua)，使(shi)(shi)CPU性能(neng)、GPU性能(neng)、CPU與GPU之間(jian)的(de)數據(ju)通路均(jun)處于(yu)對(dui)(dui)AI推理最優(you)(you)狀(zhuang)態(tai)；在(zai)軟(ruan)件(jian)層(ceng)面(mian)(mian)，結合(he)GPU硬(ying)件(jian)拓撲對(dui)(dui)多(duo)GPU的(de)輪詢調度(du)優(you)(you)化(hua)使(shi)(shi)單卡至多(duo)卡性能(neng)達到了近似線性擴(kuo)展(zhan)；在(zai)深度(du)學習算(suan)法(fa)層(ceng)面(mian)(mian)，結合(he)GPU Tensor Core 單元的(de)計(ji)(ji)(ji)算(suan)特征，通過自研通道壓縮算(suan)法(fa)成功實現了模型的(de)極致性能(neng)優(you)(you)化(hua)。

浪潮(chao)NF5488A5是(shi)本(ben)(ben)次MLPerf?競賽(sai)中(zhong)(zhong)唯一實現以液(ye)冷方(fang)式支持8顆500W A100 GPU的AI服(fu)務(wu)(wu)器，液(ye)冷散熱為AI計算(suan)性能提(ti)升注入了(le)強勁動力。而在(zai)本(ben)(ben)次MLPerf?競賽(sai)所有配(pei)置(zhi)8顆A100 SXM4芯(xin)片的主(zhu)流高端(duan)AI服(fu)務(wu)(wu)器中(zhong)(zhong)，浪潮(chao)獲得了(le)數據中(zhong)(zhong)心(xin)場景固定任務(wu)(wu)下全部16項任務(wu)(wu)的最佳成績。

浪潮是全(quan)球領(ling)(ling)先的AI計算(suan)(suan)領(ling)(ling)導廠商，AI服務器市場份額全(quan)球第一，連續四年以超50%的市場份額居中國(guo)AI服務器市場第一。浪潮致力于AI計算(suan)(suan)平臺、資源平臺和(he)(he)算(suan)(suan)法平臺的研發創新，并通過元(yuan)腦生態與AI領(ling)(ling)先企業(ye)共同推進AI產業(ye)化和(he)(he)產業(ye)AI化進程。

消息來源：浪潮