北京2021年9月(yue)23日 /美通社/ -- 9月(yue)23日,全球權(quan)威AI基準評測MLPerf?公布最(zui)新(xin)榜單Inference(推理) V1.1,在最(zui)受關注的固(gu)定任務(wu)(Closed)測試(shi)中,浪潮獲得15項冠軍,占據(ju)冠軍榜單半壁江山,蟬聯四屆MLPerf? AI基準測試(shi)冠軍榜首(shou)。
MLPerf?是影響力極為(wei)廣泛的國(guo)際AI性(xing)能(neng)(neng)(neng)基準(zhun)評測(ce),由圖靈(ling)獎得主大(da)(da)(da)衛?帕特森(sen)(David Patterson)聯合(he)頂(ding)尖學(xue)(xue)術機構(gou)發起成(cheng)(cheng)立(li)。2020年,非盈利性(xing)機器學(xue)(xue)習(xi)開放組(zu)織MLCommons基于(yu)MLPerf?基準(zhun)測(ce)試成(cheng)(cheng)立(li),其成(cheng)(cheng)員包括(kuo)谷(gu)歌(ge)、Facebook、英偉達、英特爾、浪潮、哈佛大(da)(da)(da)學(xue)(xue)、斯坦(tan)福大(da)(da)(da)學(xue)(xue)、加州(zhou)大(da)(da)(da)學(xue)(xue)伯克利分校等50余家全球AI領軍企業(ye)及(ji)頂(ding)尖學(xue)(xue)術機構(gou),致力于(yu)推(tui)進機器學(xue)(xue)習(xi)和人(ren)工智能(neng)(neng)(neng)標(biao)準(zhun)及(ji)衡(heng)量(liang)指(zhi)標(biao)。目前,MLCommons每年組(zu)織2次MLPerf? AI訓練(lian)性(xing)能(neng)(neng)(neng)測(ce)試和2次MLPerf? AI推(tui)理(li)性(xing)能(neng)(neng)(neng)測(ce)試,為用戶衡(heng)量(liang)設備性(xing)能(neng)(neng)(neng)提供權(quan)威有(you)效的數據指(zhi)導(dao)。
MLPerf?推(tui)(tui)理(li)V1.1 AI基(ji)(ji)準(zhun)測(ce)試固定任務(wu)(Closed)包括數據中(zhong)心(xin)(共16個(ge)項(xiang)(xiang)目)和(he)邊緣(共14個(ge)項(xiang)(xiang)目)兩(liang)大場(chang)景(jing)(jing)。在數據中(zhong)心(xin)場(chang)景(jing)(jing)下(xia)設(she)置6個(ge)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing),分別(bie)是(shi)圖像(xiang)識別(bie)(ResNet50)、醫學影(ying)像(xiang)分割(3D-UNet)、目標(biao)物體檢測(ce)(SSD-ResNet34)、語(yu)音(yin)識別(bie)(RNN-T)、自然(ran)語(yu)言理(li)解(BERT)以及智能(neng)推(tui)(tui)薦(jian)(DLRM),其(qi)中(zhong)Bert、DLRM和(he)3D-Unet設(she)有高精(jing)度(99.9%)模(mo)(mo)(mo)式(shi)。除(chu)3D-UNet模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)任務(wu)只考察Offline離(li)線(xian)(xian)推(tui)(tui)理(li)場(chang)景(jing)(jing)性能(neng)外,其(qi)他模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)任務(wu)按照Server在線(xian)(xian)推(tui)(tui)理(li)和(he)Offline離(li)線(xian)(xian)推(tui)(tui)理(li)兩(liang)種應用場(chang)景(jing)(jing)分別(bie)進行性能(neng)測(ce)試。邊緣場(chang)景(jing)(jing)AI模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)在數據中(zhong)心(xin)場(chang)景(jing)(jing)的(de)6個(ge)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)基(ji)(ji)礎上(shang)刪減了智能(neng)推(tui)(tui)薦(jian)(DLRM)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing),并增加目標(biao)物體檢測(ce)(SSD-MobileNet)模(mo)(mo)(mo)型(xing)(xing)(xing)(xing),所有模(mo)(mo)(mo)型(xing)(xing)(xing)(xing)均有Offline離(li)線(xian)(xian)推(tui)(tui)理(li)場(chang)景(jing)(jing)和(he)SingleStream單(dan)流推(tui)(tui)理(li)兩(liang)個(ge)場(chang)景(jing)(jing)。
固定任(ren)(ren)務(Closed)要(yao)求參賽各方使(shi)用相同模(mo)型和優化(hua)器,這對于實際用戶評測(ce)(ce)AI計算系統(tong)性能具備很(hen)強的(de)參考意義,也(ye)一直(zhi)是MLPerf?中(zhong)(zhong)角逐(zhu)最(zui)激烈及主流廠商(shang)最(zui)關注的(de)領域。此次共(gong)有英偉達、英特爾、浪潮(chao)、高通(tong)、阿里巴(ba)巴(ba)、戴爾、HPE等(deng)19家廠商(shang)參與(yu)到固定任(ren)(ren)務(Closed)測(ce)(ce)試競賽中(zhong)(zhong),其中(zhong)(zhong)數據(ju)中(zhong)(zhong)心場(chang)(chang)景(jing)收(shou)到了(le)754項(xiang)成績(ji)提(ti)交,邊緣場(chang)(chang)景(jing)收(shou)到了(le)448項(xiang)成績(ji)提(ti)交,共(gong)1199項(xiang)成績(ji)提(ti)交。
浪潮全棧AI能力助推性能持續突破
浪潮取得此次MLPerf?競賽佳績的三(san)款AI服(fu)(fu)務器,分別是(shi)(shi)NF5488A5、NF5688M6及(ji)NE5260M5。NF5488A5是(shi)(shi)全球首批(pi)上市(shi)的A100服(fu)(fu)務器,在4U空間支(zhi)(zhi)(zhi)持(chi)(chi)8顆第(di)三(san)代NVlink互聯的A100 GPU和(he)2顆AMD Milan CPU,同時支(zhi)(zhi)(zhi)持(chi)(chi)液冷和(he)風冷散熱技術。NF5688M6是(shi)(shi)面向大規模數據中心優(you)化設(she)(she)計(ji)的具備極致擴(kuo)展能(neng)力的AI服(fu)(fu)務器,支(zhi)(zhi)(zhi)持(chi)(chi)8顆A100 GPU和(he)兩(liang)顆Intel Icelake CPU,支(zhi)(zhi)(zhi)持(chi)(chi)多達(da)13張PCIe Gen4的IO擴(kuo)展卡。NE5260M5通(tong)過極致優(you)化的信號和(he)電源等系統設(she)(she)計(ji),兼容高性能(neng)CPU和(he)多種(zhong)AI加速卡,通(tong)過減震降噪優(you)化和(he)嚴苛的可靠性測試,機(ji)箱深(shen)度430mm較普(pu)通(tong)服(fu)(fu)務器縮短近(jin)二分之一,滿(man)足空間受限(xian)的邊緣計(ji)算場景部(bu)署需求。
浪(lang)潮在(zai)本(ben)次MLPerf?競(jing)賽獲得15項(xiang)全(quan)球第一,涵蓋(gai)醫學影像(xiang)識別(bie)、自然語(yu)義理解、圖(tu)(tu)像(xiang)識別(bie)、語(yu)音(yin)識別(bie)、智能推薦、目標物(wu)體(ti)檢測(SSD-ResNet34)以及目標物(wu)體(ti)檢測(SSD-MobileNet)全(quan)部7項(xiang)AI模(mo)型任務(wu),從云到(dao)邊(bian)全(quan)面領先。浪(lang)潮持續提升數據中心場景下(xia)MLPerf?各(ge)(ge)項(xiang)任務(wu)性能成績,即便在(zai)相同(tong)服務(wu)器(qi)配置下(xia)各(ge)(ge)項(xiang)任務(wu)成績依然得到(dao)較(jiao)大改善,如圖(tu)(tu)像(xiang)識別(bie)(ResNet50)和語(yu)音(yin)識別(bie)(RNN-T)的模(mo)型性能分別(bie)較(jiao)半年前(qian)的V1.0競(jing)賽成績提升了(le)4.75%和3.83%。
浪潮AI服(fu)務(wu)器在(zai)MLPerf?基(ji)準(zhun)評測中的(de)出色表(biao)現,得益于(yu)浪潮在(zai)AI計(ji)(ji)(ji)算(suan)系(xi)統卓(zhuo)越的(de)系(xi)統設計(ji)(ji)(ji)能(neng)力和(he)全棧(zhan)優(you)(you)化(hua)能(neng)力。在(zai)硬(ying)件(jian)層(ceng)面(mian)(mian),通過對(dui)(dui)CPU、GPU硬(ying)件(jian)性能(neng)的(de)精細校準(zhun)和(he)全面(mian)(mian)優(you)(you)化(hua),使(shi)(shi)CPU性能(neng)、GPU性能(neng)、CPU與GPU之間(jian)的(de)數據(ju)通路均(jun)處于(yu)對(dui)(dui)AI推理最優(you)(you)狀(zhuang)態(tai);在(zai)軟(ruan)件(jian)層(ceng)面(mian)(mian),結合(he)GPU硬(ying)件(jian)拓撲對(dui)(dui)多(duo)GPU的(de)輪詢調度(du)優(you)(you)化(hua)使(shi)(shi)單卡至多(duo)卡性能(neng)達到了近似線性擴(kuo)展(zhan);在(zai)深度(du)學習算(suan)法(fa)層(ceng)面(mian)(mian),結合(he)GPU Tensor Core 單元的(de)計(ji)(ji)(ji)算(suan)特征,通過自研通道壓縮算(suan)法(fa)成功實現了模型的(de)極致性能(neng)優(you)(you)化(hua)。
浪潮(chao)NF5488A5是(shi)本(ben)(ben)次MLPerf?競賽(sai)中(zhong)(zhong)唯一實現以液(ye)冷方(fang)式支持8顆500W A100 GPU的AI服(fu)務(wu)(wu)器,液(ye)冷散熱為AI計算(suan)性能提(ti)升注入了(le)強勁動力。而在(zai)本(ben)(ben)次MLPerf?競賽(sai)所有配(pei)置(zhi)8顆A100 SXM4芯(xin)片的主(zhu)流高端(duan)AI服(fu)務(wu)(wu)器中(zhong)(zhong),浪潮(chao)獲得了(le)數據中(zhong)(zhong)心(xin)場景固定任務(wu)(wu)下全部16項任務(wu)(wu)的最佳成績。
浪潮是全(quan)球領(ling)(ling)先的AI計算(suan)(suan)領(ling)(ling)導廠商,AI服務器市場份額全(quan)球第一,連續四年以超50%的市場份額居中國(guo)AI服務器市場第一。浪潮致力于AI計算(suan)(suan)平臺、資源平臺和(he)(he)算(suan)(suan)法平臺的研發創新,并通過元(yuan)腦生態與AI領(ling)(ling)先企業(ye)共同推進AI產業(ye)化和(he)(he)產業(ye)AI化進程。