北京2021年10月21日 /美通社/ -- “推(tui)進教育(yu)新(xin)型基礎設(she)施(shi)建(jian)(jian)設(she)構建(jian)(jian)高(gao)質(zhi)量教育(yu)支撐體(ti)系的(de)指(zhi)導意見(jian)”明確將高(gao)性能計算(suan)平臺(tai)(以下簡稱“HPC”)定位(wei)于“智慧科研(yan)(yan)設(she)施(shi)”領域之(zhi)中。HPC作為(wei)高(gao)等(deng)院校教科研(yan)(yan)的(de)關鍵算(suan)力(li)平臺(tai),其在(zai)氣象預(yu)報(bao)、地質(zhi)勘探(tan)、生物科學以及宏(hong)觀經濟(ji)預(yu)測等(deng)教學、科研(yan)(yan)的(de)過程中已經成為(wei)一個關鍵抓手。
HPC備受高(gao)等(deng)院(yuan)校(xiao)(xiao)青睞(lai),其最(zui)初的(de)(de)(de)動因來自于(yu)科(ke)(ke)學(xue)(xue)研究領域(yu)中(zhong),人們對(dui)于(yu)“第三范式(shi)”,即計算科(ke)(ke)學(xue)(xue)的(de)(de)(de)依賴。伴隨著大數據(ju)、人工智能等(deng)領域(yu)在教學(xue)(xue)科(ke)(ke)研中(zhong)所扮演的(de)(de)(de)角色越加重要,以及關于(yu)科(ke)(ke)研領域(yu)“第四范式(shi)”,即數據(ju)密集(ji)型科(ke)(ke)學(xue)(xue)議題的(de)(de)(de)出現(xian),使(shi)得當下高(gao)等(deng)院(yuan)校(xiao)(xiao)對(dui)服(fu)務(wu)于(yu)科(ke)(ke)研領域(yu)的(de)(de)(de)核心算力平臺有了新的(de)(de)(de)需(xu)求。
以(yi)傳統HPC為(wei)代表的(de)高(gao)(gao)(gao)校(xiao)科研(yan)(yan)算(suan)(suan)(suan)力(li)(li)平(ping)臺(tai),正在(zai)朝著(zhu)既(ji)能(neng)滿足HPC,又(you)可以(yi)實現AI、大數據(ju)等(deng)計(ji)算(suan)(suan)(suan)服務的(de)算(suan)(suan)(suan)力(li)(li)平(ping)臺(tai) -- “智算(suan)(suan)(suan)中心(xin)”演進升級。浪(lang)潮(chao)前瞻性(xing)地(di)提出(chu)了(le)“智算(suan)(suan)(suan)中心(xin)”,其在(zai)高(gao)(gao)(gao)校(xiao)構建智慧(hui)科研(yan)(yan)設施的(de)過(guo)程中,滿足了(le)師生們在(zai)教學(xue)與科研(yan)(yan)的(de)過(guo)程中對(dui)多元算(suan)(suan)(suan)力(li)(li)的(de)要求。算(suan)(suan)(suan)力(li)(li)平(ping)臺(tai)對(dui)于底層網(wang)絡(luo)基(ji)礎設施,在(zai)架構、性(xing)能(neng)、運(yun)維等(deng)方(fang)面提出(chu)的(de)挑(tiao)戰伴隨算(suan)(suan)(suan)力(li)(li)多元化(hua)而來。浪(lang)潮(chao)網(wang)絡(luo)依托浪(lang)潮(chao)集團在(zai)“智算(suan)(suan)(suan)中心(xin)”領域所(suo)擁有的(de)整體實力(li)(li),作為(wei)中國(guo)創新型(xing)網(wang)絡(luo)產品、技術、方(fang)案供應商,針對(dui)智慧(hui)科研(yan)(yan)設施HPC算(suan)(suan)(suan)力(li)(li)平(ping)臺(tai)的(de)新需求、新趨勢(shi),推出(chu)了(le)“高(gao)(gao)(gao)等(deng)院校(xiao)HPC網(wang)絡(luo)解(jie)決方(fang)案”。
HPC+AI 科研(yan)算力平臺面臨的升級之“困”
高校在圍繞“智(zhi)(zhi)算中心”構建智(zhi)(zhi)慧科(ke)研基礎(chu)設(she)施的過程(cheng)中,一方面要解決當下現(xian)有科(ke)研算力分(fen)散的“短板”,同(tong)時還面臨如何化解全新多元(yuan)科(ke)研算力對(dui)于底層網絡平臺提出(chu)的挑戰。
長期以來,部(bu)分(fen)高(gao)校的HPC建設(she)并未得到有效整(zheng)合,造成(cheng)算(suan)(suan)力(li)(li)(li)資源(yuan)利用(yong)效率不高(gao)、平臺運(yun)維管理(li)繁(fan)重。與此同時,AI、大數據(ju)應用(yong)的激增,加劇了(le)科(ke)研(yan)“算(suan)(suan)力(li)(li)(li)孤島”現象的增多。通過整(zheng)合現有科(ke)研(yan)算(suan)(suan)力(li)(li)(li),不僅能夠充分(fen)釋放算(suan)(suan)力(li)(li)(li)效能,同時在算(suan)(suan)力(li)(li)(li)能耗、運(yun)維管理(li)等方面也會帶來質的改(gai)變。
網絡(luo)基礎架構作為科(ke)研(yan)算力(li)平臺(tai)的(de)(de)(de)關鍵一環,面(mian)對算力(li)多元化、巨(ju)量化的(de)(de)(de)發展趨勢,其在(zai)架構、技(ji)術(shu)上需要做(zuo)出(chu)全新的(de)(de)(de)改變。在(zai)國(guo)家信息中(zhong)心(xin)聯合浪潮(chao)所(suo)發布(bu)的(de)(de)(de)《智(zhi)能(neng)計算中(zhong)心(xin)規劃建(jian)設指南》中(zhong),圍繞科(ke)研(yan)算力(li)平臺(tai)建(jian)設指出(chu) -- 針對HPC、大(da)(da)數(shu)據(ju)以及(ji)AI等(deng)應(ying)用需求,現(xian)有的(de)(de)(de)數(shu)據(ju)中(zhong)心(xin)網絡(luo)在(zai)彈性(xing)、可擴展性(xing)以及(ji)功能(neng)靈活性(xing)等(deng)方面(mian)都存在(zai)不足,難(nan)以勝任(ren)當前科(ke)研(yan)算力(li)這(zhe)類大(da)(da)規模(mo)計算集群的(de)(de)(de)需求。
科研算力向“智算”升級 網絡基座需先行
作為全(quan)球領先的(de)HPC解決方(fang)案提供商 -- 浪(lang)潮為高校提供的(de)科(ke)研(yan)算力(li)平臺,具(ju)備(bei)從計算節點、異構加速(su)、并行存(cun)儲、高速(su)網(wang)絡(luo)、集(ji)群管理(li)的(de)全(quan)棧解決方(fang)案。而浪(lang)潮網(wang)絡(luo)圍繞科(ke)研(yan)算力(li)平臺的(de)應用特點和技術難點,在網(wang)絡(luo)架(jia)構、技術及設備(bei)選用等維度,提供了完備(bei)的(de)解決方(fang)案。
為了有效(xiao)支(zhi)撐(cheng)異構算(suan)(suan)力平(ping)臺,例如AI、大數據(ju)等(deng)應用(yong)(yong)的(de)(de)需求,以(yi)及滿(man)足數值計算(suan)(suan)的(de)(de)HPC應用(yong)(yong)所需,浪(lang)潮網絡在整(zheng)體(ti)架(jia)構層面,采(cai)用(yong)(yong)Spine-Leaf網絡架(jia)構設計,替(ti)代傳統(tong)的(de)(de)胖樹結構,構建端(duan)到端(duan)無阻塞、無收斂的(de)(de)高(gao)速數據(ju)轉發網絡。在此(ci)基(ji)礎上,浪(lang)潮網絡通(tong)過(guo)提供(gong)支(zhi)持 RoCE的(de)(de)網絡設備,在以(yi)太網上實現(xian)了RDMA 功能,為HPC這類數據(ju)密(mi)集型(xing)計算(suan)(suan)任務提供(gong)了超低(di)的(de)(de)數據(ju)延(yan)遲高(gao)速交換和高(gao)效(xiao)的(de)(de)網絡資源利用(yong)(yong)率,在絕大部分HPC場景中可有效(xiao)替(ti)代傳統(tong)上昂貴的(de)(de)基(ji)于Infiniband的(de)(de)解決方(fang)案(an),同(tong)時浪(lang)潮網絡的(de)(de)HPC解決方(fang)案(an)已(yi)在大量的(de)(de)985、211院校得到規模應用(yong)(yong)。
在浪(lang)潮網(wang)絡HPC解(jie)決(jue)方案(an)中,CN12900、CN9000、CN6000等高(gao)(gao)速低延遲(chi)數(shu)據中心交換機,在無損以太網(wang)、支持RoCE等方面的(de)特(te)點,為高(gao)(gao)校科研(yan)(yan)算力(li)平臺(tai)構建(jian)起一套具(ju)(ju)備高(gao)(gao)冗余、低延遲(chi)、無阻塞的(de)網(wang)絡基(ji)礎(chu)平臺(tai)。整套解(jie)決(jue)方案(an)不(bu)僅(jin)確保了科研(yan)(yan)算力(li)平臺(tai)高(gao)(gao)速、安全、穩定運行,同時其所具(ju)(ju)備的(de)靈活、彈性的(de)系統升級、擴容能力(li),也使得科研(yan)(yan)算力(li)平臺(tai)的(de)投入更加合理可(ke)控(kong)。