北京(jing)2023年(nian)5月19日 /美通社/ -- 5月16日,浪(lang)(lang)潮信(xin)息"智算 開新局·創新機(ji)(ji)"全國巡展南京站開幕。會上,浪(lang)(lang)潮信(xin)息服務器操(cao)作系統KOS正式發(fa)布,KOS通過軟硬協同(tong)的(de)一體化(hua)(hua)設計,依(yi)托(tuo)業(ye)內最全整(zheng)機(ji)(ji)產(chan)品線,實現整(zheng)機(ji)(ji)系統架構優化(hua)(hua),最大程度發(fa)揮(hui)多元算力價值。
KOS是浪潮信息依(yi)托十余年(nian)高(gao)端主機(ji)操作系(xi)(xi)統(tong)研(yan)發經(jing)驗,基(ji)于(yu)國內領先的(de)(de)開(kai)(kai)源OS根社區(qu),打造的(de)(de)面向智算時代的(de)(de)服(fu)務器操作系(xi)(xi)統(tong),支持x86、ARM等(deng)多種芯片架(jia)構和計算場景(jing),性(xing)能(neng)和穩定性(xing)通過了多項權威(wei)評測(ce)和大規模部署驗證。通過軟(ruan)硬協(xie)同優化(hua)(hua),基(ji)于(yu)KOS的(de)(de)人工(gong)智能(neng)、虛(xu)擬化(hua)(hua)、云原(yuan)(yuan)生等(deng)應(ying)用在(zai)開(kai)(kai)發效(xiao)率、運行效(xiao)率、擴(kuo)展性(xing)等(deng)方(fang)面都得到了增強。在(zai)虛(xu)擬化(hua)(hua)場景(jing),虛(xu)擬機(ji)遷移加速(su)提升8倍;在(zai)云原(yuan)(yuan)生場景(jing),容器密度提升10%;在(zai)分布式存儲場景(jing),隨機(ji)寫性(xing)能(neng)提升15%。憑(ping)借(jie)廣泛的(de)(de)兼容生態、遍(bian)布全國的(de)(de)服(fu)務體系(xi)(xi)、豐(feng)富(fu)的(de)(de)行業(ye)實踐, KOS已經(jing)成為行業(ye)用戶的(de)(de)首(shou)選。
大會外展,浪潮信息演示(shi)了KOS服務器(qi)操作系統及CentOS遷移(yi)(yi)(yi)解(jie)決方案(an),面(mian)對CentOS遷移(yi)(yi)(yi)替換需求,為行業(ye)用戶(hu)提供了從環境調(diao)研(yan)、遷移(yi)(yi)(yi)評估、遷移(yi)(yi)(yi)驗證(zheng)、遷移(yi)(yi)(yi)實施(shi)到運行監控"五步走"的一站(zhan)式解(jie)決方案(an),實現(xian)高(gao)效平滑遷移(yi)(yi)(yi),整體(ti)遷移(yi)(yi)(yi)過程的自動化率達到95%。
隨著摩爾定律(lv)的(de)放(fang)緩,通(tong)(tong)過軟(ruan)硬件(jian)協同優(you)化(hua),從系(xi)統架(jia)構(gou)層面全面提升(sheng)系(xi)統性(xing)能(neng),最大化(hua)釋放(fang)算力(li)(li)(li)價值受到了更多(duo)企(qi)業用(yong)(yong)戶關注。作(zuo)為(wei)算力(li)(li)(li)基礎(chu)設施提供(gong)商,浪潮信息通(tong)(tong)過多(duo)元異構(gou)算力(li)(li)(li)融合(he)、軟(ruan)硬協同設計(ji)與優(you)化(hua)的(de)技術路線,持續推動全棧算力(li)(li)(li)系(xi)統創新。KOS作(zuo)為(wei)服務器專用(yong)(yong)操作(zuo)系(xi)統,通(tong)(tong)過發揮(hui)軟(ruan)硬協同設計(ji)與優(you)化(hua)的(de)核心能(neng)力(li)(li)(li),助力(li)(li)(li)服務平(ping)臺軟(ruan)硬件(jian)全棧協同優(you)化(hua)、高(gao)效釋放(fang)算力(li)(li)(li)平(ping)臺性(xing)能(neng)。
1+1>2 軟硬協同深度優化實現場景增強
本次發(fa)布的服務器操作系(xi)統KOS,具備(bei)高(gao)效軟(ruan)硬協同(tong)、穩定可靠(kao)、全(quan)天候運維、全(quan)棧(zhan)安全(quan)可信(xin)四大(da)特點,同(tong)時依托自身覆蓋云、數(shu)、智、邊等(deng)業內(nei)最全(quan)整(zheng)機產(chan)品線,實現整(zheng)機系(xi)統架構優(you)化,最大(da)程度發(fa)揮多元算(suan)力價值。
在軟硬協同(tong)(tong)方面,KOS通過設備(bei)管(guan)理、設備(bei)發(fa)現(xian)等一(yi)系(xi)列措施,簡化(hua)了不同(tong)(tong)類型設備(bei)的(de)管(guan)理,目前已與100+服務(wu)器整機、350+主(zhu)流CPU、GPU、FPGA、網卡、存儲(chu)及(ji)網絡(luo)設備(bei)完成兼容認(ren)證,實現(xian)主(zhu)流數(shu)據庫(ku)、中間件、虛擬化(hua)、容器全覆蓋;同(tong)(tong)時,KOS也提供(gong)了異構算力的(de)編程模型和(he)高效開發(fa)庫(ku),為上層提供(gong)統一(yi)的(de)開發(fa)接口和(he)運(yun)行時支持,屏(ping)蔽底層計算的(de)差異,簡化(hua)上層業務(wu)使(shi)用(yong)各(ge)種通用(yong)計算設備(bei)和(he)專用(yong)加速(su)設備(bei)。
通(tong)(tong)過軟(ruan)硬協同調度優化(hua),基于(yu)KOS的人(ren)(ren)工智能(neng)(neng)、虛(xu)擬化(hua)、云原(yuan)(yuan)生等(deng)應(ying)用在開發效率、運行效率、擴展性等(deng)方(fang)面都得到了(le)(le)(le)增強。同時,通(tong)(tong)過使能(neng)(neng)處(chu)理(li)器的高(gao)(gao)(gao)級加速特(te)性,KOS實現(xian)(xian)了(le)(le)(le)云原(yuan)(yuan)生、人(ren)(ren)工智能(neng)(neng)場景的性能(neng)(neng)突破(po),基于(yu)分層內(nei)存的優化(hua)提升了(le)(le)(le)PMEM/CXL內(nei)存的訪問(wen)性能(neng)(neng),基于(yu)NVME-oF互連與SMC-R實現(xian)(xian)了(le)(le)(le)高(gao)(gao)(gao)性能(neng)(neng)存儲、高(gao)(gao)(gao)性能(neng)(neng)網絡。目前,KOS已(yi)經支撐浪潮信息虛(xu)擬化(hua)、云、AI等(deng)產品多次(ci)打(da)破(po)世(shi)界紀錄。
為了最大(da)化發(fa)揮主機系統計算(suan)側、存儲側、網絡側的(de)算(suan)力,KOS設計了應用、算(suan)力、芯片跨層次的(de)資源(yuan)調度(du)機制,通過深度(du)感知(zhi)應用的(de)算(suan)力需求特(te)征、負(fu)載(zai)特(te)征,以及算(suan)力設備(bei)的(de)能耗特(te)征,實現業務與算(suan)力的(de)最佳匹配(pei)和彈性伸縮。
高可靠機制保障系統級安全
作為(wei)一(yi)款服(fu)務器操(cao)作系統,穩定可靠是KOS的第(di)一(yi)要求。
KOS通過安全(quan)可(ke)靠、RAS增(zeng)強、完(wan)善的集群高可(ke)用支撐能力,提(ti)升整機系統(tong)的可(ke)靠性。KOS建立了從硬件啟動(dong)(dong)、內核啟動(dong)(dong)、驅動(dong)(dong)加載、應用執(zhi)行(xing)完(wan)整可(ke)信鏈,為用戶實(shi)現系統(tong)運行(xing)時持續(xu)保護、升級時安全(quan)檢查、故障或(huo)破壞時自動(dong)(dong)恢復(fu),保障系統(tong)安全(quan)性。
浪潮信息充分利用整機(ji)(ji)(ji)廠商的(de)(de)硬件(jian)優勢(shi),在操(cao)作(zuo)系(xi)統(tong)層面聯合固件(jian)、硬件(jian)進(jin)行(xing)協同創新,對整機(ji)(ji)(ji)系(xi)統(tong)RAS特性(xing)進(jin)行(xing)了(le)(le)增強(qiang)(qiang)。其中,KOS具(ju)備關鍵(jian)數(shu)(shu)據(ju)冗余(yu)機(ji)(ji)(ji)制,可對核(he)(he)心(xin)數(shu)(shu)據(ju)內(nei)存進(jin)行(xing)鏡像(xiang)保障業務(wu)關鍵(jian)數(shu)(shu)據(ju)可靠(kao),而增強(qiang)(qiang)性(xing)容錯能(neng)力(li)則(ze)可將引(yin)起系(xi)統(tong)宕(dang)機(ji)(ji)(ji)的(de)(de)UCE進(jin)行(xing)降級容錯處理,大幅降低(di)了(le)(le)系(xi)統(tong)宕(dang)機(ji)(ji)(ji)率。此(ci)外,KOS深度(du)挖掘硬件(jian)的(de)(de)RAS能(neng)力(li),支(zhi)持(chi)(chi)CPU、內(nei)存等核(he)(he)心(xin)部件(jian)的(de)(de)熱(re)替換,能(neng)夠有效提升系(xi)統(tong)可維(wei)護性(xing),支(zhi)持(chi)(chi)內(nei)核(he)(he)、應用軟件(jian)的(de)(de)熱(re)升級,能(neng)夠有效保障用戶業務(wu)連續性(xing)。
除了系(xi)統層面的(de)RAS增強外(wai),在(zai)應用業務層KOS也提供了完(wan)善(shan)的(de)集(ji)群(qun)(qun)高可用套件(jian),包括(kuo)集(ji)群(qun)(qun)數據共享、集(ji)群(qun)(qun)資源(yuan)管(guan)理、集(ji)群(qun)(qun)成員(yuan)管(guan)理等(deng),有效支撐了業務集(ji)群(qun)(qun)化改造,保障業務連續性。
隨著(zhu)數據(ju)(ju)中(zhong)心規(gui)模集中(zhong)化(hua)、設(she)備(bei)(bei)復雜(za)程(cheng)度與日俱增(zeng),運(yun)維普遍面臨著(zhu)監控(kong)數據(ju)(ju)不(bu)豐富(fu)、故(gu)障(zhang)定位難、自(zi)動(dong)化(hua)程(cheng)度不(bu)高等(deng)問題。浪潮信息KOS提供全(quan)天(tian)候運(yun)維解決方(fang)案(an),具(ju)備(bei)(bei)深度監控(kong)、專家診斷(duan)規(gui)則、云端運(yun)維服務接入(ru)等(deng)能(neng)(neng)力(li)(li)。KOS支持基于專家規(gui)則的自(zi)動(dong)化(hua)運(yun)維和診斷(duan),可以方(fang)便地進行故(gu)障(zhang)定位、性(xing)能(neng)(neng)分析、性(xing)能(neng)(neng)優化(hua)。同時(shi),KOS可以無縫(feng)接入(ru)到浪潮信息InService云端運(yun)維服務,實現運(yun)維遠程(cheng)托(tuo)管,提供故(gu)障(zhang)預(yu)測、實時(shi)告(gao)警、一(yi)鍵報修、資源擴(kuo)容、技術支持等(deng)全(quan)場景全(quan)天(tian)候運(yun)維能(neng)(neng)力(li)(li)。
憑(ping)借(jie)十(shi)余(yu)年高端(duan)主機(ji)(ji)操作系統經驗沉淀、全(quan)(quan)面(mian)的(de)(de)(de)產(chan)品(pin)體系、和遍布全(quan)(quan)國的(de)(de)(de)軟硬件全(quan)(quan)服務(wu)鏈,浪潮信息KOS累(lei)計裝機(ji)(ji)量已超(chao)過20萬,廣泛服務(wu)于政府、金融、電信、互聯網等(deng)行(xing)業(ye)(ye)用戶(hu),已成為千行(xing)百(bai)業(ye)(ye)客戶(hu)業(ye)(ye)務(wu)穩定可(ke)靠運行(xing)的(de)(de)(de)最佳選擇。