北京2019年8月19日 /美通社/ -- 在科學技術(shu)不(bu)斷發(fa)展的今(jin)天,人們通過對地(di)觀測、地(di)表傳感器網絡、遙感技術(shu)等手段,獲取了海量的地(di)球科學數據集,這些數據統稱(cheng)為(wei)地(di)球大數據。
2015年,聯合國發布了可持(chi)(chi)續(xu)(xu)發展(zhan)目(mu)標(biao)議程,以(yi)期面向(xiang)2030年解(jie)決貧(pin)困、不(bu)平(ping)等和全(quan)球(qiu)變化等的(de)挑戰。這(zhe)議程的(de)眾多目(mu)標(biao)中,地球(qiu)大(da)數據(ju)至少可以(yi)為(wei)實現其中八個提供不(bu)同形式的(de)支(zhi)持(chi)(chi),特別是純凈的(de)水(shui)源、低廉的(de)能源、可持(chi)(chi)續(xu)(xu)發展(zhan)的(de)城(cheng)市、全(quan)球(qiu)變化、水(shui)下生(sheng)命(ming)、陸上生(sheng)命(ming)、健康和平(ping)等發展(zhan)目(mu)標(biao)。
2017年中科院成立(li)了為期(qi)五年的(de)“地球大數據科學(xue)工(gong)(gong)程(cheng)”先(xian)導(dao)專項,其中大數據云服務(wu)(wu)平臺是“地球大數據科學(xue)工(gong)(gong)程(cheng)”先(xian)導(dao)專項的(de)重要(yao)建設任務(wu)(wu)之一,屬(shu)于(yu)綜(zong)合(he)型基礎設施項目。
構建“大數據云服務平臺”的關鍵在于兩個層面,一是對中科院積累的海量基礎物理數據及其相互關系的建模;二是將對數(shu)據使用(yong)邏輯(ji)實現“服務化(hua)”,以支撐各單位實現數(shu)據共享和個性化(hua)應用(yong)孵(fu)化(hua)。
如何助力“地球大數據科學工程”構建包含資源、環境、生物、生態等多個領域的大數據云服務平臺,將海量“地球大數據”掌握在手中并實現云化?中科院和(he)中科曙光(guang)通過“院企合作”的(de)方式,將(jiang)中科(ke)(ke)院的(de)科(ke)(ke)研成(cheng)果(guo)(guo)注入(ru)曙光(guang) Cloudview 云計(ji)算操作系統產品中,實現(xian)科(ke)(ke)研成(cheng)果(guo)(guo)的(de)工程(cheng)化。
依托專家力量,將其對海量數據的獨特使用邏輯框架化,并形成對底層資源支撐要求的量化,曙光以此作為輸入,在原有 Cloudview 云計算操作系統的基礎上,擴充資源調度功能并優化,為地球大數據科學工程提供 IaaS 層資源支撐及資源管理與調度,通過靈活的調度、簡便的運維,讓“大”數據輕松一手掌握,推動并實現地球大數據技術創新、重大科學發現和一站式全方位宏觀決策支持。
建設國際領先的大數據云服務平臺,需不斷提高對資源層高標準的使用要求,如彈性、高性能的計算資源、海量的數據存儲、高并發的數據訪問、簡便的集群運維管理等。針對“地球大數據科學工程”的大數據云系統建設所形成的曙光云計算 Cloudview 操作系統的優勢主要體現為三個方面:
第一,體現在大規模彈性及異構計算,達到更高的計算能力。
基(ji)于(yu)數(shu)(shu)百臺計(ji)(ji)算節點的(de)(de)(de)調(diao)度提(ti)供(gong)計(ji)(ji)算資(zi)(zi)源的(de)(de)(de)彈(dan)性(xing)擴展,滿足大(da)氣、海(hai)洋領域(yu)科(ke)學應用(yong)(yong)對(dui)計(ji)(ji)算資(zi)(zi)源不斷變(bian)化的(de)(de)(de)需求(qiu),不會(hui)產生計(ji)(ji)算資(zi)(zi)源瓶頸,不同業務(wu)系統之間(jian)均衡使(shi)用(yong)(yong),使(shi)資(zi)(zi)源得到(dao)(dao)充分、合理的(de)(de)(de)使(shi)用(yong)(yong)。利(li)用(yong)(yong) GPU 透傳、PCI 設備透傳能力,CPU 獨占特性(xing),為業務(wu)應用(yong)(yong)提(ti)供(gong)資(zi)(zi)源獨占能力,避免(mian)資(zi)(zi)源的(de)(de)(de)爭搶(qiang)、達到(dao)(dao)更高性(xing)能的(de)(de)(de)計(ji)(ji)算能力,支撐基(ji)于(yu) Hadoop 大(da)數(shu)(shu)據系統及(ji) Spark 等流式數(shu)(shu)據處理,幫助用(yong)(yong)戶實(shi)現一(yi)鍵(jian)構建(jian)大(da)數(shu)(shu)據處理環境功能。
第二,支持高并發海量存儲、提供更優的數據治理能力。
中科曙(shu)光(guang) Cloudview 云(yun)計(ji)算(suan)操作系(xi)統(tong)(tong)提(ti)供海量的(de)(de)(de)存(cun)(cun)(cun)儲(chu)(chu)管理,提(ti)供統(tong)(tong)一的(de)(de)(de)存(cun)(cun)(cun)儲(chu)(chu)管理與調度。可同時(shi)對接幾十PB級文(wen)件存(cun)(cun)(cun)儲(chu)(chu)系(xi)統(tong)(tong)和對象(xiang)存(cun)(cun)(cun)儲(chu)(chu)系(xi)統(tong)(tong),“文(wen)件存(cun)(cun)(cun)儲(chu)(chu)系(xi)統(tong)(tong)”主要用于存(cun)(cun)(cun)儲(chu)(chu)來自全國不同科研(yan)組(zu)織提(ti)交的(de)(de)(de)科研(yan)數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju),提(ti)供數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)遠程(cheng)匯交的(de)(de)(de)人機(ji)接口和功(gong)能(neng),同時(shi)提(ti)供空間(jian)配額(e)、訪(fang)問(wen)權限控(kong)制、數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)隔離等功(gong)能(neng)。“對象(xiang)存(cun)(cun)(cun)儲(chu)(chu)系(xi)統(tong)(tong)”主要用于將匯交的(de)(de)(de)、有價值的(de)(de)(de)科研(yan)數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)以(yi)對象(xiang)格式(shi)存(cun)(cun)(cun)儲(chu)(chu),便(bian)于后(hou)期(qi)的(de)(de)(de)數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)處理和發(fa)布共(gong)享。數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)網(wang)絡采用10Gb/40Gb網(wang)絡,10Gb網(wang)絡用于虛擬機(ji)鏡像在鏡像存(cun)(cun)(cun)儲(chu)(chu)與計(ji)算(suan)資源池之(zhi)間(jian)的(de)(de)(de)傳輸,“數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)內網(wang)”采用40Gb高(gao)速網(wang)絡,用于科研(yan)數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)在超級計(ji)算(suan)系(xi)統(tong)(tong)、大數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)云(yun)系(xi)統(tong)(tong)、數(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)存(cun)(cun)(cun)儲(chu)(chu)系(xi)統(tong)(tong)之(zhi)間(jian)的(de)(de)(de)相互流轉。
第三,體現在簡單的運維,實現自動化交付。
整個系(xi)(xi)(xi)(xi)統(tong)的(de)易用(yong)(yong)性(xing),體現在上層應用(yong)(yong)的(de)使(shi)用(yong)(yong)時候的(de)便(bian)利性(xing),專家(jia)建(jian)議對各(ge)使(shi)用(yong)(yong)單位的(de)系(xi)(xi)(xi)(xi)統(tong)使(shi)用(yong)(yong)習慣(guan)做認真(zhen)分(fen)類,并(bing)提出(chu)“強資(zi)源(yuan)(yuan)編(bian)(bian)排”的(de)應用(yong)(yong)模(mo)塊化(hua)(hua)構(gou)建(jian)理念(nian)。曙光(guang) Cloudview 云計算操作(zuo)系(xi)(xi)(xi)(xi)統(tong)提供資(zi)源(yuan)(yuan)編(bian)(bian)排服務,可以實(shi)現從基(ji)礎架構(gou)到應用(yong)(yong)的(de)端(duan)到端(duan)的(de)自動化(hua)(hua)交付工作(zuo)。資(zi)源(yuan)(yuan)編(bian)(bian)排服務采用(yong)(yong)完全圖形化(hua)(hua) UI 操作(zuo),用(yong)(yong)戶(hu)可以通過簡(jian)單的(de)圖表拖拽進行可視化(hua)(hua)編(bian)(bian)排。資(zi)源(yuan)(yuan)編(bian)(bian)排實(shi)現了資(zi)源(yuan)(yuan)及其拓(tuo)撲關系(xi)(xi)(xi)(xi)的(de)自動執行,不僅獨立資(zi)源(yuan)(yuan)可按配置(zhi)實(shi)現自動化(hua)(hua)部(bu)署,各(ge)資(zi)源(yuan)(yuan)間的(de)拓(tuo)撲關系(xi)(xi)(xi)(xi)也將自動執行,幫助運維(wei)管(guan)理人(ren)員省去大量機械重復的(de)手動配置(zhi)操作(zuo)。
通過(guo)與客戶(hu)緊密合作,中科(ke)曙光(guang) Cloudview 云計算操(cao)作系(xi)統為(wei)“地(di)球(qiu)大數(shu)據科(ke)學工(gong)程(cheng)”提供了(le)(le)高(gao)可靠(kao)、高(gao)性(xing)(xing)能、高(gao)彈性(xing)(xing)、易(yi)運維的 IaaS 平臺,切實提高(gao)了(le)(le)客戶(hu)在基礎架構和應用程(cheng)序構建效率(lv),為(wei)系(xi)統正常運行及業務創(chuang)新保駕護航。讓海量復雜的地(di)球(qiu)大數(shu)據,輕松靈活地(di)掌握在手中。