北京2019年10月14日 /美通社/ -- 10月7日,諾貝爾委員會公布了今年首個諾貝爾獎:諾貝爾生理學或醫學獎。獎項頒發給三位科學家,以表彰他們對于細胞是怎么感知并適應氧氣變化的發現。在(zai)生物科學(xue)領域,近年(nian)來還涌現了屠(tu)呦呦等諾(nuo)貝爾(er)獲(huo)獎者,可見生(sheng)(sheng)(sheng)物科學(xue)在推動(dong)人類(lei)發展(zhan)方面的重大(da)意義(yi)。現代生(sheng)(sheng)(sheng)物醫學(xue)研(yan)(yan)究需建立在大(da)量實驗(yan)樣(yang)本(ben)、生(sheng)(sheng)(sheng)物樣(yang)本(ben)、科研(yan)(yan)中間數據(ju)的基礎之(zhi)上,如何破(po)解(jie)這(zhe)些“生(sheng)(sheng)(sheng)命科學(xue)密碼(ma)”,為生(sheng)(sheng)(sheng)物研(yan)(yan)究提供大(da)數據(ju)支持,成為學(xue)術(shu)界以及生(sheng)(sheng)(sheng)物科學(xue)行業的關注點。
IT技術與生物醫學融合,曙光助力上海生科院破譯生命密碼
生物技術的發展需要信息技術提供強有力的計算工具,借助先進的IT技術解決方案,完成海量實驗數據的存儲、讀取與挖掘處理。同時,信息技術還有助于加強生物技術領域的各種數據庫管理、信息傳遞、檢索和資源共享等。
利用信息技術對生物科學數據應用領域進行深入分析,才能破譯生命密碼,近期,曙光成功中標上海生科院生物“醫學大數據設施-信息系統基礎平臺”項目,助力上海生科院在生命科學研究、生物醫藥研發、臨床醫學研究與應用的發展。
生物醫學大數據基礎設施深刻體現前沿信息技術與現代生命科學的高度交叉,采用大規模存儲為底層架構,以海量生物醫學大數據資源的高等級安全保藏為核心,實施生(sheng)物醫學(xue)大數(shu)據資源的(de)匯聚、管理、共享和挖(wa)掘,形成服務于全(quan)國的(de)生(sheng)物醫學(xue)大數(shu)據研究與(yu)應用的(de)重大與(yu)關鍵技術條件設施。
滿足復雜運算需求,曙光ParaStor為“生物信息”提供高可靠平臺
曙光憑借多年在生物基因領域積累的經驗,打造生物基因行業云存儲解決方案,助力“生命科學”探索。曙光分布式存儲系統ParaStor更是憑借先(xian)進的(de)應(ying)用匹(pi)配性(xing)與超高性(xing)能,贏得了市場的(de)認可。
此次,曙光助力上海(hai)生(sheng)(sheng)科院生(sheng)(sheng)物“醫(yi)學(xue)(xue)(xue)大數據設施-信息系(xi)統基礎(chu)平臺”項目,將建設一個面(mian)向生(sheng)(sheng)命科學(xue)(xue)(xue)研究、生(sheng)(sheng)物醫(yi)藥研發、臨床醫(yi)學(xue)(xue)(xue)研究與應用,推(tui)動生(sheng)(sheng)物醫(yi)藥技術(shu)(shu)企業創新發展,以共(gong)享(xiang)式服務為(wei)導向的科學(xue)(xue)(xue)技術(shu)(shu)綜(zong)合體。
曙光以ParaStor構建的大規模存儲系統,以海量生物醫學大數據資源的高等級安全保藏為(wei)核(he)心,支撐(cheng)高通量專業云計算服務和大數(shu)據人工智能(neng)挖(wa)掘。實現生物醫學大數(shu)據資(zi)源的(de)(de)匯聚、管(guan)(guan)理(li)、共享(xiang)和挖(wa)掘,成為(wei)面向全(quan)社會的(de)(de)生物醫學大數(shu)據標準化整合、安全(quan)管(guan)(guan)理(li)、高效(xiao)共享(xiang)的(de)(de)存(cun)儲中心。
存儲系統作為(wei)重要的基礎架構,在本次項目中有著極為嚴苛的要求。生物醫學數據的主要類型為文本文件、圖像文件、二進制文件等非結構化數據,對存儲的要求主要在存儲容量的大小和大文件的讀寫通量的高低,而少量的關鍵數據庫、索引等結構化數據,對存儲的要求是較高 IOPS 和穩定的讀寫能力。對存儲系統的需求可總結為:業務系統存儲、高性能存儲和大容量存儲。
曙(shu)光(guang)ParaStor通(tong)過(guo)Scale-Out橫向(xiang)擴(kuo)展、IB+RDMA高速(su)互(hu)聯(lian)、內核(he)態POSIX協議(yi)、智能SSD Cache及小(xiao)文(wen)件(jian)聚(ju)合等技術,消除傳(chuan)統的Scale-up縱向(xiang)擴(kuo)展存(cun)(cun)儲(chu)架構(gou)的性能局限(xian)性,解決生物基因應用中對海量大文(wen)件(jian)存(cun)(cun)儲(chu)場景高聚(ju)合帶(dai)寬、小(xiao)文(wen)件(jian)存(cun)(cun)儲(chu)場景高IOPS的存(cun)(cun)儲(chu)需求。
ParaStor分布式存(cun)(cun)儲(chu)系(xi)統可通過性(xing)(xing)能與容量的(de)線性(xing)(xing)增(zeng)長,滿足對存(cun)(cun)儲(chu)系(xi)統數據處理能力和擴展(zhan)性(xing)(xing)的(de)要(yao)求(qiu)。此外,針對業務系(xi)統對可靠性(xing)(xing)、穩(wen)定性(xing)(xing)的(de)需(xu)求(qiu),ParaStor分布式存(cun)(cun)儲(chu)系(xi)統通過多(duo)種技術手段,從物理底層(ceng)到邏(luo)輯層(ceng)全方位保證存(cun)(cun)儲(chu)系(xi)統高(gao)可靠性(xing)(xing)和高(gao)可用性(xing)(xing)。豐富的(de)協議(yi)接口,多(duo)類型數據融(rong)合存(cun)(cun)儲(chu),可以(yi)保證多(duo)業務共享。
曙光生物基因行業云存儲解決方案廣泛運用于生命科學領域,也為廣大客戶的業務提供了有效的性能保障和技術支持。在天壇醫院面向高通量基因組學數據處理與智能病理影像識別系統項目中,ParaStor通過超高吞吐性能大幅度提高了面向測序數據及影像數據科研質量、縮短科研周期、降低科研成本。與第二代基因測試儀illumina、主流應用軟件長期對接測試與優化是曙光扎根于該領域的基礎,ParaStor對于生物信息復雜應用軟件的優質適(shi)配以及(ji)均衡穩定的性能表現給某國(guo)家醫療大數據中心(xin)客戶留下了深刻的印象。