北京(jing)2019年7月15日 /美通(tong)(tong)社/ -- 近期(qi),上海交通(tong)(tong)大(da)學醫(yi)學院(yuan)(yuan)附(fu)屬(shu)瑞金醫(yi)院(yuan)(yuan)(以(yi)下(xia)(xia)簡稱(cheng)“瑞金醫(yi)院(yuan)(yuan)”)與中科(ke)曙光達成合(he)作(zuo)(zuo),未(wei)來(lai)將建設(she)一套符合(he)國際標(biao)準(zhun)、具(ju)備技術(shu)先(xian)進性(xing)的(de)“臨床資源深度分(fen)(fen)析和挖掘測(ce)序模塊(kuai)計算(suan)平(ping)臺”(以(yi)下(xia)(xia)簡稱(cheng)“計算(suan)平(ping)臺”),通(tong)(tong)過提(ti)升醫(yi)療數據檢索、統計分(fen)(fen)析、圖形(xing)化呈(cheng)現在(zai)內的(de)大(da)規模數據挖掘能力,支(zhi)持(chi)“轉化醫(yi)學”的(de)醫(yi)療、科(ke)研(yan)人員進行總結(jie)和探索性(xing)的(de)科(ke)研(yan)工作(zuo)(zuo),讓寫在(zai)紙(zhi)上的(de)論文盡快變成用(yong)于臨床的(de)新治療方法,聯手攻(gong)關危害人類健康的(de)重大(da)疾病。
IT與生物信息融合,解碼“生命信息”
在大數據(ju)、人(ren)工智(zhi)能和高性能計(ji)算逐漸融合的(de)趨(qu)勢(shi)下,設計(ji)與實現高性能的(de)數據(ju)解讀學習(xi)模型、算法與軟(ruan)件,是逾越生命信息學“數據(ju)鴻(hong)溝(gou)”的(de)主要手段。
本次(ci)“臨(lin)床資(zi)源(yuan)深度分析和(he)(he)(he)(he)挖(wa)掘測(ce)序模塊計算平(ping)臺”的(de)建設將以患者生理生化(hua)指標,器(qi)官影像檢查、家(jia)族遺傳背景等(deng)多維度的(de)數據為基礎(chu),結合基因(yin)組(zu)測(ce)序、蛋白質組(zu)學(xue)和(he)(he)(he)(he)代謝(xie)組(zu)學(xue)等(deng)各(ge)種(zhong)先(xian)進組(zu)學(xue)檢測(ce)等(deng)技(ji)術(shu),通(tong)過(guo)生物信息學(xue)手段進行(xing)綜合數據分析和(he)(he)(he)(he)挖(wa)掘,提(ti)供與疾病診斷和(he)(he)(he)(he)治(zhi)療(liao)相關的(de)遺傳和(he)(he)(he)(he)臨(lin)床信息。形(xing)成特(te)征(zheng)數據后,再(zai)通(tong)過(guo)機器(qi)深度學(xue)習和(he)(he)(he)(he)人(ren)工智能等(deng)方(fang)法,實現真正意義上的(de)精準分析、輔助診斷和(he)(he)(he)(he)個性化(hua)醫療(liao)。
海量生物數據解讀,逾越“數據鴻溝”
基因組測序、蛋白質組學(xue)(xue)、代謝組學(xue)(xue)等先進組學(xue)(xue)檢測等技術在生(sheng)命科(ke)學(xue)(xue)研究(jiu)和人類健康領域的(de)(de)應用是將生(sheng)物信(xin)息(xi)轉(zhuan)化(hua)為數(shu)字(zi)信(xin)息(xi),這些數(shu)據來自于大量的(de)(de)生(sheng)物樣本、科(ke)研中間數(shu)據和實(shi)驗結果,這些數(shu)字(zi)信(xin)息(xi)如同金礦(kuang)一樣,等待(dai)被挖掘出(chu)不可估(gu)量的(de)(de)價值。
中(zhong)(zhong)科(ke)曙(shu)光憑借多年(nian)在生(sheng)物基因(yin)領域(yu)積累的經驗(yan),打造(zao)生(sheng)物基因(yin)行(xing)業云存(cun)儲解(jie)決方案(an)。通過Scale-Out橫向(xiang)擴(kuo)展、IB+RDMA高(gao)速互聯、內核態POSIX協議、智能(neng)SSD Cache及小文件(jian)(jian)聚合等技術(shu),消除(chu)傳統的Scale-up縱向(xiang)擴(kuo)展存(cun)儲架構的性能(neng)局限性,解(jie)決生(sheng)物基因(yin)應用(yong)中(zhong)(zhong)對海量大文件(jian)(jian)存(cun)儲場景高(gao)聚合帶寬(kuan)、小文件(jian)(jian)存(cun)儲場景高(gao)IOPS的存(cun)儲需(xu)求。
其次,基(ji)因(yin)研究(jiu)產生的(de)(de)數據正以每12-18個月10倍(bei)的(de)(de)速(su)(su)度(du)快速(su)(su)增長,曙光(guang)ParaStor分布式存(cun)(cun)儲(chu)系(xi)統(tong)可通(tong)過性能與容(rong)量(liang)的(de)(de)線(xian)性增長,滿足存(cun)(cun)儲(chu)系(xi)統(tong)對數據處理(li)能力和擴展性的(de)(de)要求,并通(tong)過多種技術手段,從物(wu)理(li)底層到邏輯層全方位保(bao)證存(cun)(cun)儲(chu)系(xi)統(tong)高可靠性和高可用性,滿足前端(duan)多種基(ji)因(yin)測序(xu)軟件、多種業務(wu)應用的(de)(de)存(cun)(cun)儲(chu)對接(jie)需求。
未來,曙光(guang)生物基因行(xing)業云存儲解決(jue)方案(an)將廣泛運用(yong)于生命科學領域,為廣大客戶的業務提供有效(xiao)的性能保障和技(ji)術支持。