北京2023年(nian)8月28日(ri) /美通社/ -- 8月24日,以"智算 開新局·創新機"為主題的2023浪潮信息新產品"互聯網+AIGC"行業巡展暨大模型智算軟件棧 OGAI 發布會在北京重磅開幕。來自百川智能、快手、金山辦公、京東云等(deng)互(hu)聯網行業的專家、大(da)(da)咖和生(sheng)態伙伴匯聚一堂,探討互(hu)聯網行業如(ru)何(he)把握生(sheng)成式AI機遇,并分享大(da)(da)模型時(shi)代的智算發展(zhan)之道。
浪潮信息董事長彭震在(zai)致辭(ci)中表示:"人工智能算(suan)(suan)力(li)已經(jing)成為(wei)(wei)驅動大(da)模型進化(hua)的(de)(de)核心引擎,但是(shi)大(da)模型研發經(jing)常會(hui)面臨(lin)買不起,建(jian)不了(le),算(suan)(suan)不好的(de)(de)困境(jing)。我們唯有不斷(duan)創(chuang)新(xin)(xin)智算(suan)(suan)產品技術,結合大(da)模型領域的(de)(de)實踐經(jing)驗,把智算(suan)(suan)力(li)轉(zhuan)化(hua)為(wei)(wei)業務創(chuang)新(xin)(xin)力(li),才(cai)能走在(zai)AI時(shi)代的(de)(de)前列。"
當前,AI計算已經成為大模型產業發展的核心競爭力之一。OpenAI公開數據顯示,從GPT-3到GPT-4算力當量增長了68倍,算力依舊是大模型能力提升的核心驅動力。百川智能技術聯合創始人陳煒鵬表示:"大語言模型(xing)發展規(gui)律之(zhi)一是模型(xing)的能力隨著計(ji)算量擴展,且目前為止我們(men)還沒有看到模型(xing)的邊(bian)界。"
要(yao)滿足大模型(xing)(xing)對(dui)于(yu)算(suan)力(li)的(de)迫切(qie)需(xu)(xu)求,需(xu)(xu)要(yao)構(gou)(gou)建強(qiang)大的(de)智(zhi)算(suan)基(ji)礎設施。然(ran)而智(zhi)算(suan)系(xi)統(tong)的(de)構(gou)(gou)建并(bing)不是算(suan)力(li)的(de)簡單(dan)堆積,業內普遍意識到大模型(xing)(xing)訓(xun)練是如同造火(huo)箭(jian)一樣的(de)復雜系(xi)統(tong)工程,需(xu)(xu)要(yao)綜合(he)考量算(suan)力(li)系(xi)統(tong)的(de)部(bu)署(shu)、優化、資源調度,數(shu)據的(de)采集、清(qing)洗、處理,模型(xing)(xing)訓(xun)練、推理、遷(qian)移、調優以及應用服務、生態(tai)構(gou)(gou)建等一系(xi)列問題(ti)。
圓桌(zhuo)論壇
解決大模型的算力挑戰,已經成為產業創新共同努力的方向。浪潮信息高級副總裁、AI&HPC總經理劉軍表示,為了更好的釋放大模型的生產力, 第一、要讓算力系統的效率充分發揮,大模型開發就是在搶時間,效率等于時間和金錢;第二、可擴展性,對于動輒萬卡的算力集群系統來說,并行計算策略關乎性能擴展比;第三、要保證訓練過程中算力供應的可持續性,充分考慮硬件、軟件、算法、框架層面引發的訓練中斷、失效的問題。我們需要從系統層面整體設計,幫助企業跨越大模型研發門檻。陳煒鵬表示,百川智能正在探索提升大模型訓練效率以及研發成功率。快手異構計算負責人劉凌志表示,模型(xing)參數(shu)量增長超(chao)過一定閾值時,智(zhi)能(neng)能(neng)力(li)也會表現出躍遷(qian)式的提升。面對視(shi)頻和大模型(xing)帶來的算力(li)挑戰,快手(shou)從音視(shi)頻、AI和數(shu)據(ju)中心技術入手(shou),深(shen)入開發了(le)SL200芯片,實現行(xing)業(ye)領先的視(shi)頻壓縮(suo)效率,并通過StreamLake品牌把基礎(chu)設施和AI、視(shi)頻的原子(zi)能(neng)力(li)賦能(neng)產業(ye)。
目前,由智算賦能的大模型已經在互聯網行業得到了廣泛應用,作為大模型應用推進代表企業,金山辦公技術總監熊龍飛分享了大模型在(zai)辦(ban)(ban)公(gong)領域落地的實踐:"辦(ban)(ban)公(gong)場景AI發展趨勢是先滿足(zu)公(gong)網(wang)用戶(hu)需求(qiu),再到私(si)有(you)化部署,從單模態變成多模態,從高度(du)依賴大模型原生能力(li)變成更(geng)豐富的技(ji)術(shu)融合,從對話式交互變成更(geng)輕度(du)的點擊選擇(ze)交互。"
要推動大模型智算系統的建設,現代化數據中心是關鍵載體。大模型對于數據中心帶來了能耗、算力結構等方面的多重挑戰。京東云高級硬件系統架構師王貴林,分享(xiang)了(le)京東構建大(da)(da)規模(mo)數據(ju)中心(xin)的(de)(de)最(zui)新(xin)思考:"通過硬件技(ji)術(shu)創新(xin)、軟件架構優(you)化以及清潔能(neng)源的(de)(de)使用等一系(xi)列手段,構建低碳、環保、可持續(xu)、智能(neng)的(de)(de)全(quan)生命(ming)周期的(de)(de)數據(ju)中心(xin),將成為(wei)釋(shi)放智算力的(de)(de)強大(da)(da)支撐。"
與會(hui)嘉賓指出(chu),中國大模型(xing)仍處(chu)于(yu)商業(ye)生(sheng)態(tai)發(fa)展(zhan)初期,需要在(zai)智(zhi)算系統(tong)構建、平(ping)臺支撐、算法研發(fa)、應用落地等層(ceng)面進行廣泛的(de)生(sheng)態(tai)合作,從而打造更為卓越(yue)的(de)大模型(xing),并推動(dong)模型(xing)的(de)場景化(hua)落地,從而真正(zheng)賦能(neng)互聯網行業(ye)變革。