亚洲在线日韩伦理片,96精品国产AⅤ一区二区,青鸟影视网,yy黄色频道,国内精品久久久精品AV电影院

軟通動力霍宇:以服務入局大模型賽道,打通落地"最后一公里"

北京2023年8月31日 /美通社/ -- 進入2023年,ChatGPT推動世界步入(ru)一個全新時(shi)(shi)代——大(da)模(mo)(mo)型(xing)時(shi)(shi)代,它不(bu)僅引發了AI產(chan)業的(de)整體升級換代,同(tong)時(shi)(shi)也讓(rang)各種大(da)模(mo)(mo)型(xing)層(ceng)出不(bu)窮(qiong),背后的(de)關鍵原因在于,大(da)模(mo)(mo)型(xing)能普遍提升生產(chan)力,而業內眾多公司也都(dou)在積極尋(xun)找應用大(da)模(mo)(mo)型(xing)和生成式AI的(de)機會,希望(wang)在產(chan)業端有所作為。

確(que)實如此(ci),ChatGPT之所(suo)以被稱為(wei)(wei)(wei)AI的(de)(de)(de)"iPhone時刻",源(yuan)于ChatGPT為(wei)(wei)(wei)代表的(de)(de)(de)生(sheng)成式AI能(neng)(neng)夠讓每個(ge)人命(ming)令計算機解決問題成為(wei)(wei)(wei)了(le)可(ke)能(neng)(neng),其可(ke)對(dui)生(sheng)產(chan)(chan)工(gong)具(ju)、對(dui)話引(yin)擎、個(ge)人助理等各(ge)類應用(yong)(yong),起(qi)到協助人、服務人甚至(zhi)超越人的(de)(de)(de)角色,而憑借這項(xiang)革(ge)命(ming)性的(de)(de)(de)技術突破,ChatGPT在搜索引(yin)擎與(yu)各(ge)類工(gong)具(ju)軟件中率先掀起(qi)應用(yong)(yong)熱潮,并引(yin)起(qi)了(le)行業(ye)用(yong)(yong)戶(hu)對(dui)ChatGPT相關技術的(de)(de)(de)關注與(yu)學習。同時,海量下游應用(yong)(yong)也因(yin)此(ci)捕捉到新(xin)的(de)(de)(de)技術與(yu)產(chan)(chan)業(ye)機會,希(xi)望(wang)通過(guo)各(ge)類大模型與(yu)工(gong)程化能(neng)(neng)力(li),將類ChatGPT產(chan)(chan)品能(neng)(neng)力(li)輸送到原有的(de)(de)(de)應用(yong)(yong)中,更好的(de)(de)(de)賦能(neng)(neng)企業(ye)的(de)(de)(de)數智化轉型。

但也要(yao)看到,要(yao)讓(rang)大(da)(da)模(mo)型(xing)(xing)從"已有"走(zou)向"可用(yong)"并不是"一蹴(cu)而就"的(de)(de)過程,更(geng)(geng)多的(de)(de)企(qi)業通常(chang)會(hui)面臨數據資源(yuan)有限、算力(li)投(tou)資難(nan)度(du)大(da)(da)、模(mo)型(xing)(xing)泛化(hua)能(neng)力(li)差、高水(shui)平(ping)人才稀缺的(de)(de)發展瓶頸。也正因此(ci),對更(geng)(geng)多的(de)(de)企(qi)業來(lai)說,未(wei)來(lai)更(geng)(geng)加"務實"的(de)(de)做法,就是選擇(ze)適合自己(ji)的(de)(de)大(da)(da)模(mo)型(xing)(xing)服務商,"站在(zai)巨(ju)人的(de)(de)肩(jian)膀(bang)上",更(geng)(geng)好地"用(yong)好"大(da)(da)模(mo)型(xing)(xing)。

正(zheng)是洞察(cha)到(dao)這種迫(po)切(qie)的(de)(de)(de)市場需求,作為數(shu)字化轉型的(de)(de)(de)實(shi)(shi)踐(jian)者和賦能者,軟通(tong)動(dong)力(li)近年來始終堅(jian)持以(yi)全(quan)棧式數(shu)字技術(shu)為行(xing)(xing)業客戶創造價值(zhi),特別(bie)是在(zai)大模(mo)(mo)型領域(yu),軟通(tong)動(dong)力(li)也在(zai)積極地探索與(yu)實(shi)(shi)踐(jian),希望憑借自身在(zai)AI基礎設施、AI專業人才(cai),AI生(sheng)態(tai)以(yi)及在(zai)通(tong)用領域(yu)和專用服(fu)務領域(yu)沉淀的(de)(de)(de)豐富(fu)應用實(shi)(shi)踐(jian),為行(xing)(xing)業客戶提供大模(mo)(mo)型落(luo)地的(de)(de)(de)專業服(fu)務,打通(tong)大模(mo)(mo)型落(luo)地"最(zui)后一公里",更好地加速千(qian)行(xing)(xing)百業擁抱大模(mo)(mo)型的(de)(de)(de)新時代。

大模型落地的四重挑戰

毫無(wu)疑問,幾乎沒人會懷疑大(da)(da)(da)模型對(dui)未來(lai)的顛覆性影響(xiang)。但現實是,國內對(dui)大(da)(da)(da)模型的探索仍處于早期階(jie)段(duan),無(wu)論在(zai)研(yan)發、迭代還(huan)是使用(yong)階(jie)段(duan),大(da)(da)(da)模型都(dou)是一(yi)個消耗(hao)資(zi)源巨大(da)(da)(da)、使用(yong)成本(ben)也不低的"奢侈品"。除了成本(ben)居(ju)高不下(xia)之外(wai),企(qi)業(ye)想要(yao)在(zai)實際(ji)業(ye)務場景中部署(shu)使用(yong)大(da)(da)(da)模型,還(huan)面臨著數(shu)據(ju)、參數(shu)調優、人才等諸多的落地難題(ti)。


對此,軟通動力數字化創新服務線副總裁霍宇表示(shi),今年以來軟通動力積極在(zai)大(da)模型領域探索與實踐(jian),發(fa)現(xian)大(da)模型要落地到行業(ye)和企業(ye)之中所面臨(lin)的(de)挑(tiao)戰非(fei)常之多,可以從幾(ji)個(ge)維度(du)來做(zuo)觀(guan)察:

一是,從算力的維度看,訓(xun)練大(da)型(xing)模型(xing)需要大(da)量的(de)(de)計(ji)算(suan)(suan)資(zi)源和(he)資(zi)金投入(ru)(ru),這對于眾(zhong)多(duo)的(de)(de)企(qi)業是(shi)巨大(da)的(de)(de)挑戰。"公司今年在(zai)大(da)模型(xing)基礎算(suan)(suan)力方(fang)面的(de)(de)投入(ru)(ru)預計(ji)將(jiang)會近億(yi)元,未來還會持續。在(zai)這個(ge)領(ling)域,如果需要形(xing)成有(you)競爭(zheng)力的(de)(de)產品或者方(fang)案,上千萬(wan)的(de)(de)資(zi)金投入(ru)(ru)只(zhi)能(neng)算(suan)(suan)是(shi)起步門檻,可以說大(da)模型(xing)的(de)(de)算(suan)(suan)力和(he)訓(xun)練成本(ben)極高(gao),這也包括現在(zai)經常提到(dao)的(de)(de)行業大(da)模型(xing),垂直領(ling)域大(da)模型(xing),所以說算(suan)(suan)力方(fang)面就是(shi)一個(ge)躲不過(guo)去的(de)(de)高(gao)門檻。"霍宇(yu)表(biao)示。

二是,從數據的維度看,以(yi)(yi)生(sheng)成(cheng)式(shi)AI來說,訓(xun)練的(de)(de)語(yu)(yu)(yu)言(yan)(yan)(yan)模型(xing)(xing)就需(xu)(xu)要(yao)具(ju)有更(geng)高(gao)的(de)(de)豐(feng)富度和(he)(he)復雜性(xing),才能(neng)(neng)(neng)更(geng)好(hao)(hao)地(di)(di)理解(jie)和(he)(he)生(sheng)成(cheng)各種語(yu)(yu)(yu)言(yan)(yan)(yan)表達形式(shi)。例如(ru),不同(tong)的(de)(de)語(yu)(yu)(yu)言(yan)(yan)(yan)有不同(tong)的(de)(de)句法結構、詞匯使(shi)用(yong)(yong)規律、語(yu)(yu)(yu)義(yi)關系等(deng)特點,因此(ci)(ci)訓(xun)練模型(xing)(xing)需(xu)(xu)要(yao)包括更(geng)多(duo)的(de)(de)語(yu)(yu)(yu)言(yan)(yan)(yan)知(zhi)識(shi)和(he)(he)規則,以(yi)(yi)適(shi)應這(zhe)些(xie)差異。同(tong)時,不同(tong)的(de)(de)語(yu)(yu)(yu)言(yan)(yan)(yan)還可能(neng)(neng)(neng)包含一些(xie)特殊的(de)(de)表達方式(shi)、文化(hua)背景(jing)等(deng),訓(xun)練模型(xing)(xing)還需(xu)(xu)要(yao)考慮這(zhe)些(xie)因素,以(yi)(yi)更(geng)好(hao)(hao)地(di)(di)模擬和(he)(he)生(sheng)成(cheng)各種語(yu)(yu)(yu)言(yan)(yan)(yan)表達形式(shi)。不僅如(ru)此(ci)(ci),為了提高(gao)模型(xing)(xing)的(de)(de)豐(feng)富度和(he)(he)能(neng)(neng)(neng)力,還需(xu)(xu)要(yao)使(shi)用(yong)(yong)更(geng)加大(da)規模、多(duo)樣化(hua)、真實的(de)(de)語(yu)(yu)(yu)言(yan)(yan)(yan)數據集(ji),以(yi)(yi)提高(gao)模型(xing)(xing)的(de)(de)泛化(hua)能(neng)(neng)(neng)力和(he)(he)豐(feng)富性(xing),使(shi)其(qi)能(neng)(neng)(neng)夠更(geng)好(hao)(hao)地(di)(di)適(shi)應各種語(yu)(yu)(yu)言(yan)(yan)(yan)場景(jing)和(he)(he)應用(yong)(yong)需(xu)(xu)求(qiu)。

在霍宇看來,大模型訓練的語料問題本質上就是企業的數據治理的問題,一方面要求企業必須要獲取大量可用和可信的數據;另一方面,數據還需要經過治理,形成結構化和標準化的數據,從而更好的訓練出所需要的大模型服務。

三是,從算法的維度看,AI模(mo)(mo)型(xing)(xing)的(de)發(fa)(fa)展從AlexNet發(fa)(fa)布開始,隨后的(de)研究多數是(shi)圍繞著模(mo)(mo)型(xing)(xing)的(de)深度(du)和廣度(du)探索,發(fa)(fa)展至今已有BERT、 GPT等典型(xing)(xing)模(mo)(mo)型(xing)(xing)出現(xian),也掀(xian)起了預訓練模(mo)(mo)型(xing)(xing)的(de)熱潮,目(mu)前國內的(de)大模(mo)(mo)型(xing)(xing)參數也已經攀(pan)升至千億、萬(wan)億級別,其(qi)準確度(du)也在不斷的(de)刷新(xin) SOTA。

但與(yu)此(ci)同(tong)時,對于(yu)企業而(er)言,如何選擇(ze)合適自身的預(yu)訓練(lian)模(mo)型,如何在具體場景(jing)和(he)任務(wu)下,基于(yu)成熟的大(da)模(mo)型進行微調能夠快速地(di)產生準確(que)結果,以及究竟是(shi)(shi)選擇(ze)商用還是(shi)(shi)開源的大(da)模(mo)型服(fu)務(wu),如何平(ping)衡成本(ben)和(he)訓練(lian)效果,同(tong)樣也(ye)是(shi)(shi)非常讓人"頭疼"的問題。

四是,從人才維度看,隨著越來越多的企業開始廣泛應用大模型,相關的人才需求也成為了新的挑戰。以在人工智能產品實際使用過程中進行數據庫管理、算法參數設置、人機交互設計、性能測試跟蹤及其他輔助作業的AI訓練師為例,相關數據顯示,這類人才目前就出現了大量的"缺口"亟待滿足。
不難(nan)看出(chu),雖然我們已經見證了(le)(le)大(da)模型開始與(yu)場景(jing)、行(xing)業進行(xing)深度(du)融合并取得了(le)(le)不錯的(de)成績,驗證了(le)(le)大(da)模型已不僅(jin)在科技企(qi)業中應用,也邁出(chu)了(le)(le)走向千(qian)行(xing)百業的(de)步伐,但大(da)模型的(de)落地并不是一件簡單的(de)事情,仍(reng)需要(yao)解決好算力、數據、算法、人(ren)才等方面帶(dai)來(lai)的(de)全新挑戰。

以服務入局大模型賽道

基于(yu)此,從今(jin)年年初開始,軟通動(dong)力(li)就(jiu)積極(ji)布局大模型(xing)賽道,不僅投資(zi)建設(she)AI算力(li)基礎設(she)施(shi),同時(shi)也站在(zai)服(fu)務和落地(di)的視角,希(xi)望能夠(gou)憑借自身(shen)在(zai)AI人(ren)才資(zi)源,AI平(ping)臺工具,AI合(he)作生(sheng)態以及(ji)"躬身(shen)實踐(jian)"中沉淀的經驗和方法(fa)論,和行業(ye)客戶(hu)共創能夠(gou)落地(di)的大模型(xing)服(fu)務,更好地(di)幫助企業(ye)迎接(jie)大模型(xing)時(shi)代(dai)的到來,具體(ti)來說:

首先,在AI人才資源方面,這是軟通動力在大模型賽道中獨具特色的優勢。公司憑借十余年的(de)技(ji)術(shu)積(ji)累(lei)和行(xing)業經驗沉淀,通過將自身(shen)的(de)服務能力橫向(xiang)拉通、整合之(zhi)后,目前不僅能夠為行(xing)業客戶(hu)提供"全棧化(hua)(hua)"的(de)數字(zi)技(ji)術(shu)服務,同時更(geng)積(ji)累(lei)了(le)一大批高質量(liang)的(de)數字(zi)化(hua)(hua)人才。

"我們的(de)第(di)一個切(qie)入點就是(shi)AI人(ren)才(cai)方(fang)向,投入專(zhuan)(zhuan)門(men)的(de)算(suan)力(li)(li)平(ping)臺作(zuo)為培養工(gong)(gong)程(cheng)(cheng)師(shi)上(shang)手(shou)并熟悉大模(mo)(mo)型(xing)(xing)的(de)工(gong)(gong)程(cheng)(cheng)實踐環境(jing),能夠讓(rang)相關開(kai)發語言的(de)工(gong)(gong)程(cheng)(cheng)師(shi)和架構師(shi)更快更熟練玩轉大模(mo)(mo)型(xing)(xing),希望通(tong)過對(dui)算(suan)力(li)(li)及人(ren)才(cai)的(de)投資(zi),讓(rang)他們能夠把大模(mo)(mo)型(xing)(xing)從(cong)產品到落(luo)地應用之(zhi)間的(de)鏈(lian)條打通(tong),成為大模(mo)(mo)型(xing)(xing)領域(yu)的(de)專(zhuan)(zhuan)家(jia)。而在(zai)未來,這批專(zhuan)(zhuan)家(jia)資(zi)源(yuan)的(de)能力(li)(li)不(bu)僅(jin)可(ke)(ke)以(yi)(yi)傳遞給更多的(de)員工(gong)(gong);另一方(fang)面,對(dui)企業來說,也可(ke)(ke)以(yi)(yi)直(zhi)(zhi)接(jie)(jie)獲得專(zhuan)(zhuan)家(jia)資(zi)源(yuan)的(de)幫助,直(zhi)(zhi)接(jie)(jie)進行(xing)企業所需要的(de)大模(mo)(mo)型(xing)(xing)開(kai)發或者提供(gong)參數調優等相關的(de)服務(wu)。"霍宇(yu)說。


其次,在AI平臺工具方面,軟通動力也打造了軟通天璇2.0 MaaS 平臺。據(ju)介紹(shao),基于產業(ye)服務(wu)需求,軟(ruan)(ruan)通天璇2.0 MaaS平臺(tai)在整合軟(ruan)(ruan)通行(xing)業(ye)模型管理平臺(tai)(iSS Model Ops Platform)、軟(ruan)(ruan)通應(ying)用(yong)開發(fa)平臺(tai)(iSS Model Dev Tools)、軟(ruan)(ruan)通場(chang)景Plugin應(ying)用(yong)服務(wu)平臺(tai)(iSS Model Plugin Store)等產品的基礎上(shang),能夠為(wei)(wei)客戶提(ti)(ti)供大模型的數(shu)(shu)據(ju)處理、大模型一(yi)站(zhan)式運營服務(wu)、繼(ji)續訓(xun)練、調優、部署、推理和(he)數(shu)(shu)字(zi)資(zi)產管理、數(shu)(shu)據(ju)安全(quan)等服務(wu)。值得一(yi)提(ti)(ti)的是,軟(ruan)(ruan)通動力全(quan)新(xin)升級的訓(xun)推一(yi)體化平臺(tai),基于昇騰(teng)硬件底座,采(cai)用(yong)軟(ruan)(ruan)通G420K訓(xun)練平臺(tai)和(he)軟(ruan)(ruan)通G210K推理平臺(tai),整合歐拉操作系(xi)統等組件,搭載自有AI中臺(tai),能夠為(wei)(wei)用(yong)戶提(ti)(ti)供多種交(jiao)互式AI模型,深度適配不同AI應(ying)用(yong)場(chang)景,在央(yang)國企、教育科研、金融(rong)等多行(xing)業(ye)多領(ling)域都可以應(ying)用(yong)。

第三,在AI合作方面,軟通動力與行業內頭部和主流大模型廠商都建立了生態向的合作。不僅率先接入了微軟Azure云 GPT4,并且也是百度文心一言、華為云盤古大模型、阿里通義千問、元乘象ChatImg2.0的生態合作伙伴,同時也在積極深研諸如ChatGLM、DeepSpeed Chat、OpenAssistant、Alpaca、LLaMA等開源大模型。
霍宇認為(wei),軟(ruan)通動力在AI合作生態方面全方位的(de)(de)"布局",最大(da)的(de)(de)價值(zhi)在于團(tuan)隊(dui)通過(guo)使用(yong)這(zhe)些第三方的(de)(de)商用(yong)大(da)模(mo)型(xing)(xing)服(fu)務,以及開源大(da)模(mo)型(xing)(xing),沉淀了不少(shao)的(de)(de)經(jing)驗(yan)和(he)方法論,而這(zhe)些實踐和(he)經(jing)驗(yan),對(dui)行業客(ke)戶落地(di)大(da)模(mo)型(xing)(xing)也是具有極高的(de)(de)參考價值(zhi)和(he)借鑒意義的(de)(de),可以避免企(qi)業在大(da)模(mo)型(xing)(xing)落地(di)過(guo)程(cheng)中少(shao)走"彎(wan)路",這(zhe)也是一種較為(wei)"穩妥(tuo)"的(de)(de)落地(di)方式。

最后,是大模型落地實踐方面,軟通動力也正在和行業客戶通過"共創"的形式,更好地推動企業擁抱大模型時代。
"現在(zai)不少行(xing)業(ye)(ye)客戶都找到軟(ruan)通(tong),他們認為目前(qian)如果企業(ye)(ye)自己要搞(gao)一(yi)套(tao)大(da)(da)模型是有(you)困難的(de)(de)(de)(de),這(zhe)(zhe)些(xie)行(xing)業(ye)(ye)客戶的(de)(de)(de)(de)優(you)勢在(zai)于他們有(you)不少的(de)(de)(de)(de)行(xing)業(ye)(ye)數據,但是并不知道如何(he)讓(rang)(rang)這(zhe)(zhe)些(xie)數據更好(hao)地實現語料化,或(huo)者(zhe)如何(he)讓(rang)(rang)大(da)(da)模型在(zai)節省算力(li)的(de)(de)(de)(de)基(ji)礎上,更快地實現訓練或(huo)者(zhe)推(tui)理等等。除此之外,搭建行(xing)業(ye)(ye)大(da)(da)模型,前(qian)期的(de)(de)(de)(de)規劃以(yi)及選型,也是一(yi)道門檻(jian),而這(zhe)(zhe)些(xie)正是軟(ruan)通(tong)動(dong)力(li)擅(shan)長的(de)(de)(de)(de)工作,因此雙(shuang)方(fang)可以(yi)通(tong)過共創的(de)(de)(de)(de)形式,共同推(tui)進大(da)(da)模型的(de)(de)(de)(de)落地,目前(qian)公司已經(jing)和(he)不少的(de)(de)(de)(de)銀(yin)行(xing)和(he)保險(xian)行(xing)業(ye)(ye)的(de)(de)(de)(de)客戶展開相(xiang)關的(de)(de)(de)(de)合作。"霍(huo)宇說。

正如IDC最新發布的《AI大(da)模(mo)(mo)型(xing)(xing)技(ji)(ji)(ji)術(shu)能(neng)力評估報告,2023》中(zhong)提(ti)到的:"對(dui)于行業(ye)(ye)用戶(hu)來(lai)說,在(zai)(zai)(zai)關注廠商(shang)大(da)模(mo)(mo)型(xing)(xing)技(ji)(ji)(ji)術(shu)棧(zhan)完備性(xing)的同時,應(ying)著(zhu)重考察廠商(shang)的產(chan)業(ye)(ye)應(ying)用經(jing)(jing)驗積(ji)累,主要發力點應(ying)集中(zhong)在(zai)(zai)(zai)應(ying)用層,將(jiang)技(ji)(ji)(ji)術(shu)應(ying)用到實際業(ye)(ye)務(wu)場景(jing)中(zhong),提(ti)前布局,積(ji)累行業(ye)(ye)、場景(jing)經(jing)(jing)驗和(he)數據,由此才能(neng)‘站在(zai)(zai)(zai)巨人的肩膀上(shang)'打造(zao)差(cha)異化競(jing)爭(zheng)優勢。"從這(zhe)個角度(du)來(lai)說,軟通動力在(zai)(zai)(zai)大(da)模(mo)(mo)型(xing)(xing)服務(wu)領域積(ji)累的四大(da)優勢,無疑可以(yi)更好地幫助(zhu)企業(ye)(ye)擁抱大(da)模(mo)(mo)型(xing)(xing),加速企業(ye)(ye)的數智化轉型(xing)(xing)。

打通落地"最后一公里"

事實(shi)上,軟通動力以服務(wu)模(mo)式"卡位(wei)"大(da)模(mo)型賽(sai)道,本身也是深(shen)思熟慮和審慎考量(liang)的結果。

霍宇告訴我:"當大(da)模(mo)(mo)(mo)型(xing)浪潮襲來(lai)之(zhi)(zhi)時,我們(men)首先否決掉(diao)的(de)就是自己下場(chang)做通(tong)用(yong)大(da)模(mo)(mo)(mo)型(xing)平臺,更多還(huan)是考慮(lv)從行(xing)(xing)業(ye)大(da)模(mo)(mo)(mo)型(xing)的(de)賽道入手,但深入研究之(zhi)(zhi)后又發現,要做行(xing)(xing)業(ye)大(da)模(mo)(mo)(mo)型(xing),垂直行(xing)(xing)業(ye)中的(de)數據(ju)和語料也至關重要。因此,作為(wei)一(yi)家服務型(xing)的(de)公司,軟通(tong)動力以服務的(de)模(mo)(mo)(mo)式(shi)(shi)切入這(zhe)個市場(chang)是最(zui)為(wei)合適(shi)的(de),我們(men)可以通(tong)過專家資源(yuan)、平臺工具,以及經驗和方(fang)法(fa)論,加上行(xing)(xing)業(ye)客戶手中的(de)數據(ju)資源(yuan),雙方(fang)以共創的(de)形式(shi)(shi)合作,是能夠(gou)以較快方(fang)式(shi)(shi)實現大(da)模(mo)(mo)(mo)型(xing)落(luo)地(di)的(de)。"

同樣,以"服務"模式入局大模型賽道,也讓軟通動力能夠以更加"全局"的視角來觀察和看待整個大模型市場,并從中沉淀和總結出了不少大模型落地中值得重視的關鍵事項。

第一,是關于開源和商用大模型的選型問題。對此,霍宇認為(wei),基于業(ye)務的需求情況,中國(guo)企業(ye)也會(hui)像選(xuan)擇公有(you)(you)云和私有(you)(you)云部署那樣(yang),既會(hui)選(xuan)擇直接接入商用大模型,也會(hui)選(xuan)擇基于開源大模型部署本地化的服務。

"拋開(kai)(kai)算力(li)資源(yuan)問題不說,如果單(dan)看模(mo)型參數大(da)(da)小,開(kai)(kai)源(yuan)大(da)(da)模(mo)型在相對小的(de)規模(mo)上能(neng)力(li)已(yi)(yi)經接近商(shang)(shang)用模(mo)型,漸漸有了(le)趕超的(de)勢頭。另外,相對追(zhui)求大(da)(da)而(er)全的(de)通(tong)用商(shang)(shang)用大(da)(da)模(mo)型,在垂直領域的(de)模(mo)型訓練上,開(kai)(kai)源(yuan)模(mo)型的(de)數量已(yi)(yi)經超過商(shang)(shang)用模(mo)型,因此企業(ye)不用太(tai)擔(dan)心開(kai)(kai)源(yuan)大(da)(da)模(mo)型會落后(hou)于主流的(de)商(shang)(shang)用大(da)(da)模(mo)型平臺。而(er)在行業(ye)大(da)(da)模(mo)型領域,應該說整個市場都還(huan)不太(tai)成熟(shu)(shu),還(huan)處在探索與實踐的(de)階段,這(zhe)就需(xu)要整個產業(ye)鏈通(tong)過共創的(de)方式,推動行業(ye)大(da)(da)模(mo)型的(de)慢(man)慢(man)成熟(shu)(shu),最(zui)終(zhong)打通(tong)落地的(de)最(zui)后(hou)一公里。"霍宇說。

第二,除了算力和模型參數之外,企業應該把重心放在數據以及語料的沉淀上。在霍(huo)宇看來(lai),目前(qian)語料確實是一(yi)個稀缺資源,但很多企(qi)業(ye)沒有(you)意識到這一(yi)點(dian),未來(lai)企(qi)業(ye)如果要做大模型(xing),數據和語料就是繞不開的(de)問(wen)題。也正因此(ci),數據和語料的(de)質量問(wen)題就變(bian)得(de)尤(you)為重要,同樣(yang)底層數據的(de)清洗、標注(zhu)、治(zhi)理等一(yi)系列的(de)工作也變(bian)得(de)更加地迫在眉睫。

"我(wo)(wo)們(men)目前也(ye)正(zheng)在(zai)(zai)(zai)幫助一些行(xing)業客戶(hu)做數(shu)(shu)(shu)(shu)據治理的(de)(de)(de)工(gong)作,我(wo)(wo)們(men)判斷做數(shu)(shu)(shu)(shu)據和語(yu)料(liao)的(de)(de)(de)工(gong)作還會(hui)長(chang)久(jiu)持(chi)續,只(zhi)不過(guo)很多(duo)工(gong)作如數(shu)(shu)(shu)(shu)據標(biao)(biao)注、數(shu)(shu)(shu)(shu)據收集的(de)(de)(de)工(gong)作會(hui)變成‘工(gong)具(ju)+人工(gong)'的(de)(de)(de)方式,同時這些數(shu)(shu)(shu)(shu)據和語(yu)料(liao)也(ye)會(hui)更加關(guan)注行(xing)業屬(shu)性。不僅如此,在(zai)(zai)(zai)具(ju)體的(de)(de)(de)實踐(jian)過(guo)程中,我(wo)(wo)們(men)也(ye)總(zong)結(jie)和沉淀了如何把語(yu)料(liao)或數(shu)(shu)(shu)(shu)據形成標(biao)(biao)準化(hua)的(de)(de)(de)方法論,多(duo)大的(de)(de)(de)參(can)數(shu)(shu)(shu)(shu)量需要‘喂'它(ta)多(duo)少(shao)的(de)(de)(de)語(yu)料(liao)能夠(gou)達到(dao)比較(jiao)合適的(de)(de)(de)性價比,這都是軟通動(dong)力正(zheng)在(zai)(zai)(zai)做的(de)(de)(de)事情。在(zai)(zai)(zai)此基(ji)礎上,業務規則(ze)的(de)(de)(de)設定,數(shu)(shu)(shu)(shu)學建模以(yi)及參(can)數(shu)(shu)(shu)(shu)調優(you),以(yi)及后續長(chang)期的(de)(de)(de)優(you)化(hua)等工(gong)作,我(wo)(wo)們(men)也(ye)都是可以(yi)為行(xing)業客戶(hu)提供(gong)相關(guan)服務的(de)(de)(de)。"他說。


第三,向量數據庫也是軟通動力關注的重要方向。向量(liang)(liang)數據(ju)庫主要(yao)用在AI和機器學習領域(yu)。在這些(xie)領域(yu),數據(ju)通常以向量(liang)(liang)的(de)(de)形式呈現,可以有效(xiao)解決文本、圖片、音頻、視頻等(deng)(deng)非(fei)(fei)結(jie)構化數據(ju)存儲和查(cha)詢的(de)(de)難題;而在大(da)模型(xing)時(shi)代,目前對(dui)非(fei)(fei)結(jie)構化數據(ju)進行管理(li)和處理(li)的(de)(de)主流方法是,利用RNN或(huo) Transformer 等(deng)(deng)嵌入(ru)模型(xing)(Embedding Model),將非(fei)(fei)結(jie)構化數據(ju)的(de)(de)語(yu)義內容轉化為多維向量(liang)(liang),并直接對(dui)這些(xie)向量(liang)(liang)進行存儲、處理(li),由此可以為大(da)模型(xing)的(de)(de)訓練、學習等(deng)(deng)提供更好的(de)(de)數據(ju)支撐。

霍宇認為(wei),向量數(shu)(shu)據庫在(zai)大(da)模型(xing)中將會起到三個(ge)方(fang)面(mian)的(de)作用和價值,包括(kuo)它(ta)(ta)目前已成為(wei)推動大(da)模型(xing)迭代和進化的(de)核心技術,同時它(ta)(ta)對企業的(de)定(ding)制化需(xu)求也會有質的(de)影響;更為(wei)關鍵的(de)是,向量數(shu)(shu)據庫對以后的(de)數(shu)(shu)據型(xing)項(xiang)目的(de)交付(fu)也會產生比較大(da)的(de)變革。

"我(wo)的理解(jie)是(shi),向(xiang)量(liang)數(shu)據(ju)庫(ku)是(shi)對數(shu)據(ju)科(ke)學(xue)的再(zai)一(yi)(yi)次‘數(shu)字化',可(ke)以簡單(dan)地對比原來(lai)以表結構(gou)橫縱為主的數(shu)據(ju)庫(ku),是(shi)用二維或者多維結構(gou)來(lai)表現(xian),那么向(xiang)量(liang)數(shu)據(ju)庫(ku)就(jiu)是(shi)用一(yi)(yi)維結構(gou)來(lai)表現(xian)世(shi)界(jie)。因此隨(sui)著(zhu)向(xiang)量(liang)數(shu)據(ju)庫(ku)和算(suan)力以及(ji)AGI技術的發展,未(wei)來(lai)的數(shu)據(ju)交付模式(shi)就(jiu)會改變(bian),由此也會產生全新的商業模式(shi),我(wo)們對此也是(shi)高度關注(zhu)。"霍宇表示。

回(hui)頭來看(kan),軟(ruan)通(tong)動(dong)力(li)(li)這種(zhong)"行勝(sheng)于言"的(de)(de)(de)務實(shi)風格,讓(rang)它在大(da)模型服(fu)務賽道中(zhong)構(gou)建(jian)了屬于自(zi)己獨特的(de)(de)(de)競爭優勢。在AI算力(li)(li)資源上(shang)真金白銀(yin)的(de)(de)(de)投入,對(dui)一(yi)家服(fu)務型企業而(er)言,背后是決心的(de)(de)(de)彰顯和(he)對(dui)市場大(da)勢的(de)(de)(de)把握。這使得軟(ruan)通(tong)動(dong)力(li)(li)一(yi)方面可(ke)以(yi)提供充足的(de)(de)(de)算力(li)(li)資源供工程(cheng)師和(he)開(kai)發人員上(shang)手,積(ji)累(lei)和(he)沉淀實(shi)操(cao)經驗;另一(yi)方面,也可(ke)提供現(xian)場Demo環境供企業客戶使用,讓(rang)客戶能切實(shi)感受到大(da)模型帶來的(de)(de)(de)全新價值(zhi)。"

未(wei)來,我們還會繼續儲備更(geng)多的(de)專家資源(yuan),持續在平(ping)臺和工具上做投入,并(bing)根據(ju)客戶的(de)業務應用場景(jing)強化數據(ju)和語料(liao)的(de)質量,最終提升交(jiao)付的(de)效率,以(yi)更(geng)好的(de)創新服務模(mo)式打通大模(mo)型落地的(de)最后一公里。"霍宇(yu)如(ru)是說。

在"躬身實踐"和"作壁上觀"之間,軟通動力選擇了前者,這也讓其對大模型市場有了更加深刻的認知和洞察,同時其過去一段時間的大膽實踐,也讓其在人才、工具、生態乃至方法論方面有了更多的積累和沉淀,而這也是軟通動力有能力,更有信心讓更多行業客戶加速擁抱大模型時代的底氣所在。

消息來源:軟通動力信息技術(集團)股份有限公司
全球TMT
微信公眾號“全球TMT”發布全球互聯網、科技、媒體、通訊企業的經營動態、財報信息、企業并購消息。掃描二維碼,立即訂閱!
collection