上海2017年4月1日(ri)電 /美通社(she)/ -- 近期,由七牛(niu)云(yun)組織(zhi)的(de)的(de)架(jia)構師小組交流會在線上舉行(xing),Polarr 聯合(he)創始人宮恩浩(hao)、搜(sou)狗大數據總監高君、七牛(niu)云(yun) AI 實驗室負責(ze)人彭垚參加了(le)活動(dong),討論中(zhong)三位分享人對深度(du)學習(xi)框架(jia)選型(xing)、深度(du)學習(xi)的(de)未來趨勢(shi)展開了(le)交流和探索。
分享開始,Polarr 聯合(he)創始人宮恩浩介紹了(le)Polarr(國內叫潑辣修圖(tu)),Polarr在美國是(shi)做(zuo)圖(tu)片大數據的(de)(de)(de)(de)(de)(de),有(you)云(yun)端,也有(you)手(shou)(shou)機(ji)(ji)端,PC 端,Polarr通過 App 收(shou)集(ji)數據,建立優(you)(you)化的(de)(de)(de)(de)(de)(de)算法,我們(men)在云(yun)端提(ti)(ti)供(gong)圖(tu)片整(zheng)理(li)、圖(tu)片選擇、圖(tu)片信息(xi)的(de)(de)(de)(de)(de)(de)識別(bie)(bie),把(ba)識別(bie)(bie)的(de)(de)(de)(de)(de)(de)模(mo)型通過壓縮(suo)(suo)手(shou)(shou)段,把(ba)整(zheng)個(ge)深度學(xue)習(xi)放(fang)在手(shou)(shou)機(ji)(ji)的(de)(de)(de)(de)(de)(de) App,實現圖(tu)片裁定、識別(bie)(bie)、選擇、渲(xuan)染,在這(zhe)當中會應用到很多深度學(xue)習(xi)的(de)(de)(de)(de)(de)(de)功能(neng)開發。隨(sui)后介紹了(le)自己(ji)在網絡壓縮(suo)(suo)方(fang)面的(de)(de)(de)(de)(de)(de)做(zuo)法:首先(xian),要找到一個(ge)最適合(he)的(de)(de)(de)(de)(de)(de)架構,這(zhe)部(bu)分得(de)根據具(ju)體(ti)的(de)(de)(de)(de)(de)(de)應用、性能(neng)要求來定。其次,是(shi)網絡壓縮(suo)(suo),在不改變(bian)(bian)模(mo)型效果(guo)前提(ti)(ti)下盡(jin)量減少模(mo)型參數。最后,是(shi)模(mo)型編碼(ma),Polarr 有(you)在做(zuo)想把(ba)圖(tu)像識別(bie)(bie)的(de)(de)(de)(de)(de)(de) Network 放(fang)在手(shou)(shou)機(ji)(ji)上,那(nei)么首先(xian)基于模(mo)型壓縮(suo)(suo)。具(ju)體(ti)實現的(de)(de)(de)(de)(de)(de)方(fang)法是(shi):每步迭代的(de)(de)(de)(de)(de)(de)時候(hou),一部(bu)分把(ba)小(xiao)的(de)(de)(de)(de)(de)(de)部(bu)分變(bian)(bian)成(cheng)零,然(ran)后不斷迭代優(you)(you)化,最終模(mo)型還(huan)有(you)一些優(you)(you)化,會小(xiao)很多。然(ran)后同時還(huan)可以在手(shou)(shou)機(ji)(ji)上 Network 優(you)(you)化編碼(ma),我實驗的(de)(de)(de)(de)(de)(de)時候(hou)權重也可以從原來的(de)(de)(de)(de)(de)(de) 32 位(wei) float,變(bian)(bian)成(cheng) 16 位(wei),就(jiu)是(shi)少了(le)一半(ban),或者(zhe)是(shi)變(bian)(bian)成(cheng) 8 位(wei)的(de)(de)(de)(de)(de)(de)話(hua)做(zuo)了(le) encoding 就(jiu)會小(xiao)很多,基于這(zhe)些(優(you)(you)化模(mo)型結構,閾值讓模(mo)型稀疏(shu),編碼(ma)來減少存儲)就(jiu)可以不斷進行壓縮(suo)(suo)。
搜狗大數(shu)據總監(jian)高君給大家分享了(le)在廣告(gao)(gao)領域深(shen)度學(xue)習(xi)(xi)的(de)(de)應(ying)用(yong)案例。他表示(shi),搜狗從用(yong)戶(hu)端的(de)(de)產(chan)品來講(jiang)(jiang),有(you)兩(liang)(liang)個(ge)產(chan)品與深(shen)度學(xue)習(xi)(xi)有(you)較強(qiang)關系,一(yi)(yi)個(ge)是(shi)語音識別,應(ying)用(yong)在輸(shu)入法,用(yong)于(yu)語音輸(shu)入轉(zhuan)文本(ben)(ben),另(ling)一(yi)(yi)個(ge)是(shi)圖像搜索。搜狗推薦是(shi)以推薦結構(gou)(gou)(gou)化(hua)(hua)數(shu)據和(he)推薦非(fei)結構(gou)(gou)(gou)化(hua)(hua)數(shu)據兩(liang)(liang)種都有(you)的(de)(de)模式,對于(yu)搜索廣告(gao)(gao)來講(jiang)(jiang),它(ta)(ta)是(shi)有(you)一(yi)(yi)個(ge)明確的(de)(de)查詢詞,你(ni)可以理解為是(shi)一(yi)(yi)個(ge)結構(gou)(gou)(gou)化(hua)(hua)。假設把文本(ben)(ben)理解為結構(gou)(gou)(gou)化(hua)(hua),那(nei)么對于(yu)展示(shi)類的(de)(de)廣告(gao)(gao)就很(hen)復(fu)雜了(le),為了(le)提高線上的(de)(de) CTR,需(xu)要明確用(yong)戶(hu)的(de)(de)興趣(qu),那(nei)么處(chu)理用(yong)戶(hu)興趣(qu)的(de)(de)過程(cheng)中,它(ta)(ta)的(de)(de)數(shu)據差異非(fei)常大,肯定會用(yong)到(dao)(dao)(dao)搜索,但是(shi)也會用(yong)到(dao)(dao)(dao)它(ta)(ta)站(zhan)內(nei)的(de)(de)一(yi)(yi)些瀏覽的(de)(de)行(xing)為,比方說我們拿(na)到(dao)(dao)(dao)客(ke)戶(hu)站(zhan)內(nei)所有(you)的(de)(de)數(shu)據,它(ta)(ta)整個(ge)數(shu)據的(de)(de)來源很(hen)復(fu)雜。所以對于(yu)展示(shi)類廣告(gao)(gao)來講(jiang)(jiang),可以認為所有(you)的(de)(de)處(chu)理的(de)(de)數(shu)據基本(ben)(ben)都是(shi)異構(gou)(gou)(gou)的(de)(de),可以理解為是(shi)個(ge)非(fei)結構(gou)(gou)(gou)化(hua)(hua)的(de)(de)問(wen)題(ti)。
最(zui)后,七(qi)(qi)牛(niu)(niu)云(yun)(yun) AI 實(shi)(shi)驗室負責(ze)人彭垚分享了七(qi)(qi)牛(niu)(niu)AI 方面的(de)(de)(de)戰(zhan)略(lve),他表示,七(qi)(qi)牛(niu)(niu)是(shi)一(yi)(yi)個以云(yun)(yun)存(cun)儲起家(jia)的(de)(de)(de)公司,在七(qi)(qi)牛(niu)(niu)云(yun)(yun)平(ping)臺(tai)(tai)(tai)上(shang)(shang)面有廣(guang)泛(fan)的(de)(de)(de)圖像、視(shi)(shi)(shi)頻、音頻的(de)(de)(de)數據,富媒(mei)體(ti)客戶非常多,所以七(qi)(qi)牛(niu)(niu)云(yun)(yun)AI 實(shi)(shi)驗室的(de)(de)(de)主要職責(ze)是(shi)對大量的(de)(de)(de)富媒(mei)體(ti)數據去做分析,并做一(yi)(yi)些內容(rong)審核(he),識(shi)別等相關領域的(de)(de)(de)應用,以服務我(wo)們(men)(men)平(ping)臺(tai)(tai)(tai)上(shang)(shang)面的(de)(de)(de)客戶。包(bao)括(kuo)(kuo)像視(shi)(shi)(shi)頻分析之類的(de)(de)(de),包(bao)括(kuo)(kuo)一(yi)(yi)些視(shi)(shi)(shi)頻通用檢(jian)測的(de)(de)(de)一(yi)(yi)些功能,我(wo)們(men)(men)會致力(li)于解決我(wo)們(men)(men)平(ping)臺(tai)(tai)(tai)上(shang)(shang)客戶的(de)(de)(de)實(shi)(shi)際問題(ti)來投(tou)入這(zhe)方面的(de)(de)(de)研究,主要是(shi)視(shi)(shi)(shi)頻分析領域,因為我(wo)們(men)(men)存(cun)儲上(shang)(shang)面視(shi)(shi)(shi)頻非常多,視(shi)(shi)(shi)頻的(de)(de)(de)細粒度檢(jian)測也是(shi)其(qi)中的(de)(de)(de)一(yi)(yi)個重點方向。
深(shen)(shen)度學習(xi)是(shi)人(ren)工智(zhi)能發展(zhan)的(de)(de)(de)(de)一(yi)個里(li)程碑(bei),雖然深(shen)(shen)度學習(xi)已經(jing)在(zai)語音(yin)識別(bie)、圖像識別(bie)、預測(ce)分析、機(ji)器翻譯等領域(yu)小試(shi)身手,從(cong)三位專(zhuan)家分享的(de)(de)(de)(de)技術方向來看還深(shen)(shen)度學習(xi)的(de)(de)(de)(de)技術處在(zai)初級階段。誰也(ye)不能保障深(shen)(shen)度學習(xi)在(zai)未來是(shi)否能夠成為人(ren)工智(zhi)能最基礎的(de)(de)(de)(de)方法,或(huo)許會有新的(de)(de)(de)(de)更好的(de)(de)(de)(de)技術替代深(shen)(shen)度學習(xi),但是(shi)可以肯定的(de)(de)(de)(de)是(shi),人(ren)工智(zhi)能的(de)(de)(de)(de)夢想(xiang)不再遙遠,機(ji)器將(jiang)在(zai)不久(jiu)的(de)(de)(de)(de)將(jiang)來像人(ren)類一(yi)樣(yang)思考(kao)。