上海2017年8月24日電 /美通社/ -- 8月23日,以“塑造數據生態.引領金融科技.聚焦數據未來”為主題的大數據金融論壇BDFF2017 在上海隆重召開,數百家機構、行業專家、決策者共同聚焦,緊扣政策熱點,共同探討大數據金融科技發展趨勢,探索大數據普惠金融的發展與未來。中誠信征信CTO姚明受邀出席此次峰會并深度剖析信用科技的進化,在征信路上對信用科(ke)技的探索(suo)和實踐。
演講全(quan)文如(ru)下:
信用科技的進化主要是基礎IT技術的進化
中誠信(xin)征(zheng)信(xin)在今年(nian)(nian)(nian)(nian)首次提(ti)出了(le)“信(xin)用(yong)科技(ji)(ji)”這(zhe)個(ge)(ge)概念,以呼應(ying)新時代背景(jing)下金融科技(ji)(ji)在信(xin)用(yong)這(zhe)一板塊的發(fa)(fa)展(zhan)。之所以選擇(ze)(ze)使(shi)用(yong)進(jin)化(hua)(hua)(hua)(hua)這(zhe)個(ge)(ge)詞,是這(zhe)個(ge)(ge)詞既能表(biao)達技(ji)(ji)術(shu)發(fa)(fa)展(zhan)的主(zhu)動性(xing),又能體現(xian)外部環境變化(hua)(hua)(hua)(hua)帶(dai)來的影響和選擇(ze)(ze)性(xing)。縱觀征(zheng)信(xin)的發(fa)(fa)展(zhan)歷史,從一百多年(nian)(nian)(nian)(nian)前英國裁(cai)縫之間(jian)共享(xiang)不(bu)守信(xin)的貴(gui)族黑名單開始,而后進(jin)化(hua)(hua)(hua)(hua)為信(xin)貸交(jiao)易記錄的征(zheng)信(xin),并在百年(nian)(nian)(nian)(nian)間(jian)穩步發(fa)(fa)展(zhan),在這(zhe)一時期,信(xin)用(yong)科技(ji)(ji)的進(jin)化(hua)(hua)(hua)(hua)主(zhu)要是IT技(ji)(ji)術(shu)的進(jin)化(hua)(hua)(hua)(hua),直到近幾年(nian)(nian)(nian)(nian)大數據(ju)技(ji)(ji)術(shu)出現(xian),為信(xin)用(yong)科技(ji)(ji)的進(jin)化(hua)(hua)(hua)(hua)提(ti)供了(le)更(geng)廣闊的空間(jian),可以類(lei)比(bi)人類(lei)進(jin)化(hua)(hua)(hua)(hua)史中對工具的使(shi)用(yong),以及(ji)人工智能技(ji)(ji)術(shu)的不(bu)斷成(cheng)熟(shu),為信(xin)用(yong)科技(ji)(ji)的進(jin)化(hua)(hua)(hua)(hua)提(ti)供了(le)更(geng)多縱深,可以類(lei)比(bi)人類(lei)進(jin)化(hua)(hua)(hua)(hua)史中對火(huo)的使(shi)用(yong)。
大數(shu)據(ju)和人工智(zhi)能是(shi)信(xin)(xin)用科技(ji)進化的內(nei)因(yin),而(er)新(xin)金融(rong)對于大數(shu)據(ju)風(feng)控(kong)的訴求,包括普(pu)惠、實時、精準、場景等(deng)一系列特點,則是(shi)外因(yin)。所以(yi),我們定(ding)義的信(xin)(xin)用科技(ji),即Creditech,是(shi)旨在通過大數(shu)據(ju)、人工智(zhi)能等(deng)技(ji)術(shu)的進步,推(tui)動信(xin)(xin)用評(ping)估的智(zhi)能化和信(xin)(xin)用價值的擴大化。
信用科技進化的一些主要方(fang)面包(bao)括:
信用數據從單體高價值到群體高價值的進化
首先是數據維度的進化。所有的(de)(de)(de)(de)信(xin)(xin)用(yong)評估(gu),都(dou)(dou)是(shi)(shi)圍繞履約意愿和(he)履約能力而展(zhan)開(kai)的(de)(de)(de)(de)。以前,對于(yu)這(zhe)兩方面的(de)(de)(de)(de)評估(gu),都(dou)(dou)是(shi)(shi)圍繞直接數(shu)據(ju)(ju)(ju)(ju)展(zhan)開(kai)的(de)(de)(de)(de),也就是(shi)(shi)強(qiang)金(jin)融數(shu)據(ju)(ju)(ju)(ju),比如信(xin)(xin)貸(dai)記錄(lu)和(he)資(zi)(zi)產信(xin)(xin)息(xi)(xi)(xi)。那么在大(da)(da)(da)數(shu)據(ju)(ju)(ju)(ju)技(ji)術發展(zhan)背景下,這(zhe)兩方面的(de)(de)(de)(de)信(xin)(xin)息(xi)(xi)(xi)維(wei)度(du)也得到了(le)(le)進(jin)一(yi)步(bu)增強(qiang),比如信(xin)(xin)貸(dai)記錄(lu)中增加(jia)了(le)(le)消費(fei)分期、網貸(dai)、租賃等信(xin)(xin)息(xi)(xi)(xi)維(wei)度(du),在資(zi)(zi)產信(xin)(xin)息(xi)(xi)(xi)中也增加(jia)了(le)(le)股權(quan)投資(zi)(zi)、理財信(xin)(xin)息(xi)(xi)(xi)等。除了(le)(le)這(zhe)些(xie)強(qiang)金(jin)融信(xin)(xin)息(xi)(xi)(xi),大(da)(da)(da)數(shu)據(ju)(ju)(ju)(ju)技(ji)術賦能信(xin)(xin)用(yong)評估(gu)引(yin)入(ru)了(le)(le)更多的(de)(de)(de)(de)次(ci)(ci)金(jin)融相(xiang)(xiang)(xiang)關、弱金(jin)融相(xiang)(xiang)(xiang)關數(shu)據(ju)(ju)(ju)(ju),比如消費(fei)信(xin)(xin)息(xi)(xi)(xi)、設備行為(wei)信(xin)(xin)息(xi)(xi)(xi)、網絡(luo)行為(wei)信(xin)(xin)息(xi)(xi)(xi)、甚至(zhi)是(shi)(shi)社(she)交(jiao)行為(wei)信(xin)(xin)息(xi)(xi)(xi)等。這(zhe)些(xie)金(jin)融次(ci)(ci)相(xiang)(xiang)(xiang)關、弱相(xiang)(xiang)(xiang)關數(shu)據(ju)(ju)(ju)(ju),在大(da)(da)(da)數(shu)據(ju)(ju)(ju)(ju)技(ji)術和(he)人(ren)工智能技(ji)術的(de)(de)(de)(de)催化(hua)下,也對信(xin)(xin)用(yong)評估(gu)產生了(le)(le)重大(da)(da)(da)的(de)(de)(de)(de)意義,是(shi)(shi)信(xin)(xin)用(yong)數(shu)據(ju)(ju)(ju)(ju)從單體(ti)高價值到群體(ti)高價值的(de)(de)(de)(de)一(yi)次(ci)(ci)重大(da)(da)(da)進(jin)化(hua)。
其次是數據采集技術的進化。傳統(tong)的(de)信用(yong)評估更(geng)多的(de)是(shi)通(tong)(tong)(tong)過(guo)(guo)用(yong)戶(hu)(hu)(hu)自述、人(ren)工(gong)核(he)驗等方(fang)(fang)式(shi)(shi)對數(shu)據進(jin)(jin)行采(cai)集(ji)(ji)和確認。大數(shu)據技(ji)術(shu)的(de)發展,賦能了更(geng)多的(de)采(cai)集(ji)(ji)方(fang)(fang)式(shi)(shi),例如(ru)通(tong)(tong)(tong)過(guo)(guo)API聚合方(fang)(fang)式(shi)(shi)采(cai)集(ji)(ji)三方(fang)(fang)數(shu)據;通(tong)(tong)(tong)過(guo)(guo)SDK插件預(yu)埋采(cai)集(ji)(ji)設備指紋、申請行為數(shu)據;通(tong)(tong)(tong)過(guo)(guo)物(wu)理識別(bie)(bie)包括生物(wu)識別(bie)(bie)進(jin)(jin)行人(ren)臉(lian)識別(bie)(bie)、活體檢測(ce)、聲紋檢測(ce)、OCR證照識別(bie)(bie)、NFC讀(du)取卡信息(xi)(xi);通(tong)(tong)(tong)過(guo)(guo)授權定向抓取技(ji)術(shu),在用(yong)戶(hu)(hu)(hu)直接授權下(xia)獲取其交(jiao)易記(ji)錄、通(tong)(tong)(tong)信記(ji)錄等。以上這(zhe)些采(cai)集(ji)(ji)方(fang)(fang)式(shi)(shi),都是(shi)信用(yong)科技(ji)在采(cai)集(ji)(ji)方(fang)(fang)式(shi)(shi)上的(de)進(jin)(jin)化(hua),其獲取信息(xi)(xi)的(de)方(fang)(fang)式(shi)(shi)更(geng)穩定、更(geng)實時、更(geng)可(ke)靠。當然,我們也注(zhu)意到數(shu)據采(cai)集(ji)(ji)技(ji)術(shu)的(de)進(jin)(jin)化(hua),會(hui)帶來更(geng)多關于(yu)用(yong)戶(hu)(hu)(hu)隱私保護方(fang)(fang)面的(de)難題(ti),亟待解決(jue)。
第三,是對數據處理方式上的進化。早期(qi)的(de)征(zheng)信(xin)技術(shu),主要(yao)是對數(shu)(shu)據(ju)的(de)ETL,即(ji)(ji)對數(shu)(shu)據(ju)的(de)清洗與(yu)融合。而現在(zai),除(chu)了這些基礎(chu)數(shu)(shu)據(ju)處(chu)理(li)(li)(li)技術(shu)外,還(huan)廣泛的(de)采用聚(ju)類(lei)技術(shu)對人(ren)群(qun)進(jin)(jin)(jin)(jin)行分類(lei),再利用數(shu)(shu)據(ju)的(de)標簽化(hua)處(chu)理(li)(li)(li)對人(ren)進(jin)(jin)(jin)(jin)行畫(hua)像(xiang),以更(geng)(geng)為生動直觀的(de)形式刻(ke)畫(hua)人(ren)的(de)信(xin)用;利用ID Mapping技術(shu)對人(ren)的(de)更(geng)(geng)多可識別(bie)維度進(jin)(jin)(jin)(jin)行關(guan)聯(lian)(lian),例如除(chu)了姓名、身份證(zheng)、手機號、銀行卡等信(xin)息外,還(huan)利用照片、設備指紋(wen)、網絡指紋(wen)等非機構(gou)化(hua)信(xin)息進(jin)(jin)(jin)(jin)行身份關(guan)聯(lian)(lian)。在(zai)身份關(guan)聯(lian)(lian)以外,知識圖譜技術(shu)還(huan)提(ti)(ti)供(gong)了對數(shu)(shu)據(ju)更(geng)(geng)平面化(hua)的(de)處(chu)理(li)(li)(li),即(ji)(ji)通過降維處(chu)理(li)(li)(li),信(xin)息被定義為“主體”與(yu)“關(guan)系”,不但能夠將人(ren)與(yu)人(ren)進(jin)(jin)(jin)(jin)行關(guan)聯(lian)(lian),還(huan)能夠將人(ren)與(yu)企業、人(ren)與(yu)事件(jian)、人(ren)與(yu)所有事物(wu)進(jin)(jin)(jin)(jin)行關(guan)聯(lian)(lian),進(jin)(jin)(jin)(jin)一步為更(geng)(geng)深層次的(de)關(guan)聯(lian)(lian)風(feng)險分析提(ti)(ti)供(gong)支持。所以,對于數(shu)(shu)據(ju)的(de)處(chu)理(li)(li)(li),其進(jin)(jin)(jin)(jin)化(hua)的(de)方向(xiang)是從冰冷到(dao)生動,由(you)表層到(dao)深層。
從“人工+智能”到“人工智能”的進化
第四是信用建模技術的進化。
在(zai)一個信貸(dai)業務場景中(zhong)產生的(de)(de)(de)實際(ji)案例。第(di)一張圖示真實的(de)(de)(de)歷史數據(ju),星型(xing)(xing)標記為一個借(jie)貸(dai)人(ren),區(qu)(qu)(qu)域(yu)(yu)的(de)(de)(de)顏色(se)(se)(se)表(biao)示的(de)(de)(de)是(shi)(shi)信用情(qing)況(kuang)(kuang),綠色(se)(se)(se)代表(biao)健康(kang),紅色(se)(se)(se)代表(biao)風(feng)(feng)險(xian),可(ke)以看(kan)(kan)到(dao)這(zhe)個借(jie)貸(dai)人(ren)的(de)(de)(de)信用情(qing)況(kuang)(kuang)是(shi)(shi)處于綠色(se)(se)(se)區(qu)(qu)(qu)域(yu)(yu)的(de)(de)(de),也(ye)(ye)就是(shi)(shi)還(huan)不(bu)錯。第(di)二幅圖,是(shi)(shi)傳統(tong)(tong)的(de)(de)(de)統(tong)(tong)計分(fen)析(xi)(xi)視角下的(de)(de)(de)情(qing)況(kuang)(kuang),可(ke)以看(kan)(kan)到(dao)有兩(liang)根白(bai)色(se)(se)(se)的(de)(de)(de)線,分(fen)別(bie)代表(biao)了(le)兩(liang)個統(tong)(tong)計分(fen)析(xi)(xi)模(mo)型(xing)(xing),在(zai)這(zhe)兩(liang)個模(mo)型(xing)(xing)下,風(feng)(feng)險(xian)都能得到(dao)不(bu)同程度的(de)(de)(de)控制,但(dan)是(shi)(shi)我們的(de)(de)(de)目(mu)標借(jie)貸(dai)人(ren)很不(bu)幸的(de)(de)(de)被排除在(zai)批準(zhun)區(qu)(qu)(qu)域(yu)(yu)外(wai)了(le)。而在(zai)第(di)三幅圖中(zhong),是(shi)(shi)在(zai)機(ji)器(qi)學習(xi)視角下的(de)(de)(de)情(qing)況(kuang)(kuang),我們會看(kan)(kan)到(dao)模(mo)型(xing)(xing)不(bu)再是(shi)(shi)規律的(de)(de)(de)曲線,而是(shi)(shi)不(bu)規則的(de)(de)(de)形狀,在(zai)這(zhe)樣的(de)(de)(de)模(mo)型(xing)(xing)下,我們的(de)(de)(de)目(mu)標借(jie)貸(dai)人(ren)被準(zhun)確的(de)(de)(de)識別(bie)出來了(le)。這(zhe)就是(shi)(shi)信用建模(mo)從統(tong)(tong)計分(fen)析(xi)(xi)到(dao)機(ji)器(qi)學習(xi)的(de)(de)(de)進化,也(ye)(ye)是(shi)(shi)模(mo)型(xing)(xing)由強(qiang)解(jie)釋性(xing)到(dao)弱(ruo)解(jie)釋性(xing)的(de)(de)(de)進化。
眾所周(zhou)知(zhi),要建(jian)立(li)一(yi)個信用評估模型,實際(ji)是就是對y=f(x)中(zhong)的f進(jin)行求解。在求解的過(guo)(guo)程(cheng)(cheng)中(zhong),要經歷數據(ju)抽(chou)取、特(te)征(zheng)工(gong)程(cheng)(cheng)、算法(fa)(fa)選(xuan)擇、參數調優和樣本(ben)檢驗,如果(guo)效(xiao)果(guo)未達(da)預期(qi),再次(ci)回到數據(ju)抽(chou)取,進(jin)而(er)循(xun)環(huan)迭代(dai)。對于(yu)(yu)這個循(xun)環(huan),我們(men)一(yi)方面通(tong)(tong)過(guo)(guo)程(cheng)(cheng)序化處理,讓整個過(guo)(guo)程(cheng)(cheng)自動(dong)化完成(cheng),另一(yi)方面通(tong)(tong)過(guo)(guo)人工(gong)智能算法(fa)(fa),對于(yu)(yu)特(te)征(zheng)工(gong)程(cheng)(cheng)、算法(fa)(fa)選(xuan)擇和參數調優環(huan)節(jie)進(jin)行智能優化,更快(kuai)速的達(da)成(cheng)更準確的模型。這是從“人工(gong)+智能”到“人工(gong)智能”的進(jin)化。
從(cong)征信(xin)(xin)的(de)“個體信(xin)(xin)用”到(dao)評級的(de)“資產(chan)信(xin)(xin)用”的(de)進(jin)化
在信(xin)(xin)用(yong)(yong)領(ling)域,信(xin)(xin)用(yong)(yong)的(de)(de)類別可以歸(gui)納為個人信(xin)(xin)用(yong)(yong)、企業信(xin)(xin)用(yong)(yong)、政府(fu)信(xin)(xin)用(yong)(yong)、以及由信(xin)(xin)貸(dai)資產抽(chou)象而來的(de)(de)資產信(xin)(xin)用(yong)(yong)。在信(xin)(xin)用(yong)(yong)評(ping)(ping)估(gu)層(ceng)面,征信(xin)(xin)和評(ping)(ping)級(ji)一直是作為兩個各自獨(du)立的(de)(de)存在。征信(xin)(xin)服務于(yu)(yu)消費(fei)者(zhe)信(xin)(xin)貸(dai)中的(de)(de)個體(ti)信(xin)(xin)用(yong)(yong),評(ping)(ping)級(ji)服務于(yu)(yu)機構主體(ti)和資產包的(de)(de)宏觀(guan)信(xin)(xin)用(yong)(yong)。在獨(du)立、客觀(guan)的(de)(de)信(xin)(xin)用(yong)(yong)科技(ji)驅(qu)動(dong)下,從(cong)征信(xin)(xin)的(de)(de)“個體(ti)信(xin)(xin)用(yong)(yong)”到評(ping)(ping)級(ji)的(de)(de)“資產信(xin)(xin)用(yong)(yong)”路徑(jing)正(zheng)在被打通(tong)和連接(jie),信(xin)(xin)用(yong)(yong)科技(ji)的(de)(de)價值(zhi)表現(xian),正(zheng)在擴大化。
在中誠信征信,我們圍繞(rao)“個體信用”和“資(zi)產(chan)信用”分別推出了(le)“萬象風云”和“AXIS資(zi)產(chan)交易智(zhi)能掃(sao)描(miao)”平臺(tai),并剛剛在8月(yue)初召(zhao)開了(le)產(chan)品發布會(hui)。
在(zai)(zai)萬象風云平(ping)臺(tai),我(wo)們(men)專注于(yu)基于(yu)“數(shu)(shu)據(ju)+規則(ze)+模(mo)(mo)型(xing)(xing)”三位一體的(de)(de)(de)智能(neng)風控服務,在(zai)(zai)數(shu)(shu)據(ju)層面,我(wo)們(men)提(ti)供(gong)了剛才提(ti)及的(de)(de)(de)幾乎(hu)所(suo)有API聚合數(shu)(shu)據(ju)支持和(he)(he)其他采集插件;在(zai)(zai)規則(ze)層面,我(wo)們(men)依托專家經驗和(he)(he)機器學習(xi)成果,提(ti)供(gong)了包括身份認證(zheng)、數(shu)(shu)據(ju)勾稽、交叉核驗、黑名(ming)單(dan)(dan)、團伙反欺(qi)詐(zha)、設備反欺(qi)詐(zha)、行為反欺(qi)詐(zha)、交易反欺(qi)詐(zha)等一些的(de)(de)(de)規則(ze)集,近千條原子規則(ze),并(bing)可(ke)以通過可(ke)視化、可(ke)編輯的(de)(de)(de)規則(ze)引(yin)擎(qing)自主(zhu)配置(zhi)(zhi);在(zai)(zai)模(mo)(mo)型(xing)(xing)層面,我(wo)們(men)內(nei)置(zhi)(zhi)了針對不(bu)同(tong)場景的(de)(de)(de)模(mo)(mo)型(xing)(xing)組(zu),可(ke)以在(zai)(zai)預設的(de)(de)(de)通過率和(he)(he)壞賬(zhang)率標尺下進行自主(zhu)選擇。除此(ci)之外,風云還內(nei)置(zhi)(zhi)了知識圖譜工(gong)具(ju)、AI智能(neng)建模(mo)(mo)工(gong)具(ju),讓風控和(he)(he)建模(mo)(mo)以極為簡單(dan)(dan)的(de)(de)(de)操作方式展現給(gei)所(suo)有人(ren)。
在AXIS資(zi)(zi)(zi)產交易智能掃描平臺,我們專(zhuan)注(zhu)于(yu)通過獨(du)立第三方(fang)征信(xin)和信(xin)用評估,讓消費金融ABS資(zi)(zi)(zi)產包的底(di)層資(zi)(zi)(zi)產以更為透明的方(fang)式(shi)展示給投(tou)資(zi)(zi)(zi)人(ren)(ren)。我們利用基于(yu)個人(ren)(ren)信(xin)用評分(fen)和轉移矩(ju)陣(zhen)的創(chuang)新理(li)論,進(jin)行現金流預測分(fen)析;利用機器學習(xi)和統計分(fen)析相結合,進(jin)行資(zi)(zi)(zi)產篩選、資(zi)(zi)(zi)產重構、資(zi)(zi)(zi)產跟(gen)蹤和對比。
從萬象風云到AXIS,我們旨在打通從貸(dai)前、貸(dai)中、貸(dai)后的個體信用評估,到信貸(dai)資產(chan)入池、資產(chan)篩選、資產(chan)配置、資產(chan)跟蹤的資產(chan)信用評估的全(quan)鏈條,以“征信”促(cu)“增信”。