大數據應用:從認知、實踐到價值創造
來源:用戶上傳
作者:
【摘要】隨著數字智能時代的快速到來,大數據在各行各業中開始扮演越來越重要的角色。金融業作為典型的數據驅動型行業,大數據應用在該行業的未來發展前景與價值創造的潛力十分巨大。本文從全新的數字智能時代出發,分析了大數據及大數據應用的關鍵因素,并結合金融業的具體實踐,詳細闡述了大數據應用的價值創造過程以及未來發展趨勢與業務潛力。
【關鍵詞】大數據;大數據應用;金融科技;客戶畫像;數字風控
一、全新的數字智能時代
自2018年下半年以來,幾乎在一夜之間,我們所處的創新創業環境就已經發生了翻天覆地的變化,互聯網時代進入下半場逐步成為當前最時髦的一個詞匯。大數據應用行業也迎來全新的數字智能( DigitalIntelligence)時代,一切事物皆可數字化,進而推動決策與行動的全面智能化。在這個全新的數字智能時代,基于大數據的創新正在成為一個新的經濟增長點,不斷釋放新的商業潛力、培育新的業務形態、增加新的就業機會、刺激國家經濟發展。與此同時,隨著大數據變得越來越重要,越來越多的企業希望從大數據中挖掘價值,并將大數據應用作為獲得差異化競爭優勢的一大重要來源。一些企業通過以數據為驅動的創新業務模式,在很短的時間內完成了傳統企業需要十幾年甚至幾十年才能積累的智慧或業務規模。未來十年將是一個“大數據引領的數字智能時代”,并且“數字智能時代有望開啟下一次工業革命”。
二、大數據與大數據應用的價值
數字智能時代的數據,與以前經常提到的數據相比,有以下幾個不同的特點:第一,數據量龐大。據資料顯示,目前每天全球互聯網產生的數據累計達1EB(即10億GB或1000PB),相當于660億部金庸全集(一部金庸全集大約860萬字),可刻滿1.88億張DVD光盤。第二,數據種類多,包括文本、圖片、影像、音頻、視頻等。第三,數據的價值密度較低?,F在每天互聯網產生的數據中,結構化數據、半結構化數據和非結構化數據的占比分別為5%、80%、15%,也就是說大約只有5%的結構化數據是可以直接用于分析的,其余超過95%的數據在用于分析前還要做大量的清洗與整理工作。第四,數據的實時性要求高,也就是業界經常提到的“1秒定律”,要求能夠實時計算分析數據并提供最佳解決方案。
從以上分析也就不難理解,現在大家常說的大數據并非僅是絕對意義上的“大”,它更強調數據的“全”,也就是“全量數據”的概念,每個數據的價值變得更加平等。從宏觀層面看,全量數據不再是傳統統計方法的抽樣數據,不再采用“以點帶面”的分析過程,進而避免依據抽樣數據分析導致的錯誤決策。就微觀個體而言,則進一步強調個體數據的完整性。比如金融行業在為每個客戶做授信審批時,也均是基于全量數據的理念,盡可能取得該客戶的整體信息,除了分析客戶在商業銀行本身的基本信息與交易行為信息外,還盡可能從外部合作機構獲取客戶的代發薪、社保、公積金等信息,甚至還從互聯網公共渠道爬取與客戶信用相關的負面信息。
這些數據蘊含著無限的價值與商機,并已經成為眾多行業和業務領域的重要生產因素,其中最為關鍵的是要找到數據分析或數據價值發現創造的方式與方法。一般來講,數據從產生到發揮價值需要經過三個階段,一是找到真實的數據來源,二是加工處理這些數據,三是對這些經過加工處理的數據予以進一步分析鑒別并作出價值判斷。
例如,2018年某金融機構手機銀行APP的平均月活躍用戶數突破4000萬的數據,這個數據是否有用?我們可以從這個數據知道該金融機構手機銀行APP的月活躍用戶數,但這個數據沒有經過加工處理,我們無法從中作出價值判斷。因此我們需要對該數據進行加工處理,進一步得出以下信息,如同比增長75%、環比增長15%、占簽約客戶數的比重為30%、占基礎客戶數的比重為10%、在主要同業中排名第二位等。數據經過加工處理后,維度更加全面、信息也更加豐富。但如果希望利用這些信息來指導后續業務的開展,我們還需要進一步對這些信息進行甄別分析,比如分析客戶結構、產品結構,得出用戶不活躍的主要原因以及活躍用戶經常交易的主要產品種類等,進而形成指導后續業務發展的策略與措施。這個數據分析的過程其實就是數據價值的發現創造過程,除了盡可能追求數據的全面以外,還需要數據采集、分析的工具、系統與平臺等。
在具體實踐中,企業普遍面臨以下困難與挑戰:一是現有數據不聯通,客戶在企業內部的數據分散在不同的應用系統,長期存在的系統豎井導致出現數據孤島,客戶在企業內部的數據相互隔離。二是由于客戶數據的相互隔離,并受限于可獲得數據的豐富度不夠,難以通過數字化手段給客戶做全方位的畫像,從而無法有效識別客戶并預測客戶需求。三是無法實時獲取客戶信息,尤其是客戶信用與產品交易層面的信息,無法及時判斷客戶的信用狀況并對交易環節中可能存在的風險進行實時處理。以金融機構的信用卡申請為例,目前客戶從申請到最終得到核準的周期普遍較長,而且即使通過了最終核準,所核準的信用額度也經常不能反映客戶的真實狀況,影響客戶體驗。此外,數據的產品化不夠、交互能力不強,也在很大程度上直接制約了數據價值的發揮。
為有效應對并解決上述困難與挑戰,目前很多企業紛紛啟動大數據應用工程,并通過大數據應用的逐步深化,打通內外部數據壁壘,在實現數據融合的基礎上,進一步推動數據與規則、數據與模型、數據與算法、數據與場景、數據與商業模式的融合,進而利用大數據應用來識別客戶、識別風險,推動業務創新、優化運營流程、提升客戶體驗,預警客戶流失等??梢哉f,目前大數據應用正扮演著越來越重要的角色并發揮越來越大的價值。
三、大數據應用的“軟實力”與“硬支撐”
投資建設大數據基礎設施容易,但要發揮大數據應用價值則較難,這不僅需要硬支撐,更需要軟實力。從業界實踐來看,如要切實做好大數據應用,需要具備兩個方面的基礎或條件,一是要有大數據思維,二是要有大數據平臺,兩者缺一不可。 大數據思維是切實做好大數據應用的“軟實力”。這要求企業盡快形成“依托數據說話、依托數據決策”的習慣,并在“用數據說話”的大數據應用過程中逐步建立“多、快、好、省”的數字化觀念,包括量化思維、重視全量數據的關聯性分析、樂于接受紛繁復雜的局面等,從而實現對數據、用戶以及關聯關系的理解與應用?!岸唷笔且谢谌繑祿_展數據分析的思維,不再局限于隨機樣本數據;“快”是要有基于實時數據開展數據分析的思維,不能停留在前臺接受客戶申請、中后臺批量審批業務的傳統做法,而是要適應客戶期望實時推薦定制產品,實時監控潛在風險;“好”是指在做數據分析時,不要局限于僅從因果關系中尋求價值,同時更要在大量數據之間的相關性分析的基礎上做出預測;“省”是要接受不精準的數據,并通過一定手段清洗、整理并做分析利用,因為隨著數據量的增加,數據格式存在不一致,數據錯失率也在不斷增加,這就更需要我們有“去偽存真”的能力。
大數據平臺是落實大數據應用的“硬支撐”。建設大數據平臺,首先要抓住大數據應用的精髓,即堅持“問題導向”與“價值驅動”,利用數據解決業務問題并帶來實質效益。其次是不要落入兩個誤區,一是技術誤區:即把大數據應用當作一項純粹的IT基礎設施來建設,大數據應用平臺的建設必須由需求引領;二是認識誤區:即不尊重行業特性,將大數據應用當作“萬能鑰匙”,面對所有問題都言必稱“大數據”,更不能“只顧炫耀手中的好鋤頭,而荒了本應該耕種的莊稼地”。
大數據平臺建設同樣需要好的頂層設計與循序漸進的實施策略,需要業務、信息、應用和技術等多方面的協同。在業務方面,重點關注大數據應用支撐的業務流程和端到端的業務場景,定義在總體企業戰略指導下希望實現的業務能力及其關系,幫助企業業務發展,實現高效率運營。在應用方面,重點實現支撐業務流程及場景需要的應用組件和分析模塊,基于業務架構和業界最佳實踐來建立大數據平臺。在信息方面,主要構建支撐應用組件的數據模型和分析模型(包括基于人工智能的模型與基于規則的模型等),從跨組織、跨業務的視角對數據與信息進行組織與管理,構建客戶的統一360度畫像、相應的規則引擎庫(包括推薦規則引擎庫、營銷線索引擎庫、授信規則引擎庫等)以及可視化分析建模工具(如數據沙箱)等,為預測客戶需求、提升風險控制水平、向客戶提供量身貼合的產品與服務奠定更好的分析數據基礎。在技術方面,重點采取Hadoop、分布式、流計算等先進信息科學技術建設符合應用架構和信息架構的大數據一體化技術支撐平臺,基于面向服務的架構思路,實現信息、應用、流程的橫向貫通,實現對企業各類數據的可視化展現,從而有效支撐智能決策。
四、金融大數據應用實踐與未來展望
金融是大數據的重要產生者,金融業不僅是信息科技密集型行業,也是典型的數據驅動型行業。對金融服務機構而言,大數據不僅是一種創新工具、更是一種不可比擬的戰略資源,構建并實施金融大數據應用的主要目標是為了實現大數據應用與金融服務的完美快速融合,從大數據中找客戶、從大數據中控風險、從大數據中要效率??梢哉f,“數據是金融服務的邊界”,擁有的數據有多全,金融服務就可以覆蓋多廣。事實上,目前國內外已有不少金融機構正在積極推動大數據平臺建設與大數據應用創新,并在洞察客戶行為、變革營銷模式、創新數字風控、實時偵測風險等業務場景方面取得了顯著的實際成效。
洞察客戶行為:主要通過對數據資產的有效分析與應用,在深刻理解客戶各項內外部數據(包括基本屬性數據、交易數據、行為數據等)的基礎上建立客戶標簽服務體系并抽象出客戶360度統一畫像(可根據不同數據維度對客戶進行不同層面的畫像,如客戶的全面資產畫像、全面投資畫像、全面現金流畫像、全面風險偏好畫像、情感情緒畫像等),還原并表征客戶行為特征,使金融機構能夠更好地識別自己的客戶( KnowYour Customer,簡稱KYC)。這是一個“化抽象為具體”的數字化過程,是金融大數據應用的核心。建立客戶360度統一畫像是一個持續的過程,一方面需要充分利用大數據的技術與思維建立客戶標簽服務體系,另一方面也要根據不同的維度(包括渠道、來源、結構、內外部等)對客戶標簽服務體系進行分類動態管理。
變革營銷模式:在原有營銷體系下,由于無法及時精確掌握每個客戶的需求偏好,只能統計到“面”,營銷方式多采取以產品為中心的“廣而告之”,為客戶提供各類產品的說明信息,由客戶根據自己的需求進行選擇,這種被動的營銷方式提供的產品和服務千篇一律,效果和效率都不盡如人意?;诖髷祿嫿蛻?60度統一畫像后,可以精確到“點”,分析粒度將從客戶群體精細化到每一個客戶個體,使金融機構可以實時分析每一位客戶當前的需求,準確及時地把握客戶的行為偏好,從而使金融機構改變原有粗放、被動的營銷方式。在結合決策樹、貝葉斯算法等規則模型后,可進一步構建以數據為驅動、以模型為核心的“千人千面”精準營銷模式,及時組織相匹配的產品與個性化服務來響應客戶的需求。另外,這種新的營銷模式還可引入客戶交易信息反饋的量化分析與評價機制,真正達到“想客戶之所想,薦客戶之所需”的營銷效果,進一步降低服務成本并不斷提升客戶的轉換率、用戶的留存率以及交叉滲透率,實現傳統營銷模式革命性的變革。
創新數字風控:核心是充分利用大數據技術,通過與合作機構平臺對接和數據共享等方式獲取并分析處理客戶業務項下的交易、資金、物流等數據,降低信息的不對稱性與不透明性,根據客戶360度統一畫像建立基于數字信用的信用評級模型,改變前期金融機構僅按照“三位一體”審批流程以及利用單一客戶財務經營信息、抵質押擔保信息等的傳統授信審批模式,實現面向業務場景、面向交易過程的授信。例如,結合小微企業等長尾客戶“額度小、期限短、需求頻繁、辦理要求快”的貸款需求,金融機構可在貸前、貸中和貸后等全流程豐富風險管理措施,包括基于自然語義分析( NaturalLanguage Processing)的客戶動態關聯圖譜等,推出高效便捷的“自動化、直通式”融資服務模式,提高融資效率,降低融資成本,服務實體經濟。 實時偵測風險:主要通過大數據應用技術整合內外部收集的各種數據,盡可能消除申請及交易等環節的信息不對稱問題,并與客戶行為建立關聯,從而更全面地了解客戶、評估客戶、發現可疑活動,不斷通過金融大數據應用提升實時反欺詐的識別、評估、控制、緩釋、監測和報告等關鍵能力。一方面,基于金融大數據應用創新建立豐富的反欺詐模型、規則以及反欺詐知識庫(包括行業內外的欺詐信息、欺詐形式、影響范圍和人群以及應急手段等),從多個維度(包括賬戶、設備、位置、行為、關系、偏好等)實時監測客戶每筆交易行為并做出預警。另一方面,通過強大的數據分析處理能力,可以在20-30毫秒內實時識別每筆交易活動的潛在風險(目前比較常用的反欺詐分析識別手段主要包括規則判斷、行為特征分析、模型智能識別、關聯分析等),并根據風險識別的不同結果采取差異化的智能處置措施,包括“直接放行、攔截操作、增強驗證、暫掛交易、賬戶凍結”等,實現實時高效、客戶無感的反欺詐服務,切實保障用戶資金和賬戶安全,實現風險防控和客戶體驗“雙提升”。
除此之外,金融大數據還可以進一步應用到促進業務創新、優化運營流程、提升客戶體驗等多個方面,尤其是在進一步與人工智能技術結合起來后,前景非常廣闊。為了確保金融大數據應用在全新的數字智能時代發揮更大作用,后續可能需要重點關注以下幾方面內容。
首先,不斷強化數據治理模式,尤其是要在個人數據保護和數據融合創新之間實現平衡。在持續豐富數據來源的過程中要重點關注獲取數據的合規性與使用數據的合法性,避免出現數據泄露與侵犯客戶隱私等問題。尤其是在個人數據隱私保護方面,要切實滿足相關監管要求及規定,如歐盟執委會正式發布的《一般數據保護條例》(簡稱“GDPR”)以及中國正式發布的《征信業管理條例》等,在采集、使用等環節不斷加強規范化管理,建立數據標準并不斷提升數據質量,這也是有效開展大數據應用的基石與底線。
其次,加快推進數據的產品化與智能化,實現大數據應用與人工智能的有機融合,充分利用智能算法、機器學習、可視化知識譜圖等工具建立更加完備的金融大數據應用體系,不斷提升數據的挖掘分析能力以及可交互能力,創新基于數據驅動的全新產品與服務模式,使數據進一步成為業務前臺的生產力,提升金融服務的覆蓋率與智能化服務水平,如智能投顧、智能客服、智能風控、智能反洗錢等。
再次,革新企業文化,加大人才培養,避免出現“端著金飯碗要飯吃”的情況。金融機構一方面要加快建立內生培養機制,另一方面也要強化與外部專業服務機構的深度合作,讓金融大數據應用真正嵌入各個業務過程和交易環節,逐步形成人機協作分析與以數據驅動業務發展的工作模式。
當然,金融大數據應用是一個綜合、漸進、復雜的系統演進過程,其內涵與外延將在不斷應用與發展的過程中得到豐富,隨著數據產品化、智能化水平的不斷提升以及交互建模能力與數據治理能力的不斷提高,金融大數據將得到更為廣泛的應用并逐漸成為金融機構贏得市場競爭優勢的關鍵因素。
參考文獻:
[1]大衛·麥克坎德萊斯.信息之美[M].電子工業出版社,2012.
[2]涂子沛.大數據:正在到來的數據革命[M].廣西師范大學出版社,2012.
[3]凱文·凱利.失控:全人類的最終命運與結局[M].新星出版社,2013.
[4]曹漢平.互聯網金融的新常態[M].清華大學出版社,2016
[5]雷·庫茲韋爾,人工智能的未來:揭示人類思維的奧秘[M].浙江人民出版社.2016.
轉載注明來源:http://www.hailuomaifang.com/1/view-14850110.htm