金融騙子的末路,關系圖譜讓他們無處藏身新金融
金融機構每年都會因欺詐活動遭受大量的資金損失。傳統的欺詐方式包括偽造身份騙貸、車險騙保等。隨著互聯網金融的發展,層出不窮的營銷活動和品類繁多的網貸產品讓欺詐分子有了更多可乘之機,他們的欺詐成本似乎也更低了,足不出戶就可以日進斗金。
為了限制欺詐活動,金融機構和互聯網公司都會構建自己的反欺詐團隊和防范系統,通過種種規則和預測模型將欺詐分子拒之門外。
然而,道高一尺,魔高一丈,再嚴密的規則也難免會有漏洞,加之欺詐手段日新月異和團體欺詐盛行,采用傳統的反欺詐工具總是略顯被動。
因此,關系圖譜就有了用武之地。關系圖譜之于反欺詐,就如同飛機之于軍隊,可以從更高的維度去偵測和打擊對手,實現升維打擊。
什么是關系圖譜?
關系圖譜是描述個體及個體之間關系的圖。下圖給出了一個移動支付場景的關系圖譜示例,個體類型可以包括IP地址、設備、支付賬戶、賬戶聯系人等,個體之間也可以存在不同的關系,比如IP登錄行為、設備登錄行為、聯系人登記行為等。
關系圖譜如何實現“升維打擊”?
主要有四種手段,具體如下:
(1)全維度的事中偵測。在欺詐檢測系統中,諸如登錄時間和位置(例如IP地址)之類的行為線索很容易被欺詐分子改變或偽造,但是欺詐分子很難全面地了解他們所在的整個關系網絡(例如轉賬、購物、登錄、瀏覽、還款)。因此,即便欺詐分子盡可能地掩蓋了痕跡,也難免會在關系網絡上露出馬腳。比如上圖中的共用設備、共用聯系人信息、共用IP等就可以作為可疑特征用于識別欺詐事件。
(2)全局的可視化事后分析。一方面,反欺詐部門分析人員可以根據已定性案件在關系圖譜上呈現出來的全局特征,優化風控規則和模型。例如,一個可疑賬號可能會登錄多個設備,而這些設備往往會被登錄多個可疑賬號。關系圖譜可以非常直觀地呈現這種間接的多對多關系。另一方面,也可以挖掘看似獨立卻存在間接聯系的案件之間的關系,識別核心作案人員和其他疑似欺詐分子。
(3)全渠道的標簽傳播。關系圖譜也可以基于現有黑名單,為可疑個體打上相應標簽,用于反欺詐規則和風險提示。假設已確認一個黃牛常用手機號,可在關系圖譜中把這個手機號直接和間接關聯的賬戶、手機號、地址、銀行卡等個體打上“疑似黃牛”的標簽。這種路線便是標簽傳播(如下圖)。
(4)高效的信息檢索。傳統的數據存儲通常基于關系型數據庫,比如轉賬、登錄等各種關系分別存儲在不同的表中,想要抽取多級關系信息則需要連接多個表才能實現。
而關系圖譜一般存儲于圖數據庫中,常用的圖數據庫如neo4j、orientDB等。當關系深度較小時,比如深度為2(類似查詢朋友的朋友這種關系),關系型數據庫和圖數據庫的性能相當;當關系深度超過2時,關系型數據庫所需的查詢時間達到圖數據庫所需時間的上百倍甚至上千倍,這時圖數據庫的性能優勢就非常明顯了。
構建關系圖譜的關鍵點是什么?
數據,數據,還是數據。
目前構建關系圖譜的一個重大挑戰在于用戶的行為數據是割裂的,散布在政府機關、傳統金融機構、運營商和互聯網公司的數據中心,任何一方都很難獲取用戶端到端、全渠道的數據,缺失關鍵信息則會顯著影響偵測欺詐行為的效果。可以說,數據決定了關系圖譜作用的上限,而圖譜的本體設計和相關圖算法都要基于原始數據。
因此,各家公司都在積極外拓數據源,近些年各類數據服務公司如雨后春筍般涌現,也印證了市場需求。
另一方面,關系圖譜還需要充分利用已有數據,比如時間序列信息,構建動態關系圖譜(如下圖)來更有效地預測和識別欺詐風險。
隨著物聯網的技術發展和場景豐富,可以展望這樣一個未來:一個人的所有行為都將被數字化并映射到關系圖譜上……
【來源:鈦媒體】
1.砍柴網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;2.砍柴網的原創文章,請轉載時務必注明文章作者和"來源:砍柴網",不尊重原創的行為砍柴網或將追究責任;3.作者投稿可能會經砍柴網編輯修改或補充。