大資料風控用了什麼模型?有效性如何?

時間 2021-05-10 03:34:11

1樓:javeme

大資料風控,基於資料表層的資訊難於解放人工,往往是事後才發現風險,將其加黑名單、加策略後,其又通過換賬號換裝置換個外衣躲避,救火式的風控非常被動、低效、低質。基於資料深層次的特徵分析才是風控的出路,欺詐的特徵找到了,外衣再怎麼變換也能自動識別出來。而圖資料庫技術是大資料關係分析的利器,基於圖譜的深層關聯關係進行挖掘、推導、聚類等(比如找號、裝置、IP、WIFI、聯絡歷史、轉賬記錄等形成的關聯圖譜),從而深度分析得出風控實體的特徵。

2樓:

我看大家大都是說信貸類,我來簡單說下非信貸類的,拋磚引玉。相比於信貸類來說,非信貸類場景複雜且多(薅羊毛,虛假點評,眾包作弊等等),label不好標。在信貸類中,至少在事後根據還款行為可以打上標籤,而在非信貸類中可能一條事件永遠也打不上可靠的標籤。

在之前我們團隊主要用的是xgboost,LR,RF等模型,也有想過委員會投票法,當然最終結果還要等時間來檢驗。其中xgboost的優點很明顯,效果好,訓練速度快。當然也不是所有資料都可以直接丟xgboost(不然的話還要我們幹嘛),之前我就碰到過一次,特徵工程沒做好,導致xgboost認為重要的指標之間有很高的相關性,這樣看上去模型效果很好,實際上是沒用的。

現在我主要的研究方向是半監督學習,這也是因為可靠的label不好找。因此考慮到是否可以用半監督演算法。

最後,第一位是資料,第二位是特徵,模型再次之。

3樓:時光修煉者

樓上有很說了很多技術方面的,這些技術的運用挖掘了使用者的還款能力、還款意願。

但還有乙個核心問題,不是用了什麼模型,而且是風控的有效性如何評價?

風控的有效性,一定是定價、准入、壞賬達到均衡。

不是簡單說好壞的二元法則,那基本上就是傳統風控,傳統風控就是一些准入條件,條件一旦達不到就拒,這跟網際網路大資料的原則是相違背的,網際網路大資料風控要實現的是「千人千面」。

4樓:張大萬

目前國內90%以上的建模團隊都使用Logistic回歸做評分卡,當然還有少數人使用決策樹,神經網路和機器學習目前還沒在此行業有顯著成果。

Logistic製作評分卡模型的衡量標準是K-S值的大小,依據資料質量和建模能力在0-0.5之間,一般在0.3以上才可用,好的模型可以達到0.35。

芝麻分模型的K-S值在0.32左右。

以上是針對主問題給的答覆,附加問題太多太散,涉及面太廣,建議題主先熟悉下這個行業以上!

5樓:Magic

首先,貌似美國基本上都用三大徵信局的資訊,最傳統的評分基本上都是用FICO來做的。同時,各家平台也會嘗試著用機器學習、神經網路等大資料處理方法,但探索的居多,有結果的少。

其次,現在國內網際網路金融基本的業務規則並沒有太大變化,大資料整體應用也只是剛剛開始(不是做一兩個分析案例那種),所以fico評分的框架思路會持續沿用,嘗試加入新的變數看看模型效果。

最後,還是看好大資料的發展,看好區塊鏈技術的發展,期待技術逆襲。

6樓:王樂石

感覺大資料對風控沒有明顯的作用。 針對消費者的小貸業務也是根據存款額,消費額來定,同樣是萬分之五的利率。邏輯和銀行是一樣一樣的。

而且借貸到期後強制扣款,這點比不上銀行。 不看好。總體上,國內對大資料抱有過高的不切實際的期待。

實際上消費者的消費決策並不能依靠過去的資料來進行判斷。 it做流程規範的空間,做娛樂的空間也是有限的。在信用社會,總會有乙隻或者無數隻豬在天上飛,問題是它們掉下來時別砸到自己。

傳統風控手段(經驗)會被大資料風控替代嗎?還是大資料只能用來輔助?

micos 傳統手段和大資料也是風控的手段,在不同的發展階段發揮著不同的作用。在以前技術手段不發達的情況下,且貸款數量也不多的情況下,通過傳統手段可以解決風控問題,而隨著技術的發展,貸款數量的急劇上公升,傳統的手段已不能滿足需求,通過機器方式 人工智慧 大資料方式則更體現出價值。金融風控由原來的規則...

大資料風控平台哪些好,有金融同行推薦下嗎,同盾或者聚信立?

真要說大資料風控,說那些虛的沒用,一看資金注入,二看資料多少,三看風控模型。資金的話比如百融金服強勢融資C輪10個億,大佬投錢公司發展就是快啊還能做金融實驗室。資料多少直接決定你大資料的採集和判斷是不是精準,最後乙個模型的建立外行你可以看看團隊,公司的團隊強人才多,那肯定沒得跑,就這個了。風控嘛,很...

大資料分析中,有哪些常見的大資料分析模型?

牛博 模型其實就是一數學函式對映,從應用層角度來看,會有一些通俗的名字,簡單羅列一下 一 使用者模型 二 事件模型 三 漏斗模型 四 熱圖分析模型 五 自定義留存分析模型 六 粘性分析 七 全行為路徑分析 八 使用者分群模型 九 Session 分析 十 間隔分析 十一 分布分析 十二 營銷廣告投放...