資料探勘模型優化中,Precision,Recall,F值這三個指標應該優先優化哪個?

時間 2021-05-11 15:10:33

1樓:霸天虎

和場景無關,意味從本質來分析。P和R都很高,是非常正常的,因為這與資料分布有關。此時,F值接近(1+1/a平方)/2,不是越大越好。

2樓:

如果 class balanced 的話,可以選擇優化F值

如果 class imbalance, 看 positive 的資料量, 如果資料量大的考慮用 precision. 如果資料量小的用Recall。 # 個人看法

3樓:熊辰炎

取決於你的具體問題。如果啥背景都不給的話,就是F值綜合考慮。

但是大部分網際網路公司裡和使用者相關的演算法時,更看重的是precision。

比如想要在Google的搜尋系統裡用的某個新演算法,recall可以是0.01%,但是考慮到總體的使用者數量,0.01%依然是很大的數字。

但是precision必須要足夠高,一般都要求95%以上。因為使用者對效果的提公升並不怎麼敏感,但是對bad case卻非常在意。可能你某個演算法更好的滿足了100個使用者,他們卻並不知情,但是傷害到了1個使用者,他可能就截屏發Facebook嘲笑你了。。。

也有的時候是只看recall的。。。比如黃反過濾和牆。。。 寧可錯殺一萬,不能放過乙個。不然就要被找去喝茶了。

4樓:

根據你的需求來,F值就是嘗試做precision和recall之間協調的乙個評價指標,一般看F值,只有當precision和recall都還不錯的時候,F值才會高。

資料探勘中,如何降維

唐申庚 我對資料探勘了解的也不多,單就對機器學習方面的認識來說,資料探勘任務中的降維主要針對的是降低特徵維度,而非降低樣本數量,不然就沒有意義了。為了降維,一般有兩種顯而易見的做法,一是特徵選擇,二是特徵嵌入。相對來說,特徵選擇在資料探勘任務中使用更加簡單普遍一些,相當於是一種下取樣。特徵選擇其實就...

sql挖掘模型檢視器資料處理失敗無法建立樹形圖怎麼解?

和風阿衰 此資料庫沒有有效所有者,因此無法安裝資料庫關係圖支援物件。若要繼續,請首先使用 資料庫屬性 對話方塊的 檔案 頁或ALTER AUTHORIZATION語句將資料庫所有者設定為有效登入名,然後再新增資料庫關係圖支援物件。按照第一種方式更改怎麼也不行,並且檔案的所有者也是sa。給出了一種方法...

機器學習 優化理論 統計分析 資料探勘 神經網路 人工智慧 模式識別之間的關係是什麼?

騫騫狗 一文告訴你 統計學 資料探勘與機器學習的區別 騫騫狗的文章 知乎 https zhuanlan p 61824761 感覺寫的很好,從根本上區分了統計學 資料探勘與機器學習的區別,適合對資料處理這門學問一點不了解的人看。相信你會有所收穫 Mellisacat 只有統計是理論科學 scienc...