怎麼量化乙個特徵在模型中的重要性?

時間 2021-06-02 22:29:59

1樓:EricG

我覺得可能有這麼幾個思路可以考慮:

如果是線性模型的化,可以看標準化以後的係數;線性回歸中,自變數的係數表示自變數變化乙個單位時,因變數變化的大小;係數越大,自變數對因變數的影響越大,也就越重要。但是必須是標準化以後的係數——比如你用作為質量的單位,和用千克作為質量的單位,回歸出來的係數差了1000倍,但是你不能說前者所代表的變數更重要

也可以看每乙個變數對的影響;比如,先剔除第1個變數,擬合乙個模型,得到乙個 值;然後再把第1個變數加入到模型中重新擬合,得到乙個新的 ;對所有的自變數都做一遍;看看哪個變數對 的影響最大——對 的影響越大,說明這個變數越重要

XGBoost或者LGBM模型中自帶的feature importance 功能

請各位大牛們再補充...

2樓:大資料小生

算出了具體權重的,權重就是重要性排序。

沒有算出具體權重的,可以把其他特徵都去掉,只留下乙個特徵去用LR做訓練、算訓練集的AUC。每個特徵都這樣做一次,比較auc的大小排序,就能知道該特徵的特徵重要性排序。

3樓:斐波那契

舉個例子,對於線性回歸

fit<-lm(y~x1+x2+x3)

使用R語言,檢視模型的詳細資訊

summary(fit)

檢視每乙個自變數(就是x1,x2,x3)產生的偏差佔總體偏差的比例,即單個自變數的R^2,值越大,說明對因變數y的影響越大。

至於模型解釋原始資料效果的好壞,用總的R^2來評價,越接近1,說明模型解釋性越好。

如何評判乙個量化模型是否可行?

老杜 中低頻率策略sharpe ratio達到7並且無大回撤,不客氣的說,通常是策略有問題,引用未來資料 幸運者偏差 過擬合,總有一款適合你。這樣的策略要是不能找到真實問題所在,我寧可愁白頭,也不敢拿來真用。 量化平台IAITrade 夏普比率可以同時對收益與風險加以綜合考慮的經典指標之一。夏普比率...

資產定價模型 CAPM 中的乙個悖論

DavidCharge 首先,人們在交易中可以賣空資產 與 均衡時每個人都不賣空資產 二者沒有悖論。其次,均衡時每個人都不賣空市場組合 是有前提條件的 無風險資產的return小於global minimum variance portfolio。當這個條件滿足時,可以證明存在唯一的tangent ...

linux C怎麼獲取程序生存的乙個特徵

果凍蝦仁 date s r proc pid cmdline 變數pid儲存你監控程序的pid。上述命令獲取到的是你程序建立的時間戳 單位 秒 當然你也可以監控proc目錄下的其他檔案,但是要注意有些檔案的時間戳有可能在執行期間發生變化的。另外如果你覺得秒的粒度太粗。你可以自行修改date命令的fo...