隨機森林MATLAB程式中出現的兩張圖,請大神幫忙分析下

時間 2021-06-08 09:42:11

1樓:SimpleJian

第一張圖看起來像是分析特徵重要性,隨機森林可以通過看shuffle某一維特徵後對模型效能的影響來評估特徵重要性。所以第一張圖應該是隨機shuffle某個特徵後,分別畫出了mean accuracy decrease和mean gini index decrease。從圖中可以大概看出哪些特徵比較重要,而且兩種不同指標下得出的特徵重要性基本是一致的。

第二張圖是樹的棵樹對OOB error(out of bag error)的影響,從圖中可以看出350棵樹後OOB基本穩定,根據此圖可以選擇隨機森林樹的棵樹。

2樓:

如果對matlab熟悉,對隨機森林熟悉才能看懂你的問題。但是描述清楚之後,不懂matlab的人也會看懂你的問題,這樣能夠回答的人就比較多。

我比較熟悉python,不太清楚你的具體問題。猜測是這樣的,第一張圖顯示的是不同feature對結果的影響。你的輸入一共是20個feature,可以看出某些feature對結果影響會大一些。

可以具體看看feature是什麼。

用模型的時候,做出結果是最初的步驟,後面需要對模型進行理解和優化。所以對引數的含義必須深刻的理解。你可以回憶下隨機森林的模型,考慮下ntree,mtry兩個引數對模型的影響。

可能就會知道為什麼要畫這些圖了。

在MATLAB中出現函式或變數t無法識別,怎麼回事?

M31415926 data struct beta 0.0484 gama 49 F 102.40234 alfa1 7 alfa2 8 mu1 2.39 mu2 2.85 b 03 c 1,dz 5 y0 0 102.402340 t,disv ode45 flstatic28f,1 26 y0...

隨機森林Random Forests的各個引數對模型的影響?

楊一帥 嘗試用手寫資料集研究了一下整合規模,樹的最大深度以及特徵數對隨機森林分類結果的影響。手寫資料集 使用交叉驗證,返回accuracy,折數為10 整合規模即樹的數量。為了觀察其影響,分別對數量1 40進行交叉驗證,返回得到準確率並繪圖。樹的數量和準確度的關係圖 觀察可得,整合規模的增加可以提高...

用通俗易懂的語言解釋 隨機森林 ?

撫琴塵世客 隨機森林 Random Forest,簡稱 RF 是 Bagging的乙個擴充套件變體。在以決策樹為基學習器構建 Bagging 整合的基礎上,進一步在決策樹的訓練過程中引入了隨機屬性選擇。 泰克尼客 在原始樣本的基礎上,利用bootstrap方法 有放回地抽取樣本 隨機抽取n個subs...