隨機森林MATLAB程式中出現的兩張圖，請大神幫忙分析下

1樓：SimpleJian

第一張圖看起來像是分析特徵重要性，隨機森林可以通過看shuffle某一維特徵後對模型效能的影響來評估特徵重要性。所以第一張圖應該是隨機shuffle某個特徵後，分別畫出了mean accuracy decrease和mean gini index decrease。從圖中可以大概看出哪些特徵比較重要，而且兩種不同指標下得出的特徵重要性基本是一致的。

第二張圖是樹的棵樹對OOB error(out of bag error)的影響，從圖中可以看出350棵樹後OOB基本穩定，根據此圖可以選擇隨機森林樹的棵樹。

2樓：

如果對matlab熟悉，對隨機森林熟悉才能看懂你的問題。但是描述清楚之後，不懂matlab的人也會看懂你的問題，這樣能夠回答的人就比較多。

我比較熟悉python，不太清楚你的具體問題。猜測是這樣的，第一張圖顯示的是不同feature對結果的影響。你的輸入一共是20個feature，可以看出某些feature對結果影響會大一些。

可以具體看看feature是什麼。

用模型的時候，做出結果是最初的步驟，後面需要對模型進行理解和優化。所以對引數的含義必須深刻的理解。你可以回憶下隨機森林的模型，考慮下ntree，mtry兩個引數對模型的影響。

可能就會知道為什麼要畫這些圖了。

在MATLAB中出現函式或變數t無法識別，怎麼回事？

M31415926 data struct beta 0.0484 gama 49 F 102.40234 alfa1 7 alfa2 8 mu1 2.39 mu2 2.85 b 03 c 1,dz 5 y0 0 102.402340 t,disv ode45 flstatic28f,1 26 y0...

隨機森林Random Forests的各個引數對模型的影響？

楊一帥嘗試用手寫資料集研究了一下整合規模，樹的最大深度以及特徵數對隨機森林分類結果的影響。手寫資料集使用交叉驗證，返回accuracy，折數為10 整合規模即樹的數量。為了觀察其影響，分別對數量1 40進行交叉驗證，返回得到準確率並繪圖。樹的數量和準確度的關係圖觀察可得，整合規模的增加可以提高...

用通俗易懂的語言解釋隨機森林？

撫琴塵世客隨機森林 Random Forest，簡稱 RF 是 Bagging的乙個擴充套件變體。在以決策樹為基學習器構建 Bagging 整合的基礎上，進一步在決策樹的訓練過程中引入了隨機屬性選擇。泰克尼客在原始樣本的基礎上，利用bootstrap方法有放回地抽取樣本隨機抽取n個subs...

隨機森林MATLAB程式中出現的兩張圖，請大神幫忙分析下

在MATLAB中出現函式或變數t無法識別，怎麼回事？

隨機森林Random Forests的各個引數對模型的影響？

用通俗易懂的語言解釋 隨機森林 ？

其他用戶還看了：

用通俗易懂的語言解釋隨機森林？