xgboost中的min child weight是什麼意思

1樓：boom

我說一下自己的理解。參考https://

stats.stackexchange.com

1、對於回歸問題，假設損失函式是均方誤差函式，每個樣本的二階導數是乙個常數，這個時候 min_child_weight就是這個葉子結點中樣本的數目。如果這個值設定的太小，那麼會出現單個樣本成乙個葉子結點的情況，這很容易過擬合。

2、對於分類問題，假設為二分類問題，損失函式為交叉熵，則每個樣本的二階導數可以寫成幾個因子相乘的形式，其中一項為sigmoid(y_hat)*(1-sigmoid(y_hat))。對分類問題，我們考慮葉子結點的純度。假設某個葉子節點只包含一類，y = 1,那個這個節點有很大的可能是:

該節點包含的yhat非常正，也就是我們給這個節點打分非常正，這個時候sigmoid(y_hat)非常接近1，上面的式子接近0；反之，假設某個葉子節點只包含y=0，情況也是類似的。從分析中可知，如果某個葉子結點的二階導之和越小，或者越接近0，這個節點就越純，這種情況下容易過擬合。

以上是自己的理解，如有漏洞，希望大家指正，共同學習。我驗算過一次樣本二階導公式，後面會貼上來。

2樓：張澤榮

官網api給出的定義：Python API Reference其中：instance是葉子節點，weight(hessian)是不帶正則項的損失函式的二階導，也就是這個：

那麼sum of instance weight(hessian)也就是對應這個：

直觀理解，一般來說，我們定義的不帶正則項的損失函式是這個：

的話，那麼hi=1，Hj即葉子節點上的樣本數，min_child_weight就是葉子上的最小樣本數啦