欠擬合時高偏差 high bias 好理解,但為啥會是低方差 low variance

時間 2021-06-09 16:30:20

1樓:毛仁傑

首先,過擬合/高方差和欠擬合/高偏差這種詞,都是相對的、統計平均的。

(比方說,以一組「最優」超引數為參照,同時把幾個超引數調差的話,更高的方差和更高的偏差顯然是可以同時存在的。)

以上其實和你的問題無關

過擬合(高方差),在實踐中,就是你的模型在訓練集和測試集(或者驗證集)裡的效能表現差別大;

欠擬合(高偏差),就是你的模型在訓練集中就很水。

訓練初期,考慮不訓練的極限情形好了。模型的所有引數都是初始值。顯然訓練集的表現很差,完全聽天由命,高偏差。而測試集裡的效能,和訓練集是一樣的,所以低方差。

2. 模型複雜度不足。這時你稍微增加模型複雜度的話,明顯在訓練集的效能會更好,偏差一路降低。

同時測試集的效能也會增加,但不會有訓練集公升得快,所以差距被拉大,方差變大,也就是說開始的方差相對小。(要注意模型複雜度的增加超過一定限度就過擬合了

2樓:TuringYang

我覺得對著過擬合可能要容易理解一點,過擬合模型一般都很複雜,所以波動就會很大,而欠擬合就是你想一種極端情況,它就擬合成了一條直線,你說方差是不是0

如何判斷自己的網路是欠擬合還是過擬合?

Chuang 首先題主你要保證你的資料集是沒有問題的,對於訓練集和測試集的劃分也是合理的。一般來說,對於網路擬合程度的判斷主要還是使用檢視訓練集誤差和驗證集誤差的方法。欠擬合乙個網路是欠擬合的,那必然在開發集和驗證集上的誤差是很大的。假定訓練集誤差是20 驗證集誤差是 22 在這裡對於訓練集而言,誤...