標準差的計算為什麼不直接取距離絕對值的平均數？

1樓：褚陽光

我去翻了一下老外的答案，有個見解我比較認可。

Why square the difference instead of taking the absolute value in standard deviation?

可以模擬笛卡爾座標系中的距離，因為標準差可以看作是這組資料到平均值的「距離」。

正如(a,b,c)離(u,u,u)的距離一樣,其中u是平均值。sqrt((a-u)^2+(b-u)^2+(c-u)^2)。

而標準差中的除以樣本總數再開方可以讓結果表徵每個資料相對於平均值的距離，而不是總體樣本相對於平均值的距離。

2樓：謝方正

其實是可以的，這種取絕對值的做法是出自Eddington2023年的一篇文章，雖然在相合性（英文是consistency，不知道怎麼翻譯）上不如平方求和開根號，但是如果用魯棒性來衡量的話這種估計量是可以使用的，它的asymptotic relative efficiency在資料有汙染或者有outlier的時候是優於平方求和開根號的估計量的。結論出自Huber的Robust statistics1.1節（手機碼字不容易啊）

3樓：

其實有好有壞，好處比如對線性模型求最有引數，直接最小二乘法就搞定了，如果換成絕對值那就麻煩多了，再乙個絕對值是二維距離，對於高維度的歐幾里得空間，距離是需要先平方再求和的，而且平方後，可以有效使outlier極化

4樓：

除了放大距離遠的點之外，還有很重要的一點是理論分析比較方便。

x^2是光滑函式，而絕對值函式不可微。

平均值一定是使得最小的那一點。

但使得絕對值最小的可能是乙個區間。

5樓：

個人以為樓上的回答說明了一部分。的確取平方後開方（2-範數）的方式更強調距離平均值更遠的點。不過應該還有另外乙個原因，那就是由2-範數匯出的空間是Hilbert空間(希爾伯特空間).

在這個空間中我們有著相較於其它範數更好的性質，比如可以使用最小二乘法等等。如果我沒記錯的話，這個在時間序列分析等方面有用的。【非專業，我只是了解一些（笑）】

6樓：

因為它更強調那些偏離平均值更遠的點。從實際意義上它更好用。

比如說A: 4 4 6 8 8

B: 2 6 6 6 10

統計學上認為A組比B組更「穩定」，用你的做法是同樣穩定。

標準差的計算為什麼不直接取距離絕對值的平均數？

有沒有懂統計的，標準誤為什麼等於標準差除以根號n，求公式推導過程？

為什麼對於不同的正態分佈，標準差具有相同意義？

AQI（空氣質素指數）為什麼有中美兩種標準？差距大嗎？

其他用戶還看了：