標準差的計算為什麼不直接取距離絕對值的平均數?

時間 2021-05-11 21:15:48

1樓:褚陽光

我去翻了一下老外的答案,有個見解我比較認可。

Why square the difference instead of taking the absolute value in standard deviation?

可以模擬笛卡爾座標系中的距離,因為標準差可以看作是這組資料到平均值的「距離」。

正如(a,b,c)離(u,u,u)的距離一樣,其中u是平均值。sqrt((a-u)^2+(b-u)^2+(c-u)^2)。

而標準差中的除以樣本總數再開方可以讓結果表徵每個資料相對於平均值的距離,而不是總體樣本相對於平均值的距離。

2樓:謝方正

其實是可以的,這種取絕對值的做法是出自Eddington2023年的一篇文章,雖然在相合性(英文是consistency,不知道怎麼翻譯)上不如平方求和開根號,但是如果用魯棒性來衡量的話這種估計量是可以使用的,它的asymptotic relative efficiency在資料有汙染或者有outlier的時候是優於平方求和開根號的估計量的。結論出自Huber的Robust statistics1.1節(手機碼字不容易啊)

3樓:

其實有好有壞,好處比如對線性模型求最有引數,直接最小二乘法就搞定了,如果換成絕對值那就麻煩多了,再乙個絕對值是二維距離,對於高維度的歐幾里得空間,距離是需要先平方再求和的,而且平方後,可以有效使outlier極化

4樓:

除了放大距離遠的點之外,還有很重要的一點是理論分析比較方便。

x^2是光滑函式,而絕對值函式不可微。

平均值一定是使得最小的那一點。

但使得絕對值最小的可能是乙個區間。

5樓:

個人以為樓上的回答說明了一部分。的確取平方後開方(2-範數)的方式更強調距離平均值更遠的點。不過應該還有另外乙個原因,那就是由2-範數匯出的空間是Hilbert空間(希爾伯特空間).

在這個空間中我們有著相較於其它範數更好的性質,比如可以使用最小二乘法等等。如果我沒記錯的話,這個在時間序列分析等方面有用的。【非專業,我只是了解一些(笑)】

6樓:

因為它更強調那些偏離平均值更遠的點。從實際意義上它更好用。

比如說A: 4 4 6 8 8

B: 2 6 6 6 10

統計學上認為A組比B組更「穩定」,用你的做法是同樣穩定。

有沒有懂統計的,標準誤為什麼等於標準差除以根號n,求公式推導過程?

楚遊 具體推導看樓上,以整體系統的觀點考察意義 表示乙個資料的時候,通常用其資料 資料測量值 STD 標準差 但是做實驗需要多組資料,資料1 測量值1 STD 資料2 測量值2 STD 測量值因為各種errors可能會變,但STD保持恆定。最後整合起來的結論 這組資料 資料測量值平均值 STD 根號...

為什麼對於不同的正態分佈,標準差具有相同意義?

青見 這實際上是乙個很基礎的對服從正態分佈的隨機變數進行標準化,然後對照標準正態分佈表求解的問題。事實上,對於標準差的倍數都可以按照類似方法求解。3sigma準則是基於工業生產的要求,此時取值的概率已經非常接近於1了。 某輝哥 好吧,手寫半天證明不出來,搗鼓了一段時間計算機,然後嘗試用計算機加以解答...

AQI(空氣質素指數)為什麼有中美兩種標準?差距大嗎?

352空氣淨化器 AQI指數指空氣質素指數 Air Quality Index,簡稱AQI 是乙個用來定量描述空氣質素水平的數值。AQI的取值範圍位於0 500 之間。國家目前播報的常規AQI六引數包括 PM2.5,PM10,SO2,NO2,CO和O3,AQI的計算方式如下所示,參照國標HJ633 ...