什麼是無偏估計?

時間 2021-05-12 01:01:30

1樓:小學生

無偏估計就是用樣本觀測值來估計總體引數,然後得出的一種推斷

無偏的主要意思是,進行了多次取樣,把每次樣本值代入推斷中得到的值得平均數接近所估計的引數的真實值。

2樓:belupreda

無偏估計量是指 : 估計量的期望值=實際值「樣本均值是總體均值的無偏估計量」,就是說:樣本均值的期望值 = 總體均值

證明:從有m個值的集合 從,取n個值形成乙個樣本樣本的均值是u,u的期望值是

即:也就是:u 的期望值等於 A的平均值

3樓:shirley

The bias of a point estimator W of a parameter θ is thedifferencebetween the expected value of W and θ. An estimatorwhose bias is identically equal to 0is called unbiased.

4樓:

說一下我的理解。

總體樣本S,隨機取樣得到S的乙個子集A,那麼用A的期望對S的期望進行估計,這個估計是無偏的。無偏不是指值相等,而是指多次估計的結果的期望等於S的均值。也就是說,你重複隨機取樣多次得到A1, A2,....

An這n個子集,這n個子集有n個平均值,分別為e1, e2, ... en。他們的期望是等於樣本的期望的。

這樣e1,e2....en每乙個都是對樣本的無偏估計。無偏估計指的的是估計方法是無偏的,不是估計得到的值是相等的,使用該方法得到的值幾乎一定是不相等的,只是這種偏離的部分,在多次估計的過程中,被平均掉了。

也就是說,無偏,指的是多次(無限次)估計的平均值等於S的平均值。

5樓:小透明

估計的期望等於真值

比如在"用n個樣本對隨機變數的方差進行無偏估計"的公式中需要其分母是(n-1),這樣估計的期望等於方差。如果分母是n,則估計的期望不等於方差。

6樓:慄悟飯與龜波功

無偏估計應該就是Unbiased Estimate吧?

對於population來說,資料的平均數是μ,標準差是σ,我們需要得到μ和σ來對整體進行估計。問題在於,這幾個值你是不可能知道的,因為在研究的時候基本不可能蒐集齊population的資料,所以你必須通過採集樣本來估計整體。(也有例外,比如我在Minnesota Population Center參與過的乙個關於廉租房的研究中,他們神奇地擁有1930s至今所有的Population的資料)

然後你抽取p組樣本,每組樣本分別求出其平均數,命名為X1 bar, X2 bar, X3 bar, ... , Xp bar,分別對應1~p組樣本,這p個平均數合在一起就是sampling distribution,同時,我們用X bar來表示X1 bar, X2 bar, X3 bar, ... , Xp bar。

這個時候,X bar就近似於正態分佈。

對於X bar來說,E(X bar) = μ,Var(X bar) = (σ^2)/n,n是樣本容量。

(以上均為假設滿足random sample和CLT時的情況)

題主是對「不論總體服從什麼分布,樣本均值是總體均值的無偏估計量」這句話抱有疑問,我舉個例子給你看你就知道了。

令X = 乙個美中國人平均每天看電視的時間。假設X的平均數是3,標準差是2.25,X的密度曲線如圖。

我們可以看到,X的分布並不是正態分佈,而是乙個right-skewed的單峰分布。

我們隨機取樣本,然後將X bar(注意是X bar不是X)畫出來:

這就是正態分佈了。對於這個正態分佈而言,X bar的期望是3,X bar的標準差是2.25/(n^(0.

5))。也就是說,如果樣本容量是10的話,那X bar的標準差就是0.71。

所以,針對題主的疑問「這怎麼可能?樣本的均值不一定等於總體均值啊?大多數情況下就是不等啊?!

」我想說,等於總體均值的不是某個樣本的均值,而是N個樣本均值的均值。(在滿足所有假設的條件下)

7樓:馬同學

現實中常常有這樣的問題,比如,想知道全體女性的身高均值,但是沒有辦法把每個女性都進行測量,只有抽樣一些女性來估計全體女性的身高:

那麼根據抽樣資料怎麼進行推斷?什麼樣的推斷方法可以稱為「好」?

1 無偏性

比如說我們取樣到的女性身高分別為:

那麼:是對不錯的乙個估計,為什麼?因為它是無偏估計。

首先,真正的全體女性的身高均值,我們是不知道,只有上帝才知道,在圖中就畫為虛線:

我們通過取樣計算出:

會發現,不同取樣得到的是圍繞左右波動的:

這有點像打靶,只要命中在靶心周圍,還算不錯的成績,這就是無偏的:

如果用以下式子去估計總體方差:

根據「為什麼樣本方差的分母是 n-1?」的解釋,會偏離靶心、產生偏差,這就是有偏的:

這個偏差經過計算,就是:

這種偏差就好像瞄準鏡歪了,是系統性的:

就此而言,無偏估計要好於有偏估計。

2 有效性

打靶的時候,右邊的成績肯定更優秀:

進行估計的時候也是,估計量越靠近目標,效果越「好」。這個「靠近」可以用方差來衡量。

比如,仍然對進行估計,方差越小,估計量的分布越接近:

舉個例子,從中抽出10個樣本:

下面兩個都是無偏估計量:

但是後者比前者方差小,後者更有效。

並且在現實中不一定非要選無偏估計量,比如:

如果能接受點誤差,我倒覺得選擇右邊這個估計量更好。

3 一致性

之前說了,如果用以下式子去估計方差:

會有乙個偏差:

可以看到,隨著取樣個數的增加,這個偏差會越來越小。那麼這個估計就是「一致」的。

如果樣本數夠多,其實這種「有偏」但是「一致」的估計量也是可以選的。

4 總結

判斷乙個估計量「好壞」,至少可以從以下三個方面來考慮:

無偏有效

一致實際操作中,要找到滿足三個方面的量有時候並不容易,可以根據情況進行取捨。

文章最新版本在(有可能會有後續更新):如何理解無偏估計?

8樓:Ning Lee

知乎果然大神多,從稍顯複雜的公式推導到形象生動的例子;從嚴謹學術的語言到輕鬆俏皮的調侃,不知不覺就搞懂了,而且連帶了不少其他知識點。

9樓:小院

無偏估計是乙個定義而不是乙個判斷,無偏的實際意義是沒有系統性的偏差,無偏估計量並不要求是完全的真實值,只是我們在規範的抽樣和資料處理方法下得到的比較合理的乙個對真實量的估計值,它強調了方法的正確性和估計值的合理性。

10樓:

個人理解:

因為取樣的樣本是隨機變數。假設總體均值為 Ex,第乙個樣本均值為 ex1,第二個為ex2.... 足夠多的不重複樣本均值的均值 ex,當 ex-Ex =0 則是無偏估計。

這裡均值只是乙個引數,設為方差這個引數也是一樣的道理。即對於引數的無偏估計。

11樓:胡鎰

無偏估計應該是unbiased estimator的意思吧。

我想題主的問題裡面,樣本均值是總體均值的無偏估計量應該是指樣本均值的期望值等於總體均值吧。。。如果單隻樣本均值的話,那當然會跟總體均值有偏差,但是樣本均值的期望值就不會了。增加樣本的量可以減少樣本的方差(Variance),所以增加樣本的量可以使估計值更接近總體均值。。

推導見圖

12樓:從不毒舌可達鴨

無偏估計啊。。。。

設總體均值為μ,樣本均值為

無偏估計就是:

這麼說吧:

同乙個總體,一次抽樣什麼么蛾子都有可能出現。但是只要你肯一直堅持不懈的抽樣下去,每次的樣本均值的均值,還等於總體均值——就是無偏的。

13樓:白劍卿

由樣本的平均值去估算總體期望,其本身只是一種測量手段,只要你樣本統計資料的顯著性特徵符合對總體的要求。那麼按照曹夢迪所述的做法,得到的樣本的平均值就是期望的無偏估計。

根據中心極限定理還可以猜想,假如你做足夠多次的取樣計算,那麼你得到的這些樣本均值都會服從乙個均值為μ、方差為σ^2/n 的正態分佈,而正態分佈裡面頻數最高的那個數一定是最真實接近總體期望的那個數。

14樓:Yang SONG

無偏估計T(X)是這樣一種統計量,它的期望ET(X)恰好就是欲估的引數\theta。事實上,任何統計量都是其期望的無偏估計。

15樓:TomHall

比如我要對某個學校乙個年級的上千個學生估計他們的平均水平(真實值,上帝才知道的數字),那麼我決定抽樣來計算。

我抽出乙個10個人的樣本,可以計算出乙個均值。那麼如果我下次重新抽樣,抽到的10個人可能就不一樣了,那麼這個從樣本裡面計算出來的均值可能就變了,對不對?

因為這個均值是隨著我抽樣變化的,而我抽出哪10個人來計算這個數字是隨機的,那麼這個均值也是隨機的。但是這個均值也會服從乙個規律(乙個分布),那就是如果我抽很多次樣本,計算出很多個這樣的均值,這麼多均值們的平均數應該接近上帝才知道的真實平均水平。

如果你能理解「樣本均值」其實也是乙個隨機變數,那麼就可以理解為這個隨機變數的期望是真實值,所以無偏(這是無偏的定義);而它又是乙個隨機變數,只是估計而不精確地等於,所以是無偏估計量。

如何驗證最小方差無偏估計?或者說,如何證明樣本均值是總體均值的有效估計?

Min.L Lehmann Sheffe 定理 最小方差無偏估計量是完備充分統計量的乙個函式 若存在則唯一。因此,從完備充分統計量出發,構造出乙個無偏估計量,該無偏估計量必為最小方差。單引數模型中,泊松 二項 伯努利分布,樣本均值都是完備充分的 對於雙引數正態來說,是完備充分的,於是樣本均值 由無偏...

什麼是引數估計,什麼是半引數估計,什麼是非引數估計?

Iridescence 在進行對隨機變數分布的估計 estimation of distributions 時,分為三種辦法 引數估計 非引數估計與半引數估計 引數估計 在已知分布的形狀情況下可使用 或是在假設的某種分布下 一般可採用最大似然估計方法來計算。這裡對分布的假設可分為單變數分布 多變數分...

什麼是引數估計方差

寅時猛抽風 概率論的已知條件是分布,即告訴你分布的情況下,讓你做概率計算。統計的已知條件是樣本,分布不知道,或者分布知道引數不知道。方差的估計,就是說給你樣本,你去估計去分布的方差是多。具體的話,貌似要用到卡方分布,這個裡面又是一堆東西,你要理解什麼是統計量,然後用統計量去計算,計算過程巴拉巴拉的一...