如何理解顯著性水平?

時間 2021-06-02 21:10:47

1樓:silver bullet

我理解顯著性水平是:

當原假設成立的前提下,定義了乙個概率閾值。當觀測統計量出現的概率小於這個閾值的時候,就可以認為觀測和原假設顯著不同。這時候可以認為不是出現了極端情況,就是原假設大概率不成立。

這個概率閾值就是顯著性水平。觀測統計量出現的概率(原假設成立條件下)就是p-value。原假設不成立的概率就是置信概率,即對立假設成立的概率。

2樓:阿華

題主對顯著性水平的理解是錯誤的,所以才會導致很多問題想不明白。

顯著性水平!不能被認為是假設成立時所犯錯誤的風險!我們只能認為顯著性水平的值=假設成立時所犯錯誤的風險,兩者概念完全不一樣,僅僅是數值相等而已。

只需要把這個關係理清楚,就能搞明白這其中的困惑。

那顯著性水平到底是什麼?見下圖。這張圖就清晰的展示了,乙個總體模型是被分為置信水平和顯著性水平兩部分。

那麼我們可以認為置信水平是乙個群體,顯著性水平又是另乙個群體,而且這兩個群體是有顯著性差異的(顯著性差異意味著這是兩個群體,不能歸屬於乙個群體)。當我們的樣本或者實驗結果,落在了置信水平,我們認為該樣本屬於置信水平的總體,也就是h0成立時的模型;當我們的樣本或者實驗結果落在了顯著性水平,那麼我們認為這個樣本與h0模型是有顯著性差異的,有了顯著性差異之後,根據h0h1是屬於完全事件原理,這個樣本就只能屬於h1成立的總體。

但是,上述一切的基礎是小概率原理。也就是當一次事件發生時,卻恰好出現了小概率事件,那麼我們可以認為原假設是錯誤的。

顯著性水平就是這個小概率事件。我們首先假設h0成立,顯著性水平為0.05,在此假設情況下,我們的樣本或者實驗結果卻恰好落在了顯著性水平內,那麼我們就可以認為小概率事件發生了,畢竟該事件發生的概率不到5%。

小概率事件一發生,我們就可以認為原假設是錯誤的。但是,這個時候的原假設一定錯誤嗎?不一定。

這個時候原假設依然有概率是正確的,而且這個概率就是小概率事件的概率,並且它又剛好和顯著性水平所設定的值相等。也就是說因為這個小概率事件的發生,我們就要做出h0是錯誤的決策,但是實際上h0還是有小概率成立的。

總結一下,顯著性水平和假設成立時所犯的風險是兩個概念,只是他們的值相等而已。

3樓:東子

顯著性水平是英語直譯過來的,不好理解,我的理解應該是顯著「錯誤」水平,比方說你有乙個假設,這個假設發生的可能性低於這個值就說明這個假設是顯著錯誤的。

比如中國和巴西足球隊比賽,你假設中國隊可能會贏球,你根據歷史比賽記錄,發現以前中國100場比賽只贏了1場球,也就是統計出來1%的贏球比率。如果顯著性水平是5%,就是說假設發生的可能低於5% 就顯著錯誤,1%低於5%所以你的假設明顯錯了。

4樓:ALEKO

利用拒絕域的話,是乙個大致的風險,就是只要落入拒絕域,沒去算相應的P值,而全用拒絕域的顯著性水平來替代。不是真實的概率,而是只要落入這個域,都是這個概率,所以是估計,是大致的,而非準確的,往往風險被擴大了。

5樓:佛祖放鴨子

顯著性水平alpha:H0為真卻拒絕的最大概率。

p-value值:實驗觀察結果與零假設相吻合的概率。

具體理解請結合起來看。

人話:如果假設檢驗顯著了,那麼說明有統計學意義,不是隨機誤差造成的。

6樓:咕嚕

α是拒真概率,p值描述了檢驗統計量根據樣本計算出來的值的位置。

我們構造乙個檢驗統計量,一般要知道當H0成立的時候,檢驗統計量根據樣本計算出來的值的大小,與拒絕H0之間的關係。比如線性回歸裡那個t檢驗,H0是β=0,檢驗統計量的分子是[β的樣本估計值]-β,當β=0,發現對β的估計值越偏離0,也就是t統計量的樣本值的絕對值越大,越傾向於認為H0是錯的。首先這個容易理解對吧

然後,乙個檢驗統計量至少當H0成立時它的分布是已知的。那麼我就可以知道H0成立時它取不同值的概率(其實是落入不同區間啦乙個點哪來的概率)。

如果我在數軸上畫乙個拒絕域,說當檢驗統計量根據樣本算出來的值落入裡面的時候拒絕H0,那麼此時,假如H0是成立的,但統計量又掉進去了,我就是犯了第一類錯誤(拒真)。那根據第三段我知道這個拒真概率是可以算出來的,也就是α。

根據第二段,我知道這個t檢驗,t樣本值的絕對值越大越傾向於拒絕H0,所以拒絕域的形狀肯定是從兩端往中間畫,但是畫多大呢?就要看當我拒絕H0的時候,我能接受的出錯的概率α是多大。比如是0.

05,那我就從兩邊畫啊畫,直到α=0.05的時候不畫了,把拒絕域確定下來。比如我這個可愛的t檢驗,兩邊都有拒絕域,H0成立時統計量掉進左邊這個的概率就是0.

025。(當然不一定是等尾的這不是重點)

有了拒絕域,如何知道檢驗統計量掉沒掉進去呢?學數理統計的時候有的題要求手算,先算拒絕域,再算值,然後比較。

但是!懶惰是人類進步的階梯!所以發明了p-value,比如我這個t檢驗統計量算出來待在左邊那個小尾巴那,那我就把統計量在H0成立時比它現在的位置還要靠左的概率算出來,根據第5段,假如這個概率小於0.

025,那我就知道統計量掉進去了;而如果大於,那就沒掉進去。這樣做的優點是可以更換不同的α,都能很方便比較,而無需額外的計算。

7樓:靜學社-學無止境

舉個例子吧。大夫和你說這個手術的成功率是95%,你願意承擔5%的風險嗎?你說願意,於是大夫做手術;你說接受不了這個風險,於是手術被取消。

做手術可以看成接受零假設,不做手術可以看成拒絕零假設。希望這個例子能對你有點幫助。

對P value和顯著性水平的一些困惑

吳小軒 由於樣本具有隨機性,所以我們取樣是有可能取到各種各樣的樣本的。通過原假設H0設定的引數,我們可以計算在該假設下,得到該樣本至更極端樣本的概率值p 圖中綠色區域分別為原假設u u0,u u0,u u0的情況下,樣本芝更極端樣本的概率值p 理論上,p取0到1中的任何值都是有可能的。但實際操作中,...

spss相關性檢驗,相關係數很小,顯著性水平很高,怎麼評價兩個引數關係,是相關還是不相關?

栗子聽雪 但是實際中我們獲得的資料是總體的觀測,所以我們需要判斷根據樣本算出的相關是因為抽樣誤差導致還是因為總體兩變數確實存在相關,所以我們需要判斷總體的相關係數是否顯著不為0,所以原假設H0是總體的相關係數 0並構建了下圖中的t統計量進行假設檢驗!下圖說的很清楚。 Nittanystat 在做統計...

P值和顯著性有什麼區別?

我們一般用到顯著性水平時,都是已經給定的顯著性水平,可是認為是乙個判斷依據。有了這個判斷依據,我們再用計算出來的樣本統計量對應的顯著性水平去判斷,如果樣本計算出的顯著性水平p小於事先給定的顯著性水平,那我們肯定要拒絕原假設。ps顯著性水平,就是犯棄真錯誤的概率 給定的顯著性水平就是給定乙個犯棄真錯誤...