對P value和顯著性水平的一些困惑

時間 2021-05-06 16:06:49

1樓:吳小軒

由於樣本具有隨機性,所以我們取樣是有可能取到各種各樣的樣本的。通過原假設H0設定的引數,我們可以計算在該假設下,得到該樣本至更極端樣本的概率值p(圖中綠色區域分別為原假設u≤u0,u≥u0,u=u0的情況下,樣本芝更極端樣本的概率值p)。

理論上,p取0到1中的任何值都是有可能的。但實際操作中,如果p比較小,我們就有理由懷疑是不是我們原假設H0錯誤而造成的。

這時我們就要對這個較小的p做出乙個判斷,他是由於樣本隨機性得到的,還是由於原假設錯誤而造成的?(即,p小到什麼程度時。我們就認為這個事情發生概率太低,沒這麼巧合的事情,肯定是原假設有問題)

判斷的標準就是閥值alpha。當p小於alpha時我們就認為這是由於原先假設錯誤(棄真,放棄原先假設)而造成的低概率。這個alpha就是顯著水平。

上述針對每個樣本算出的p就是檢驗的p值。

alpha往往設定為0.01,0.05等較小值,是為了保護原假設,使得其只有得到小概率p時才被否定,即使得拒絕原假設的理由更充分。

2樓:

假設檢驗中有兩類錯誤,乙個是棄真錯誤,犯棄真錯誤的概率記為α,也叫顯著性水平;另乙個取偽錯誤,犯取偽錯誤發生的概率記為β。它們之間的關係是此消彼長。兩類錯誤同時發生,拒真越小,取偽越大,一般統計的時候選不考慮β而已。

3樓:HarryYang

P值就是原假設不成立的條件下,我拿到了這個樣本的概率加上比這個還差樣本的概率。(不知道我說對了沒有)

但事實上,我們想知道的是我拿到了這個樣本而原假設成立的概率。這兩個的問題的概率空間都完全不同,所以顯著性只具有參考意義。

4樓:

統計學做檢驗時,通常會設定一虛無假設(零假設),記作H0。以及乙個對立假設(AlternativeHypothesis),及與虛無假設對立的假設,如果證明虛無假設錯誤,則可推對立假設成立。

P代表α,即P(當H0為真時拒絕H0)(其實就是p-value),df代表自由度(degree of freedom)。

假設置信度為95%,即錯誤拒絕H0的概率為0.05。有95%的概率確信檢驗結果正確,有5%的概率會錯誤拒絕虛無假設。(我們總說的p值也就是與0.05比較)

觀察卡方分布錶能發現,在乙個自由度下,chi-square越大,其p值就越小。

p-value的作用:p-value就是用來判斷H0假設是否成立的依據。因為期望值是基於H0假設得出的,如果觀測值與期望值越一致,則說明檢驗現象與零假設越接近,則越沒有理由拒絕零假設。

如果觀測值與期望值越偏離,說明零假設越站不住腳,則越有理由拒絕零假設,從而推出對立假設的成立。

p-value的計算:計算chi-suqare,計算自由度,查卡方分布表。

做出H0,H1這對互斥的假設,計算出H0為真時的期望值,統計出實際的觀測值,通過期望值和觀測值求得chi-square(卡方),再通過卡方查表,得到p值。根據p值與α(1-置信度)的比較,如果p-value<α,則拒絕(reject)H0,推出H1成立;如果p-value>α,則接受(accpet)H0,推出H1不成立。

5樓:洛陽的小蝦公尺

p確實是非常重要的概念,跟alpha混淆應該是統計入門的關鍵問題之一。安利一下我的回答哈,供樓主一哂。

如何理解統計學假設檢驗中 p 值?

6樓:麵包

顯著水平是人為定下來的,PValue是根據實驗結果算出來的。所以顯著水平是不隨p-value改變的。對於結論,p value越小,拒絕越放心。是對的。

p value指的是出現目前結果(t值)以及更極端段情況的概率。

顯著水平是人為定下來的。基於原假設,我們可以認為基於原假設的情況下,出現某些情況事是合理的,某些結果是顯然不合理的。那麼合理與不合理(也就是顯著與不顯著)怎麼來界定呢。

所以就有這個人為定下的顯著水平。這個就是顯著水平的作用。至於如何確定這個值就是另外乙個話題了。

基於這麼乙個belief:在一次試驗中,小概率事件是不會發生的。那麼基於原假設,這次試驗小概率事件發生了。

那麼我們就相信原假設有問題。這個小概率事件的發生的概率(P value)越小,那麼原假設的問題就越大。這個邏輯很好理解吧。

以下有乙個例子:

比如說擲硬幣100次,我們原假設出現正面的概率是50%。次此的實驗觀察結果是出現65次正面,那麼我們很難由按照次此觀察的結果來判斷原假設是不是合理情況。但如果我們非要下乙個定論,就必須要選定乙個閾值,不然判斷標準不同,那麼下的結論也就不同。

於是我們在這裡就限定出現60次以上或者40次以下的情形是不合理的情形來決定該次實驗結果是不是合理。這種限定也就是顯著水平的意義。另外在這個例子中,正面出現70次以上的概率就是p value。

那麼p value越小,比如出現正面90次以上的概率,那麼顯然我們會更放心的拒絕原假設。

7樓:千草

看大家都回覆得挺完整了,就加個例題當是自我複習一下吧

這個是個做One-Tail Test的練習,題意應該猜得明白,如果有需求等空了再翻譯成中文。

看結果很明白,P-value 的計算結果是 0.03,significant level 是既定的 0.05,視覺上二者區別表現為下圖。

P-value 為右側藍色區域,是用樣本均值的83計算出Z值為1.875,再計算出其所覆蓋的百分比。

Significant level Alpha 是既定的灰色區域,對應confidence interval為82.63,Z值1.645。

P-value is the smallest significant level at which a null hypothesis can be rejected.

應用到此題,就是說如果你既定的significant level大於0.03這個P-value,你的H0就有概率會被拒絕,如果小於0.03,H0就不會被拒絕。

最後附上一些原始定義:

8樓:張自達

p值和顯著性水平α根本不是一回事,很多人包括提問者把它們混為一談了。α是人為定的,取0.1、0.

05、0.01隨你需要,當然也不能瞎選。α定了,拒絕域也就確定了。

接下來才要看抽樣的結果,p值是根據樣本算出來的,不是人為確定的。要注意拒絕原假設的條件是p值小於α。如果α越大,則拒絕的可能性越大,但不是p值變大了,p值還是那個p值,除非你重新抽樣。

舉個例子,如果計算出來的p值是0.02,α選0.05的時候可以拒絕原假設,如果選0.

01就無法拒絕了。所以把α與p值分開看就清楚了。

9樓:歪鏡喵

作為一名學心理的大學生狗…之前學習統計學的痛苦記憶猶新…看到另外兩個回答都很教科書,讓我想起了我當時沒有好好學習的痛苦…看的不是很明白T、T

嗯…我就用比較直白的話回答一下吧。

對於顯著性的檢驗…p值比對標準一般是0.05或者0.01,也就是說其實你的那兩根線的位置是固定的,陰影的面積也是固定的,變動的是你資料的結果,也就是那個p值,所以,就是這樣嘍…

希望可以幫到你…

10樓:Glenn Qian

針對你的問題:

「拒絕域越大,P值就越大」: 錯誤

「拒絕域越大,最大能拒絕的P值就越大」:正確進一步理解為:「顯著性水平越大,最大能拒絕的P值越大」

這樣就完全沒有問題。回想一下,當 P值 < 顯著性水平alpha 時,我們拒絕 H_0。所以顯著性水平實際上就是最大能拒絕的P值。

同時,「顯著性水平alpha越大,我們拒絕原假設的概率應該也越大」:正確

因此,「P值越大,拒絕原假設的概率就越大」:錯誤「最大能拒絕的P值越大,拒絕原假設的概率就越大」:正確這樣就沒有矛盾了。

11樓:茉茉

來了。上班簡答。

p-value 給你提供的是:(以一類錯誤為例)在 H_0 為真的情況下錯誤拒絕 H_0 的概率。它的定義是 p-value :

= P ( X >= x | H_0) 。這個值是根據你的實際資料算出來的,與你的實際資料有關

拒絕域是由你的 test statistic 定的,它的定義是 test 的頻率函式 f(x) 上有悖 H_0 的那個區域,也就是你給的圖上的陰影部分。你給的是個 two sided t-test 所以是有對稱的左右兩個區域。當你的 alpha 確定了,這個區域也就確定了,與你的實際資料無關

這個如果你做過「手工」作業的話應該很有直觀感受啊,因為你的 test statistic 是可以查表查出來的,是個常數。

所以現在你可以明白,你上面那幾個問號,只有最後那句是對的。或者說,你最後的那句如果說成「p-value 越小,錯誤拒絕 H_0 的概率越小」就完美了。

嗯... 不知道我的解釋對你有沒有幫助。

Update:

鑑於題主還是困惑,用 wikipedia 上抓來的圖再解釋下。

圖中曲線 f 是某分布的密度函式。淺棕色部分是拒絕域,這個域的面積大小是 alpha。條狀部分的面積是 p-value,這個面積的大小取決於實際值 x (x 是根據實際資料計算得到的乙個 test statistic 的實際值)。

這個圖例裡 x 決定的條狀面積小於淺棕色面積,也就是說 x 對應的 p-value 小於 alpha,可以拒絕 H_0。

(不負責任的教科書很害人。)

對SNH48公演中MIX和call的一些疑問?

1.成員介紹完catch phrase後的call,應援會的統一組織有沒有其必要性?怎麼看待毒瘤call的存在?有必要。其實沒有毒瘤call是墜吼的,但是禁不住。不如統一一下免得沒完沒了call個沒夠 2.爆裂mix,有人認為拉爆裂不是akb的mix,有的認為這樣有氣勢,有的認為 烏拉嘿 喊不齊,拉...

本人大一,對一些學科學習的必要性有些困擾。計算機專業除了學程式設計,對其他的學科應該怎麼分配學習時間?

一曉拾 程式設計師和流水線的工人差不多,計算機相當於工具機,指令集相當於說明書,各種語言相當於簡化版本的說明書,演算法研究怎麼少投入多產出。程式設計師和流水線的工人又不一樣,區別在於各種語言,程式設計正規化,演算法資料結構,計算系統都是數學的外殼,各種知識都可以統一在符號化的數學原理之上。so,程式...

可以說一些可以有效緩解學習對精神和身體的焦慮和壓力的方法嗎?

Lissie 首先要恭喜你,你所感受到的,正是你的大腦給你的最真實的答卷。我們人的大腦裡,有乙個壓力反應系統,有杏仁核 下丘腦 還把提 腦垂體和腎上腺組成。這套系統,幫我們的祖先再遇到大老虎時,能夠分泌壓力荷爾蒙,腎上腺分泌皮質醇,讓人們能夠處於乙個應激的狀態,能夠快速的figh 或flight。但...