如何用易懂的語言解釋區間估計和假設檢驗的區別和聯絡?

時間 2021-05-11 23:08:46

1樓:呆膠布

區間估計是告訴你我有95%把握總體均數在我算出來的區間(肯定式給出結論)

假設檢驗是告訴你,總體均數和你假設的均數一樣的概率小於5%,就可以說總體均數不是你假設的均數(否定式給出結論)

乙個是告訴你總體均數是啥,乙個是告訴你總體均數不是啥,相當於從兩方面入手。

區間估計比假設檢驗更好用,區間估計相當你去看病大夫直接告訴你很大可能是某某病,而假設檢驗是,你跟大夫說你可能得了某病,檢查一通,大夫說你不是這個病,至於具體是啥病,還得繼續檢查。

2樓:

首先這兩個概念很像,一些名詞是共用的,比如顯著水平α,置信水平1-α,置信區間。不過,這些名詞的真實含義不一樣,這兩種方法的區別也很大。

假設檢驗:

乙個原假設H0和乙個與H0相關的統計量T,兩個常量t1、t2確定的置信區間[t1, t2]。

其中1-α=P(T∈[t1,t2] | H0)。當一次實驗的T0滿足T0∈[t1,t2]時,接受原假設H0,否則拒絕原假設H0。

區間估計:

θ是乙個引數,兩個統計量θ1和θ2確定的置信區間[θ1, θ2],滿足1-α=P(θ1≤θ≤θ2)。

(引數和統計量其實都是隨機變數)

3樓:Kyle

易懂的語言:

都是用樣本變數去估計總體變數

比如:隨機取樣1000個人,用這1000個人的平均年齡去估計全中國人民的平均年齡

首先要規定乙個「精度」,因為是估計,所以結果很難保證絕對正確,那就需要估計者對自己的估計結果有多大自信(置信水平,顯著性水平),比如90%,這是事先規定好的。

區間估計:根據1000個人年齡的均值,方差...來估計全中國人民年齡的區間。

結果比如:35~40歲,意思是:估計者有90%的自信保證全中國人民的平均年齡在35~40歲之間。

(更準確的說:取樣十次,每次取樣1000個人,求出十個區間。這十個區間會有9個包含真實的平均年齡)

假設檢驗:假設全中國人民的平均年齡是38歲,然後根據1000個人年齡的均值,方差...計算出這個假設有多大「概率」成立。

「概率」大於90%,假設成立,全中國人民的平均年齡有可能是38歲,反之不成立。

(但不是說平均年齡是38歲的概率是90%,你可以假設37,39,40,可能是都是成立的,「自信程度」都是90%)

4樓:

兩者離不開中心極限定理!先說下各自的基本道理:

1、區間估計是有假設的:一般是假設總體分布存在,而且總體方差已知的,則總體均值肯定存在,但不知道具體值,則構造乙個變數,這個變數肯定是服從標註正態分佈

那麼後面這個不等式到底是什麼鬼東西?是表達什麼意義呢?,說明大量重複抽樣,總有1-a的次數,抽到的樣本均值,即x一槓,使得該不等式成立,對吧!

那麼如果不等式成立 ,換句話說,總體均值肯定也在不等式變換的範圍內,但是每乙個抽樣,總體均值要麼在要麼不在,因為你只是取得了乙個樣本,這個式子是大量重複的樣本,比如你抽1000萬個樣本,大概也就1000萬乘以(1-a)次不等式成立;

2、假設檢驗也有假設:假設總體分布存在已知,且均值、方差當然均存在(換句話說總體分布的資訊你都知道了)

舉個例子:比如你要擬合你們車間工具機的加工誤差程度,假設了乙個分布,總體方差、均值都假設出來了,看看是不是符合這個分布。然後你取了10個樣本,還是構造這個變數,然後你就說了,如果樣本均值x一槓是符合這個分布的,那麼=這個構造變數小於等於a,一般是分位數,的概率大於0.

999,對吧!

那麼你就開始抽取樣本,結果!樣本得到的構造變數卻大於a,換句話說如果前面假設的擬合分布是對的,那麼應該很難抽到大於這個可能啊!所以就有理由懷疑,擬合是不是錯了?

5樓:

學了一半的統計學,感覺這門學科乙個重要作用就是研究通過抽取樣本來對總體進行研究。

置信水平,根據一次抽樣,來估計總體的情況,以及可靠性:

比如你出了一道題,讓10000名學生作答,答完題後,想知道多少人答對了,無奈總體太大,一下子看不過來,怎麼辦,那就抽取100份試卷,看看答對的比例有多少。 如果70名學生答對了,那就能計算期望(平均值)和方差(偏差度)。 再根據中心極限定理得知,抽樣平均值會形成乙個正態分佈(假設不斷抽取100份試卷,計算每次抽樣的平均值,抽上100次,每次的平均值就形成了正態分佈),根據標準正態分佈屬性(2個標準差內概率是95%),就可以得出結論:

有95%的把握,這10000份答卷中,答對的估計有7000份,誤差範圍是2個標準差,這就是置信水平,根據一次抽樣,來估計總體的情況。

而假設檢驗,就是已經知道總體情況,隨著A條件發生變化,再進行一次抽樣,來檢驗A條件的影響。或者已經有乙個總體情況的結論,但不知道是否可靠,然後通過抽樣進行檢驗。其計算理論基礎和置信水平一樣,預設抽樣均值分布是正態分佈。

如你看完了10000份卷子,正好得出有70%的同學是答對的。此時如果你想知道噪音對答題的影響,那麼就讓同一批學生在噪音環境中答題(兩次答題互不影響)。那是否有影響呢?

如果你不想再批這10000份卷子,你還是抽取100份卷子,發現有65份是答對的,結論怎麼下? 這就需要用到假設檢驗,假設沒影響,那麼出現隨機抽100份,65份是對的概率多大,一般會約定,如果這個概率小於5%,那就假設出錯,得出噪音對答題有影響的結論。

6樓:馬歇爾.羅姆

It is worth noting that the confidence interval for a parameter is not the same as the acceptance region of a test for this parameter, as is sometimes thought. The confidence interval is part of the parameter space, whereas the acceptance region is part of the sample space. For the same reason the confidence level is not the same as the complementary probability of the level of significance.

7樓:牛叫化

一年前學的記不清楚了,但是思想大致應該不會錯吧……

首先待估引數的真值都是未知但不具有隨機性,樣本是已知但具有隨機性的。

其次假設檢驗假設引數真值為x0,可以在假設條件下確定樣本估計量的分布;根據樣本計算估計值,可以用置信區間或p值判斷樣本是否是小概率事件,進而得出結論是拒絕原假設。

而區間估計是比較以樣本估計值為「中心」,根據抽樣分布話乙個區間,固定但未知的真值被以某概率被區間包含。由於樣本隨機性,區間是可移動的,但真值不動,類似套圈。

區別就是乙個假設了真值用樣本檢驗假設是否合理,乙個是用區間估計引數真值。

聯絡大約就是都需要用到抽樣分布以及相應的概率計算方法……

置信(confidence)是估計時候用的,顯著(significant)是檢驗時候用的

如何用通俗易懂的語言解釋指令碼(script)是什麼?

胡羅舶COOLHOBO Shirley 開發達人 指令碼是一種特定的描述性語言,計算機會按照程式順序的執行它,自動化的幫你完成一系列工作的程式。它非常方便快速,並且可以幫助開發者節省時間,而不用每次手動去執行指令。 天地一色 我覺得回答這個問題要解釋一方面要解釋它的引申意思,還要說一下它在計算機中產...

如何用通俗易懂的語言解釋base64

Intopass base64只是一種用文字表示二進位制的方法,如果你的介面支援原生的二進位製流,那根本不需要base64,因為直接上二進位製流更省空間。比如說乙個4位元組整數,如果是二進位製流那就是4位元組。如果是轉化成文字,表示成二進位制文字時是32個字元,每個字元用ASCII編碼是1位元組,所...

如何用易懂的語言解釋技工中的鉗 計量 模具 車 銑 磨 鏜 冷作等工種的工作內容?

張淞淇 通俗的解釋一下我所了解到的 鉗工,字面上理解就是拿著鉗子扳子這些工具的工人。但實際上不操作工具機,主要以裝配為主 模具設計是 冷沖模 注塑模 畫圖和程式設計的人 車工 操作車床的人 銑工 操作銑床的人 鏜工 操作鏜床的人 冷作工 冷加工就是常溫加工,冷成型工藝,例如沖壓 油漆工 刷油漆的人 ...