如何理解置信度?

時間 2021-05-29 23:46:05

1樓:

理解置信區間參考:

理解置信度參考:

置信度&置信區間,這篇講解我給100分! | CareerEngine

2樓:Beyond

區間估計講的是誤差,有時間專門寫個答案。

大致思路是幾何上估計值在置信度大小的誤差範圍內,在距離上恰好包含了真值,因為真值在同樣的誤差範圍(置信度)內包含了該估計量,說不清楚,有時間細緻寫寫。

3樓:洛陽的小蝦公尺

置信區間應該是frequentest的說法,說的是乙個cover的概率,我的區間95%可能cover了我們的parameter。不能解釋為,我們的parameter有95%的可能落在這個區間。此中有一點微妙的區別,有興趣的話,我們下回分解。

4樓:Birlin Chen

並不能說95%的可能性總體均值會落在[a, b]之間,這是典型的錯誤理解。正如前面知友所說,總體的平均值儘管未知,但是是確定的,不存在它有多大概率(95%)落在某一區間的說法,或者說它其實是以100%的概率位於某點處,只是我們不知道該點是多少,於是我們需要去估計乙個區間。根據中心極限定理,若總體服從正態分佈N(u,v),則樣本大小為n的抽樣的均值 X_bar 服從N(u,v/n),也就是說樣本均值本身也是乙個隨機變數,這個隨機變數圍繞u, 即圍繞總體的均值(未知)分布,方差為v/n.

樣本均值本身就具有很大的不確定性,因此如果用樣本均值來估計總體的真實期望u, 除非樣本大小n很大,否則準確性難以評估。因此我們要用到置信區間。那麼是不是說某個樣本算出來的置信區間一定是好的置信區間呢,當然不是,我們說他有95%的概率是好的,好的意思是並不是說總體均值有95%概率落在該區間裡面,而是說假設我們抽樣無窮多次,那麼95%的抽樣算出來的置信區間包含真實均值(好的),另有5%的區間不包含(當然實際中置信區間沒有好壞之說,只是做乙個比喻)。

哪些實驗結果屬於那95%是隨機的。因此我們自然也不確定某一次具體的抽樣算出來的置信區間是否一定包含真實值,但在實際中我們接受它,認為它包含真實值,在這種情況下,我們犯錯的概率僅為5%(我們認為包含但實際上不包含),我們接受這個犯錯概率。換句話說,某一次抽樣試驗得到的置信區間犯錯(不包含真實值)的概率僅為5%,符合我們預先設定的底線(顯著水平,也是容許犯一類錯誤的底線a=5%)。

這樣理解可能會比簡單的一句我們確定這個算出來的樣本置信區間有95%的可能性包含總體均值更具體吧。一句話總結,統計充滿了不確定性,不要奢望100%確定,要容許犯錯的可能(聯絡兩類錯誤型別)。

5樓:

就是用來評價乙個平均值有多靠譜。

就拿網上經常調侃統計局的乙個段子來說:乙個千萬富翁,周圍住9個窮光蛋,平均下來10個人是百萬富翁。這就很荒唐了。

那麼怎麼看乙個平均值是靠譜還是荒唐,就用置信度(也有叫95%置信上限)看

6樓:song zewen

對於置信區間,這其實是因為抽樣誤差決定的,因為樣本不能完全代表總體,確定的樣本的引數不等同於總體引數,因此,當根據乙個樣本估計總體時,要有乙個範圍去評估。置信區間說的是,根據樣本引數如均值和標準差,確定乙個範圍保證它有95%的可能性包含總體引數,這個範圍就是置信區間,就是說我提供的這個區間,有95%的把握我能說它包含了總體引數。

7樓:果程C

@鄒日佳寫的非常清楚了。這裡補充個論據,以下文字引用自《計量經濟學導論》的數理統計基礎,回答置信區間是幹什麼的:

通過構造置信區間(confidence interval),可以告訴我們總體值很可能落在相對於估計值的什麼地方,因而克服了點估計的缺陷。下面是應用置信區間的乙個例子:

假定總體服從的分布,並令是來自這個總體的乙個隨機樣本。樣本均值服從乙個均值為和方差為的分布:。進而有:

也就是說,隨機區間包含總體均值的概率是0.95,這是乙個隨機區間,因為端點隨不同的樣本而改變,在抽取樣本之前,它有95%的機會可以包含。注意,我們只能說利用所有隨機樣本構造這樣的置信區間,其中有95%將包含,而對於某乙個確定的樣本,是否落在其中是確定的,雖然我們可能永遠不知道這個量。

8樓:

1.首先統計是為了什麼?

為了用測量值估計總體的真實值。

2.舉個例子,你打槍打10次,你可以得到乙個平均值,比如是8.那麼我問你,總體的期望是不是就是8呢?

你要說是,那就太草率了吧,因為你再打10次可能就是7了,那麼總體的期望就變成7了嘛?當然不是,總體的期望是客觀存在不會變的。實際上均值等於期望的概率是0啊。

式(2)

所以說,以點估點是不準確的。

但是既然樣本是從總體中抽出來的,那麼樣本的均值和總體的期望應該差的不遠吧?你射擊的均值是8,總體的期望總不能是1吧?他們做差的話,應該是介於某個小的值之間的吧。如式(3)

置信度就是說,你測得的均值,和總體真實情況的差距小於這個給定的值的概率,應該是1-α,如式(4),換句話說,我們有1-α的信心認為,你測得的這個均值和總體的實際期望很接近了。(說你測得的均值就是總體期望是很草率的,但是說,我有95%的把握認為我測得的均值,非常接近總體的期望了,聽起來就靠譜的多)

9樓:鄒日佳

在統計學中,非常容易把概念模糊化,很容易把95%置信區間理解成為在這個區間內有95%的概率包含真值。

但是這裡有兩個容易混淆的地方

1.真值只得是樣本引數還是總體引數?

這個問題的答案是總體引數,我們取的資料是樣本資料,點估計是樣本引數的真實值,我們要估計總體引數。

2.95%的概率,變動的是誰?

在以後不常溫習的情況下,這個問題容易造成困擾。這裡95%的概率,變動的是置信區間。非常難以理解,用圖來闡述一下:

錯誤理解:上圖淺色的虛的豎直線代表樣本引數真值,橫的兩端有端點的代表95%置信度的置信區間,100條豎直線裡有95條左右落入這個區間內。

這是非常錯誤的理解,樣本與總體的關係沒有思考清楚。置信區間是估測總體引數的真值,這個值只有乙個,且不會變動。

下圖為正確理解:

樣本數目不變的情況下,做一百次試驗,有95個置信區間包含了總體真值。置信度為95%

其中大虛線表示總體引數真值,是我們所不知道的想要估計的值。正因為在100個置信區間裡有95個置信區間包括了真實值,所以當我們只做了一次置信區間時,我們也認為這個區間是可信的,是包含了總體引數真實值的。

這樣應該就能很好地理解了,遇到統計上的困惑時,多思考用樣本估計總體這個核心思想,很多就能迎刃而解。

10樓:海燕

比如調查會員滿意度,結果是滿意度為80%,誤差為正負5%,置信度是95%。這一結果意味著3點:

1)樣本中的滿意度是80%,這是用樣本對總體的點估計2)點估計的範圍是區間(75%,85%)

3)如果用類似的方法,重複抽取大量(樣本量相同)樣本時,產生的大量類似區間中有些會覆蓋真正的總體引數值(即總體滿意度),而有些不會,但其中大約有95%會覆蓋真正的總體引數值。

如何理解假設檢驗的接受域與置信區間的關係?

chan 首先假設檢驗中的不拒絕域和置信區間本質上是兩個不一樣的東西,但是它們之間有點異曲同工之妙。前者的不拒絕域是以總體引數為主體來構建的,它可以理解為假設引數為真的條件下樣本統計量落入這個不拒絕域的概率有 1 因此若你的樣本統計量在 1 這麼大的概率下仍然落入不了不拒絕域,那麼我就有充足的理由去...

如何提公升奇幻題材設定可信度?

強壯的海綿體 我看不懂你想問什麼 你是想問 怎麼說服讀者?2.怎麼製作有說服力的設定大綱?3.優秀的奇幻類作品應該設定嚴格的設定還是留有餘地?請選其一。 St Shaytan 想要可信的話,主要是靠細節自洽罷 但是合理可信這回事 並不總是重要的,這就像很多科幻並沒有往 硬 上下功夫一樣 有沒有聽過這...

IPviking可信度如何,怎麼做到的?

S3J5cHRvbg quora上的答案 中文社群用中文名 它是通過採集和分析數百個監測點,以及超過40個國家的實時網路攻擊資料,通過對北歐的攻擊監測系統的資料的抽樣採集,來統計全球的攻擊資料,使用者可以看到哪些國家攻擊那些區域,或者使用了那些服務的漏洞進行攻擊。度娘 當然這只是做實時監測,監測哪些...