統計中的 Bootstrap 方法是指什麼?與 Monte Carlo 方法有什麼聯絡與區別?

時間 2021-05-06 06:38:28

1樓:王子寧

Bootstrap

基本思想:"to replace the unknown population distribution with the known empirical distribution." Chernick(1999)

優點:"the substitution of raw computing power for theoretical analysis." Efron and Tibshirani (1986) ,小樣本的情況很好用,適合估計信用風險建模中的違約率。

2樓:DonACorleone

淺顯的說。Bootstrap的作用在於計算估計量(estimator)的標準誤差(standard error)。在估計量( )的形式過於複雜導致普通的統計理論無法給出標準誤差的表示式的時候,我們就用"bootstrap"來解決這個問題。

5個步驟:

首先得知道總體(population)的pdf, f(x;),以及一些已有的資料 , ,...並且用這些資料計算出估計值(estimate, ).

將 帶入pdf中得到f(x; ), 然後用電腦軟體比如R,生成新的資料 , ,...並用這些新資料計算估計值

重複第二步B次,得到 , i =1,2,3,.....B現在計算 的平均值, =

的標準誤差就是 的標準差了

Done!

3樓:白告

有些類似調查種群密度的標誌重捕法

比如我想知道大海中魚的平均質量,我撈了一千條魚(假設該樣本有代表性),算出他們的平均質量M。

我又在對這一千條魚重複取樣n次,每次再撈一千條,這樣我就可以獲得n個平均質量M_n。

然後我可以用這n個平均質量M_n來估計M的置信度。

4樓:chenxianglei

做基因的表達與預後關係的生存分析。利用R包(maxstat)中的最小p值法或稱最大卡方統計量獲得最佳截斷值後,這時需要對p值進行校正,所用的方法為bootstrap,這個用R語言怎麼實現呢?望大家指點

一、二。

5樓:oxfyy

Bootstrap本身就是Monte Carlo Sampling的一種。假設離散的uniform distribution。

6樓:書牛

(1)首先,Bootstrap並不是和Monte Carlo方法完全無關。

Thebootstrap procedure, developed by Bradley Efron(1979),is a Monte Carlo method that involves resampling-- that is, taking repeated samples of size n (with replacement) from the original sample data set.

-- . Mendenhall

(2)然後解釋一下,bootstrap的簡單使用方法。

使用bootstrap 估測總體樣本引數θ的 bootstrap confidence interval.

樣本引數θ可以是均值,方差等等。

對於乙個樣本x1,x2,...xn. 其總體的概率分布中引數θ是未知的,想要利用有限的這個樣本來得到乙個估測值θ『

Step1:選擇乙個resampling的次數i,1000或2000或3000等(取決於自己的需要);

Step2:然後每一次的重複計算程式是:從x1,x2,...xn中有放回的,抽取n次(所以可能x1..xn中有的值會被抽取多次);

Step3:重複上述抽取程式,一共i次(step1中已經選定的i值),利用每次抽取後的結果都計算出乙個θ『值(一共i個θ『值);

Step4:利用得到的θ『1,θ『2,θ『3... ...

θ『i作為乙個sample,計算其(α/2)100% 和(1-α)100%的百分位值,得到的就是近似出的,估測總體引數θ的,置信區間的最低和最高點[ x, y].

技術上,現有的統計軟體SAS,都能實現,具體實現方法,直接搜尋使用即可。

7樓:

蒙特卡洛方法是用抽樣分布來近似隨機變數的分布,以樣本的數字特徵來近似隨機變數的數字特徵。例如,用樣本均值近似隨機變數的期望,用樣本方差近似隨機變數的方差,等等。

bootstrap是一種非引數估計方法,它用到蒙特卡洛方法。bootstrap演算法如下:

假設樣本容量為N

1)有放回的從樣本中隨機抽取N次,每次抽取乙個元素。並將抽到的元素放到集合S中;

2)重複步驟1)B次(例如B=100),得到B個集合,記作S1,S2,...,SB;

3)對每個Si (i=1,2,...,B),用蒙特卡洛方法估計隨機變數的數字特徵d,分別記作d1,d2,...,dB;

4)用d1,d2,...dB來近似d的分布;

本質上,bootstrap演算法是最大似然估計的一種實現,它和最大似然估計相比的優點在於,它不需要用引數來刻畫總體分布。

8樓:

從某種意義上,Mente Carlo是一種計算積分的方法,期望,方差等等都是在概率空間的積分,先取樣,再加和。一般用在兩個地方,一是在closed form拿不到的情況下來做的,二是空間維度非常高,因為Mente Carlo的收斂階依賴於取樣點的個數(半階收斂)而和空間維數沒有關係,在特別高維的問題中計算積分,Mente Carlo甚至成為了唯一可行的方法。

而Bootstrap方法更多意義上是一種有助於減少方差的resampling的方式,即它和Mente Carlo的區別在於,一種是計算的方法,一種是取樣的方式。因為Mente Carlo中也要用到取樣,所以在某些情況下,我們在用Mente Carlo算期望或者方差等量的時候,可以用bootstrap做一次resampling, 我是這麼理解的。

9樓:「已登出」

Bootstrap 是假裝自己在通過samling 來MC,區別類於statistical learning 和ml區別。

其中乙個綱領就是:如果empirical distr可以描述distr的話,我們將emp distr重新分組之後, emp distr依然可以描述distr(也就是robust的性質)

畢竟 bootstrap 的context是無法抓出新樣本

10樓:陳無左

bootstrap可以看作非參Monte Carlo再次重申非參不是沒有引數,非參是無窮維引數空間,是無法想到合適引數模型時的預設模式。

bootstrap看作對樣本經驗分布作隨機數生成,產生模擬樣本。

Monte carlo的解釋是依賴隨機數生成而產生新樣本對其進行模擬。bootstrap完全符合這個定義。

11樓:Denise Fan

Bootstrap是我們在對乙個樣本未知的情況下,只能抽取其中一部分資料集,然後對其進行n的反覆抽樣,來對樣本進行點估計什麼的。

而Mote Carlo則是從simulation的角度出發,當我們對乙個distribution已知時,通過一些引數,如均值,方差來對整個distribution進行估計。

12樓:Jinguo Gao

13樓:

這麼理解,bootstrap就是步步為營

Monte Carlo……還沒想到比較合適的成語,反正就是根據分布特點,大量生成隨機數來模擬,最後再把結果取個平均

14樓:梁世超

parametric vs non-parametricMonte Carlo 對distribution有 assumption 兩者都是在simulate

bootstrap只要有sample就是可以simulate具體的話還是讀書吧不同model simulate的方法都各不一樣

李航《統計學習方法》中的Adaboost例項解析(例子8 1)中zm(規範化因子)怎麼求啊?

路飛 想請教您個問題,後邊權值怎麼計算的我明白,但是在進行訓練的時候訓練集和權值怎麼結合的我不大明白,拿第一步來說是怎麼實現訓練集權值是按D1分布的?迭代到第二次,權值變化了D2,分類器的輸入 訓練集 不是也得變麼,那他是怎麼實現訓練集按照D2分布的呢? 天天 問題解決啦。用python編了乙個小程...

在科學研究中,哪些實驗設計或統計方法可以確定兩個事件之間存在因果關係,而哪些只能說明兩者有相關性?

起個名可真難 若想知道某個實驗設計能否獲得兩個變數之間的因果關係,首先需要了解確定因果關係的條件有哪些。目前,普遍採用的是英國哲學家穆勒提出的三個條件 1 共變性,兩個事件必須是共變或一起變化的 2 時間順序 乙個事件必須在另乙個事件之前發生 3 排除其他可能的解釋。這三個條件必須同時滿足才能確定因...

統計學中 Experimental Units 和 Sampling Units 有什麼區別?

experimental unit 中的最小觀測單元為 sampling unit 同時 Black Stranger 文中提到的文章 The Experimental Unit 介紹的也挺好 Experimental units被認為在一開始是等價的,沒有不同 Sampling units來自某一...