如何對幾組資料(連續變數)的中位值進行統計學比較?

時間 2021-07-09 09:22:01

1樓:

你問的其實是 Mood's Median TestMood』s Median Test: Definition, Run the Test and Interpret Results

簡單來說,就是我們的原假設是它們的中位數都是相等的,那我們就可以取所有資料的中位數 ,針對每組 sample 看它有多少大於 和多少小於的,這樣我們就拿到了乙個列聯表,就可以用 chi-square test 了。

但這種 non-parametric test 的效果 (power) 不一定好,因為它只考慮了 median,可以考慮用 Wilcoxon–Mann–Whitney U two-sample test 來替代。

2樓:

連續變數平均值的測試一般是t test,相對應的non-parametric的test就是wilcoxon。

wilcoxon是一種rank test,簡而言之就是把兩組數字重新排序,然後比較中位數的一種運算方式,並且對於資料的分布也不做要求。缺點是power不如t test這種parametric的test高。

r語言中資料框處理變數 獲得連續變數

山海有棗 dataset1 data.frame c1 seq 300,3100,by 200c2 seq 400,4700,by 300 dataset2 data.frame c3 rep seq 300,3000,by 100 times 2 any dataset1 c1 x dataset...

資料探勘中,離散變數和連續變數可以一起放入機器學習的分類器中嗎?還是要做什麼處理?

胡斐 離散特徵常規操作是做一些量綱上的歸一,然後做one hot 對於連續特徵,雖然XGBoost lightgbm等樹模型可以直接處理連續變數,但實操中很少直接這麼搞,還是會將連續變數離散化,再扔給模型。 綾小路清隆 決策樹可以處理分類變數,可以放進去 其他的線形模型,SVM,神經網路都要把分類變...

如何用spss分析不同自變數組內資料的差異性?

調研工廠 步驟一 分析資料的平穩性 為了避免偽回歸,確保估計結果的有效性,我們必須對各面板序列的平穩性進行檢驗。而檢驗資料平穩性最常用的辦法就是單位根檢驗。首先,我們可以先對面板序列繪製時序圖,以粗略觀測時序圖中由各個觀測值描出代表變數的折線是否含有趨勢項和截距項,從而為進一步的單位根檢驗的檢驗模式...