網(wǎng)站建設(shè)先進(jìn)城市競(jìng)價(jià)sem托管公司
卡方檢驗(yàn)是一種常用的假設(shè)檢驗(yàn)方法,通常用于分析兩個(gè)或多個(gè)分類變量之間的關(guān)系。在醫(yī)學(xué)研究中,卡方檢驗(yàn)被廣泛應(yīng)用于分析兩種或多種治療方法的療效,或者分析某種疾病的發(fā)病率與某些危險(xiǎn)因素之間的關(guān)系。下面我們來(lái)看一個(gè)卡方檢驗(yàn)在醫(yī)學(xué)實(shí)例中的應(yīng)用。
假設(shè)我們有一組數(shù)據(jù),記錄了某種癌癥的患病情況和年齡分布。數(shù)據(jù)如下表所示:
年齡段 | 患病人數(shù) | 未患病人數(shù) | 合計(jì) |
---|---|---|---|
20-39 | 35 | 65 | 100 |
40-59 | 65 | 135 | 200 |
60-79 | 55 | 145 | 200 |
80以上 | 45 | 55 | 100 |
合計(jì) | 200 | 400 | 600 |
我們的研究假設(shè)是,年齡與患癌癥的發(fā)生率之間存在關(guān)系。具體而言,我們想知道,不同年齡段的人群中,患癌癥的人數(shù)是否與預(yù)期相符,還是存在顯著差異。
為了回答這個(gè)問(wèn)題,我們需要進(jìn)行卡方檢驗(yàn)。具體步驟如下:
建立假設(shè):我們需要建立一個(gè)原假設(shè)和一個(gè)備擇假設(shè)。原假設(shè)是指不同年齡段的人群中,患癌癥的人數(shù)符合預(yù)期的分布。備擇假設(shè)是指不同年齡段的人群中,患癌癥的人數(shù)存在顯著差異。
一、基本公式法
實(shí)際頻數(shù)A,理論頻數(shù)T,Trc=行合計(jì)*列合計(jì)/總例數(shù)。
卡方值=∑((A-T)^2/T),自由度=(R-1)*(C-1)。
1.計(jì)算期望值:
例如:100*200/600=33.3333
年齡段 | 患病人數(shù)期望值 | 未患病人數(shù)期望值 |
---|---|---|
20-39 | 33.3333 | 66.6667 |
40-59 | 66.6667 | 133.3333 |
60-79 | 66.6667 | 133.3333 |
80以上 | 33.3333 | 66.6667 |
2.計(jì)算卡方值:
卡方值 =∑((A-T)^2/T)= Σ(觀察值 – 期望值)^2 / 期望值
例如: (35-33.3333)^2/33.3333=0.0833
年齡段 | 患病人數(shù)(A-T)^2 /T | 未患病人數(shù)(A-T)^2 /T |
---|---|---|
20-39 | 0.0833 | 0.0417 |
40-59 | 0.0417 | 0.0208 |
60-79 | 2.0417 | 1.0208 |
80以上 | 4.0834 | 2.0417 |
卡方值=0.0833+0.0417+0.0417+0.0208+2.0417+1.0208+4.0834+2.0417=9.3751
自由度=(4-1)*(2-1)=3
查卡方臨界值表,根據(jù)卡方值和自由度可以查找到對(duì)應(yīng)的臨界值和p值。在本例中,自由度為3,顯著性水平設(shè)為0.05。查表可得,卡方臨界值為7.81,因?yàn)榭ǚ街?#xff08;9.3751)大于臨界值(7.81),所以p值小于顯著性水平0.05,所以可以拒絕原假設(shè),接受備擇假設(shè),認(rèn)為不同年齡段的人群中,患癌癥的人數(shù)存在顯著差異。
二、行×列專用公式法
計(jì)算公式:
自由度=(4-1)*(2-1)=3
結(jié)論同基本公式法。
(卡方檢驗(yàn).醫(yī)學(xué)統(tǒng)計(jì)實(shí)例詳解 - 天蘭統(tǒng)計(jì)-醫(yī)學(xué)統(tǒng)計(jì)助手★卡方檢驗(yàn),t檢驗(yàn),F檢驗(yàn),秩和檢驗(yàn),方差分析)