mg冰球突破豪华版

English 美宝集团企业邮箱
icon_searchclose

第二节 计数资料的显著性检验

作者:徐荣祥 出版社:中国科学技术出版社 刊行日期:2009年7月

对于计数资料这些相对数我们只知它们的凹凸,不知其有无统计学意思,只有通过相对数的显著性检验方能明确。常用步骤为U检验与χ2检验。
一、率的u检验
率的u检验是利用领域较为广的一种显著性检验步骤,但是在用于样本率与总体率比力时,或两个样本率比力时,该当思考其差距是否由于抽样误差所造成的。大样本的样本率散布近似正态散布,可用正态散布的法规检验样本率与总体率或两个样本率差距的显著性。其判断尺度为:
201134134146425

(一)样本率与总体率的比力
样本率与总体率比力的主张是揣度该样本所代表的总体率与已知总体率是否一样。公式为:
201134134238523

p为样本率,π为总体率,σP为率的尺度误,由总体推算得出
示例343凭据临床经验,胃十二指肠溃疡患者中,通常情况下有20%的病人会产生胃出血症状,现某医院观察烧伤病人152例,其中48例伤前有过胃出血病史,问伤前患有胃十二指肠溃疡的烧伤病人是否容易产生胃出血 ?
【解题步骤】
可将该例中胃十二指肠溃疡患者有20%产生胃出血率视为总体率π(是把人们公认或经验数值作为总体率)。
1成立检验如果:如果患有胃十二指肠溃疡病的烧伤病人胃出血率(p)与通常胃十二指肠溃疡患者的出血率(π)无差距,即样本率(P)是由总体率(π)中随机抽取的,两者无差距。事实上,尝试钻研了局总是有两种情况:一种是接受所成立的检验如果,一种是回绝成立的检验如果。
①设前者为H0:π=π0;②设后者为H1:π≠π0。
2确立显著性水准:α=005
3推算u值:将示例343中数据代入公式(346):

20113413434565

4确定P值:由于u=358,而358>258,故P<001。
5揣度结论:在α=005水准上,回绝H0,接受H1,因P<001,所以有极度显著性差距,伤前患有胃十二指肠溃疡的烧伤病人,其胃出血率与通常胃十二指肠溃疡患者的出血率有性质差距,可以为患胃十二指肠溃疡的烧伤病人较通常胃溃疡患者容易产生胃出血。
(二)两个样本率比力的U检验
两个样本率比力的主张是揣度两个样本各自代表的两个总体率是否一样。常用U检验和χ2检验:
U检验推算公式:
201134134337764

示例344如某医院对1 329例烧伤病人进行应激性溃疡出血的预防性医治,有56例产生了胃出血,发病率为421%,1 670例伤情类似的病人未进行预防性医治,其出血率达832%,问两组样本应激性溃疡出血的发病率有无差距 ?
【解题步骤】
1成立检验如果:H0:π1=π2,H1:π1≠π2。
2确定显著性水平:α=005。
3推算u值:n1=1329,X1=56,P1=00421(56/1329),n2=1670,X2=139,P2=00823(139/1670)。
代入公式(349)、(3410)、(347):

201134134432557

4确定P值:因425>258,故P<001。
5揣度结论:在α=005的水准上,回绝H0,接受H1。因P<001,差距有高度显著性,故以为预防性医治组与对照组的应激性溃疡出血率有性质分歧,预防组应激性溃疡出血产生率低于对照组,预防医治有效。
二、χ2检验
χ2检验是英国统计学家Kpearson提出的,后经Yates校对改进,现已成为专用于两组百分率的常用显著性检验公式。“χ”为希腊字母,读音为“Kai”,故χ2检验法又称“卡步骤”。利用领域与U检验不齐全一样,前者重要针对样本率与总体率进行比力,也可用于两个样本率的比力;而χ2检验重要用于揣度两个及两个以上总体率(或组成比)之间的检验,查抄两个分类变量之间有无关系(或关联)。
(一)χ2检验根基公式与推算步骤
χ2检验的根基公式:
20113413455342

A为现实观察数,T为理论推算值, ∑(希腊字母,读音Sigma)暗示总和。举例诠释其步骤及道理。
示例345某医院对从前医治的烧伤并发败血症的病例进行回首性总结,205例大面积烧伤病人并发败血症的例数为43,而134例中等烧伤面积病人并发败血症的例数为13,问败血症的产生与烧伤面积有无关系 ?
【解题步骤】
1将调查资料列入表(表342)中:
201134134546603

2成立“检验如果”(无效如果),即如果大面积与中等面积烧伤组的败血症产生率之间没有性质差距,注明败血症的产生率(21%和97%)来自统一总体,这种差距是由抽样误差造成的。凭据这个如果,能够用两个组的计算发病率(165%)为如果的理论总体,并以此作为推算值的理论基础。
3推算各组的理论数T值:理论数值是凭据检验如果推论的两组病人数中应有的产生败血症人数,即两组都按165%患病率推算,该当有几多人患病与不患病。大面积烧伤组205人,乘以计算患病率165%,就是大面积烧伤组理论上该当产生败血症的人数(205×165%=3383),即为理论值;而未产生败血症的人数为(205-3383=17117)17117。同理,再求出中等烧伤面积组病人的理论值为2211,不产生败血症的理论值为(134-2211=11189)11189。
将推算的理论值汇入表343中。
201134134558785

4代入χ2值公式(3411)推算χ2值:
201134134622930

χ2值无单元,与它相应的概率为5%的χ2值(χ2 005)和概率为1%的χ2值(χ2001),可由卡方扼要界值表344中查出。
若是上述检验正确,A-T差值不会太幼,如A-T相差太大,检验如果成立的可能性就不大。
5凭据χ2值与自由度查χ2值表:首先确定自由度(df或n′或r,),因四格表中有四个理论值,只有吓酌乘除法求出任何一个,其余三个可用减法求出。这种必须吓酌乘除法求出理论值的格子数叫自由度。推算步骤:
n′=(行数-1)(列数-1),四格表中为两杏注两列,故:
n′=(2-1)(2-1)=1。
查扼要χ2值表(表344,或查有关书籍卡方界值表):当n′=1时,χ2005=663,本例χ2=747,大于663,已超过χ2005=663水平,但幼于χ20005=788水平,故P<001。
201134134727934

(二)四格表资料的χ2检验(两个样本率的比力)
四格表资料的χ2检验法是利用最为宽泛和最为方便的一种步骤,它所检验的仅是两个率的比力8J酵肌⒐胶土司峙卸铣叨热缦拢

20113413526979

4推算步骤:
(1)先将标题中的数据按四格表模式图大局造表分列(用现实数字,不用百分率)。
(2)代入公式(3412),推算χ2值,χ2值是统计值,数值越大统计意思越大。
(3)凭据χ2值的大幼,按P值判断标正确定P值大幼。
(4)做出统计结论。
示例346用甲法医治大面积烧伤(甲组)71例,有52例并发全身性习染,用乙法医治的大面积烧伤(乙组)42例,有3例并发全身性习染。问两组习染产生率有无统计学差距 ?
【解题步骤】
1按四格表模式沉新造表(表347):

20113414451204

2推算χ2值(公式342):
201134135243921

3推算自由度:由于自由度(n′)=1{(行-1)(列-1)=(2-1)(2-1)},故本钻研自由度为1(1×1)。
4按表344标正确定P值:因χ2值在384和663之间,故P<005,组间有显著性差距。
5了局判断:因P<005,注明乙法医治的大面积烧伤病人并发全身性习染的机遇低于甲组。
(三)行×列表资料的χ2检验
以上讲的是两个样本率的检验,用四格表法,但当行数或列数大于2时,该当用行×列表资料的χ2检验,又称R×C表资料8剑
201134135254593

A为各格子的现实频数,nR、nC为各现实频数所对应的行的计算数和列的计算数,N为总计算数。
该公式是由根基公式转换而来,不必要求理论频数,方便实用。
示例337甲乙丙三所医院同期对某药进行抗习染疗效观察,甲院观察了29例,有效(23例)率为793%,乙院观察了44例,有效(14例)率为318%,丙医院观察了11例,有效(3例)率为273%(资料见表348)。问3所医院抗习染医治的总体有效率是否有显著意思 ?

20113414451297

【解题步骤】
1成立检验如果:H0:3所医院的有效率相称,π1=π2;H1:3所医院的有效率不相称,H1:π1≠π2。
2确定显著性水平:α=005。
3凭据χ2根基推算公式(3413)推算χ2值:
201134135314745

4确定自由度(n′)=(2-1)(3-1)= 2。
5查χ2值表确定P值:查表344可知,χ2005(2)=1060,今χ2=17907,>χ20005(2),故P<0005。
6揣度结论:在α=005水准上,回绝H0,接管H1,故该药在三所医院的抗习染成效存在统计学差距(P<0005)。
(四) 二列多格资料χ2值检验
二列多格资料χ2值检验也称多个样本率的比力,其主张是揣度它们所代表的总体率是否相称。该类资料的根基数据有R行(样本个数),2列(指样本的阳性数与阴性数),所以又叫R×2列联表或列联表(contingency table)。
公式同根基公式(3413),推算出的资料能够进行有关分析。
示例348(百分比相互比力):某医院观察严沉烧伤病人早期延长医治对休克产生率有无影响,观察功夫别离为伤后大于18幼时(甲组)、伤后6~18幼时(乙组)和6幼时以内(丙组)3个接受医治幼组,了局汇于表349中。问延长医治对烧伤休克的产生率有无统计学差距,或相互之间有无关联 ?
20113414451999

【解题步骤】
1成立检验如果:设H0:三种分歧医治功夫休克产生率相称;设H0:π1=π2;三种分歧医治功夫休克产生率不齐全相称,H1:π1≠π2。
2确定显著性水平:α=005。
3推算χ2值:将表349中的数字代入公式3413,得:
201134135357293

4推算自由度:(n′)=(2-1)(3-1)= 2。
5确定P值:因n′=2,查χ2值表(344),χ20005(2)=1060,本钻研χ2=24776>χ20005(2)(1060)水平,P<0005。
6揣度了局:在α=005水准上,回绝H0,接受H1,因P<0005,差距有高度显著性,故以为严沉烧伤病人早期接受医治对休克产生率有显著影响作用,即可降低休克产生率。
7为了进一步注明它们之间的亲昵关联水平,可凭据公式推算关联系数:
201134135417961

凭据四格表的pearson列联系数值r在0~1之间。r值愈靠近0,注明两个分类变量的关系愈弱,r值愈靠近1,注明关系愈亲昵。由于r=0462,注明延长医治功夫与休克产生率拥有肯定的关联性。
示例349(样本结构比相互比力):某院2004年收治赤子烧伤145例,致伤成分:热液150例,火焰10例,电流7例,其他23例;成人烧伤188人,致伤成分:热液50例,火焰48例,电流18例,其他72例(资料见表3410),问赤子烧伤原因与成人烧伤原因相互之间是否有关联性 ?
201134135540820

【解题步骤】
1成立检验如果和确定显著性水平:①设H0:两组病人伤因组成相称,H0:π1=π2;②设H1:两组病人伤因组成不齐全相称,H1:π1≠π2。
2显著水平:α=005。
3推算χ2值:可将表3410中的数字代入公式(3413),得:
201134135440633

4推算自由度:(n′)=(2-1)(4-1)= 3。
5确定P值:n′=3,查χ2值表(344),χ20005(3)=1284,今χ2=7014,故P<0005。
6揣度了局:在α=005水准上,回绝H0,接受H1,因P<0005,差距有极度显著意思,故以为赤子烧伤病人的致伤成分组成迸纂成人分歧,注明赤子以热液烫伤多见,其他伤因组成比低于成人组。
7为了进一步注明它们之间的亲昵关联水平,可凭据公式3414推算关联系数:
201134135451700

由于r=0417,注明儿童烧伤伤因与成年人烧伤伤因之间拥有肯定的关联性。由于儿童热液烫伤产生率为724%,成人热液烫伤产生率为266%,两者是否存在显著性差距,必要进行两两比力方可明确。
(五) 多列多格资料χ2值检验
临床时时遇到3组或3组以上的多格资料,其推算步骤仍以公式(3413)为基础 。现举例注明:
示例3410(计数资料有关分析):某烧伤中心观察了176例吸入性危险病人的分歧伤情与呼吸难题的各自例数,问呼吸难题程杜纂吸入危险伤情之间有无关联性(数据资料汇于表3411中) ?
201134135555134

【解题步骤】
本例的设计和分析主张与上述例子分歧。它并非是两个样本率与总体率、多个样本率与总体率或组成比之间的比力,而是单一样本自身的比力,每个对象别离按两种标志分级(伤情与呼吸难题),属于双相率的推算,主张是揣摩两种标志之间有无有关性。
1成立检验如果:①设H0:呼吸难题程杜纂吸入性危险水平无关;②设H1:呼吸难题程杜纂吸入性危险程杜仔关。
2确定显著水准:α=005。
3推算χ2值:将表3411中的数字代入公式3413,得:

201134135742939

4推算自由度:(n′)=(3-1)(3-1)= 4。
5确定P值:n′=4,查χ2界值表(324),χ20005(4)=1486,本钻研χ2=179623,>χ20005(4)(1486)水准,P<0005。
6揣度了局:在α=005水准上,回绝H0,接受H1,因P<0005,差距有高度显著性,故以为呼吸难题程杜纂吸入性危险水平关联亲昵。
7为了进一步注明它们之间的亲昵关联水平,可凭据公式(3414)推算关联系数:

20113413586408

由于r=07316,注明呼吸难题程杜纂吸入损水平拥有显著的关联性,即吸入危险越沉,呼吸难题越严沉。
(六) 配对计数资料的χ2检验

计数资料的配对设计常用于两种检验步骤,如造就步骤、诊断步骤的比力。其特点是对样本中的各观察单元别离用两种步骤处置,而后观察两种步骤的了局。此类资料可用配对χ2检验,比力两个率之间是否有差距。从配对设计来说,配对计数资料与前边所介绍的配对计数资料是一样的,都是把两种处置成分别离施加于前提类似的受试对象上,或先后施于统一对象上。配对纪录试验了局如为计量资料,即属计量配对资料;若了局为计数资料,即属于计数配对资料。配对计数资料的χ2检验蕴含两个内容:①分析它们的有关关系;②分析处置了局有无差距。
示例3411:100个深Ⅱ度烧伤创面,每个创面别离用两种步骤(甲法与乙法)诊断。了局:甲法阳性者为67个,乙法阳性者50个;其中甲乙两法均阳性者(a)39个,甲乙两法均阴性者(d)22个,甲法阳性乙法阴性者(d)28个,乙法阳性甲法阴性者(c)11个(资料见表3412)。问甲乙两种步骤的诊断了局有无关联及统计学差距 ?
【解题步骤】
第一步:分析两种诊断了局有无有关关系,每个对象按两种处置结构分组,故可用四格χ2检验公式推算,揣度两种诊断步骤之间有无有关关系:
1成立检验如果:①设H0:甲乙诊断步骤之间无关;②设H1:甲乙诊断步骤之间有关。
2确定显著水准:α=005。

20113414256214

3推算χ2值:将表3412中的数字代入公式3412,得:

201134135926410

4推算自由度:(n′)=(2-1)(2-1)=1。
5确定P值:n′=1,查χ2值表(344),χ2005=3841,χ2001=6635,本钻研6揣度了局:在α=005水准上,回绝H0,接受H1,因P<005,差距有显著性,故以为两种诊断水平关联亲昵。
第二步:推算两种处置了局有无差距:推算公式为(3415):
2011341404297

1成立检验如果:①设H0:两总体b=c;②H1:两总体b≠c。
2确定显著水准:α=005
3推算χ2值:将表3412中的数字代入公式3415,得:
20113414039461

4自由度:n′=1。
5确定P值:n′=1,查χ2值表(344),χ2005=3841,χ2001=6635,本钻研χ2=6564,介于χ20005和χ2001水准之间,故P<005。
6揣度了局:在α=005水准上,回绝H0,接受H1,因P<005,差距有显著性,故以为甲乙两种诊断步骤简直诊率分歧,甲法简直诊率高于乙法。
7关联性分析:凭据公式3414推算关联系数:
2011341419826

由于r=0629,注明甲乙两种步骤的诊断了局关联性较强,甲法优于乙法。
(七)两个幼样本的χ2检验步骤
由于χ2检验是以一条光滑曲线为基础,大样本所得的概率与其真正概率很靠近。当为幼样本时,如n<40(有人以为n<50)时,用前边讲的大样本比力的u检验或χ2检验公式推算了局都不正确,或偏倚较大,必要选取幼样本校对公式推算。两个幼样本的检验步骤有两种:一种是样本(n)偏;一种是四格表中有理论频数中出现0或1时。现举例注明:

1幼样本校对公式(3416):
20113414119880

示例3312:用甲乙两种药物医治糖尿病坏疽创面各30个,甲药组瘢痕产生率为70%,乙药组癜痕产生率为50%。问两组之间的疗效有无统计学差距 ?
【解题步骤】
(1)凭据题中数据列表3413:
20113414314908

(2)将表3413中数字代入公式(3416),得:
20113414451399

(3)了局判断:因n′=1,χ2值=7050<χ2001(6635),故P<001。组间有极度显著差距。
(4)结论:甲药医治的创面瘢痕产生率低于乙药医治组。
幼样本率的χ2公式推算了局优于大样本率的χ2公式,尤其在其他检验公式所得概率靠近检验水定时,宜用幼样本率的χ2公式。目前很多统计学者以为:①幼样本率的χ2公式误差最幼,最为常用;②从前有一种误会,只有当例数幼于30时,或理论频数幼于5时,χ2原公式推算值中有误差,不然不用进行校对。实际证明,只有是判断P=005或P=001的显著检验,用校对公式注定优于根基公式,即便例数大于30,或理论频数大于5,选取校对公式也比χ2原推算步骤误差幼。
2 两组数据中有1或0的幼样本资料推算:前边已叙述了幼样本率的χ2推算公式与步骤,但在现实工作中,幼样本资料时时出现理论频数幼于1的情况,即T<1。这种资料不宜用幼样本推算公式推算,更不能用四格表公式推算,但宜用四格表确切概率法推算。确切概率法是由RAFisher提出的,故又称Fisher确切概率检验。此法本不属于χ2检验领域,但可作为四格表资料如果检验的补充。介绍如下:
确切概率法各类组合概率的推算公式(3417)为:
20113414214788

式中a、b、c、d的意思同表345,!为阶乘符号,N!=1×2×3×4×…×N,数学上划定!=1。通常推算器不能推算N≥70的阶乘,这种情况下用对数推算。
四格表中|A-T|值的特点:①各格相称,如表3414的A-T,a、d两格均为-14,b、c两格均为+14,其绝对值相称。因而推算某一四格表的|A-T|值时,只需推算表中任一格的|A-T|值即可;②顺次增减四格表中任何一格的数据,可列出周边计算不变前提下各类组合的四格表,如示例3413中的五个四格表,别离推算其|A-T|值,列于表下。由此可见,两侧的|A-T|值较大,而中央的较幼。
各类组合下累计概率的推算:①双侧检验:按公式3417别离推算两侧所有|A-T|值的各四格表的P值,而表态加,即为双侧检验的P值;②单侧检验:按钻研主张,只推算一侧的所有|A-T|值蹬宗及大于样本|A-T|值得四格表的P值,而表态加,即为单侧检验的P值。
示例3313:某医生用新旧两种步骤医治烧伤后血虚病人共计27例,了局汇于表3414中,问新旧药物的疗效有无差距 ?
20113414327764

【解题步骤】
(1)成立检验如果:H0:新药与旧药治愈率相称,即π1=π2;H1:新药与旧药治愈率不相称,即π1≠π2。
(2)确定显著水准:α=005。
(3)推算概率P:本组N=25<40,且又T<5,故宜用确切概率法。由表3414可见,最幼周边计算数为4,故所有可能的组合有5种,别离为:
20113414448962

(4)确定P值,做出揣度结论:P值应蹬宗所有幼于样本点的各类概率之和,本例切合样本点要求者为(1)、(2)、(5),因而,P值的组合为上述三点之和,即P=00166+01423+01079=02668。按α=005水准,P>005。不能以为两种疗法的治愈率有统计学差距。
3查四格表显著性检验用表(C值表)法:此步骤轻便易行,本文不再叙述,可参照有关资料查问。

【网站地图】