搜索
您的当前位置:首页卫生统计习题软件分析教程习题SPSS01

卫生统计习题软件分析教程习题SPSS01

来源:乌哈旅游
 第一篇 认识数据

二、综合分析题

1.(1)编制生命质量评分数据的频数分布表并绘制直方图,概括描述其分布特 征。 【操作】

1)建立数据库:激活SPSS的数据编辑窗口,单击窗口左下角的Variable View,定义变量名score,如图1-1-1所示。点击菜单File→Save as,以“综合分析1-1.sav”文件名保存。

图1-1-1 SPSS的Variable View窗口

2)输入数据:点击数据编辑窗口左下角的Date View,按顺序输入数据,如图1-1-2所示。

图1-1-2 SPSS的Date View窗口

3)重新分段编码:点击Transform菜单下的Recode into Different Variables,如图1-1-3所示,

系统弹出Recode主对话框,将变量“score”选入Input Variable →Output Variable框中,在Output Variable框中输入新变量名“subscore”,在Lable栏中输入“分组”,单击Change,如图1-1-4所示。

图1-1-3 Transform → Recode into Different Variables操作

图1-1-4 Recode 主对话框

单击Old and New Values,系统弹出Old and New Values子对话框。根据手工分组,最小值为27,最大值为189,极差为162,分为9组,组距为10,第一组为20~39,第二组为40~59,依此类推。在Old Value的Range栏中输入组下限,在through栏中输入组上限,在New Value的Value栏输入对应的新变量值,单击Add,Old→New框中就会加入赋值的内容,如图1-1-5所示,完成后单击Continue,再单击OK,系统就会按要求生成新变量“subscore”。

图1-1-5 Old and New Values子对话框

4)绘制频率分布表和直方图:点击Analyze菜单中的下的Descriptive Statistics子菜单,选择Frequencies选项,如图1-1-6所示,系统弹出Frequencies主对话框,点击变量subscore进入Variable(s)框内,如图1-1-7所示。单击Frequencies主对话框中的Charts,弹出Charts子对话框,如图1-1-8所示。在Chart Type区域内,选择Histograms和With normal curve,单击Continue返回,再单击OK,输出结果。如果对图形不满意,可双击图形进入图形编辑状态进行调整。

图1-1-6 Descriptive Statistics→Frequencies

图1-1-7 Frequencies 主对话框 图1-1-8 Charts子对话框

【结果】

输出结果如下:

表1-1-1 频率分布表

Valid

1 2 3 4 5 6 7 8 9 Total

Frequency

1 2 5 22 18 49 50 32 10 189

Percent

.5 1.1 2.6 11.6 9.5 25.9 26.5 16.9 5.3 100.0

Valid Percent

.5 1.1 2.6 11.6 9.5 25.9 26.5 16.9 5.3 100.0

Cumulative Percent

.5 1.6 4.2 15.9 25.4 51.3 77.8 94.7 100.0

图1-1-9 直方图 (2)利用原始数据,选用合适的统计指标描述生命质量评分的平均水平和变 异程度。 【操作】

1)正态性检验:单击Analyze菜单下的Nonparametric Tests子菜单,选择1-Sample K-S,如图1-1-10所示。系统弹出1-Sample K-S Test对话框,将score选入Test Variable List中,结果如表1-1-2,P>0.05,符合正态分布。

图1-1-10 Analyze→Nonparametric Tests→1-Sample K-S

图1-1-11 1-Sample K-S Test对话框

表1-1-2 One-Sample Kolmogorov-Smirnov Test

N

Normal Parameters Most Extreme Differences

a,b

生命质量评价得

189

Mean Std. Deviation Absolute Positive Negative

135.77 30.599 .069 .046 -.069 .943 .336

Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. b. Calculated from data.

2)用均值和标准差描述平均水平和变异程度:在图1-1-11中选择options,系统弹出1-Sample K-S:Options子对话框,如图1-1-12所示,勾选Descriptive,点击Contimue,再点击OK,结果如表1-1-3。

图1-1-12 1-Sample K-S:Options子对话框 表1-1-3 Descriptive Statistics 生命质量评价得分 N 189 Mean 135.77 Std. Deviation 30.599 Minimum 27 Maximum 189 (3)利用频率表计算𝑥̅、s、P25、P50 及P75。 Xf1X1f2X2f3X3fkXkf1f2f3fkfXf 其中k:频数表的组段数;f :频数;X:组中值=(本组段下限值+下组段下限值)/2。 x1=(20+40)/2=30,x2=(40+60)/2=50,…… 𝑥̅ =(1×30+2×50+5×70+22×90+18×110+49×130+50×150+32×170+10×90)/189=135.71 S=√2−∑𝑓𝑥0(∑𝑓𝑥0)2𝑛𝑛−1=31.30(x0为组中值) 中位数P50=120+20×[(189x50%-48)/49]=138.98 PXLXiX(nX%fL)fX P25=100+20×[(189x25%-30)/18]=119.17 P75=140+20×[(189x75%-97)/50]=157.90 (4)利用原始数据与利用频数分布表计算相同的统计指标,结果是否相同? 为什么?

答:结果同但接近。因为频率表法计算的结果是原始数据的近似值,概括了原始数据的信息,虽然不如原始数据精确,但在样本量很大而计算工具不可及时,仍可通过手工计算,较为方便地得到近似的统计指标。

2.调查测定某地107 名成年人尿铅含量(mg/L)如下,某研究者用均数和标准差描述数据的集中位置和离散程度,是否恰当?为什么?

答:不恰当。均数和标准差适用于对称分布,特别是正态分布资料,该资料明显为偏态分布,应该用中位数和四分位数间距分别描述集中位置和离散趋势。 【操作】

用SPSS检验其正态性: 1)录入数据,如图1-2-1所示。

图1-2-1 录入数据

2)加权:点击Date菜单中的下的Weight Cases,如图1-2-2所示。在弹出的对话框中选

择Weight Cases by,将number选入Frequency variable框中,如图1-2-3所示。结果见表1-2-1,p<0.05,不符合正态分布。

图1-2-2 Date→ Weight Cases

【结果】

表1-2-1 One-Sample Kolmogorov-Smirnov Test

N

Normal Parameters Most Extreme Differences

a,b

number

107

Mean Std. Deviation Absolute Positive Negative

19.73 7.246 .171 .118 -.171 1.765 .004

Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)

a. Test distribution is Normal.b. Calculated from data.

图1-2-3 输出的分析结果

3.(1)求上述数据的IQR。 【操作】

1)数据准备:如图1-3-1所示。

图1-3-1 数据准备

2)统计分析:点击Analyze菜单下的Descriptive Statistics子菜单,选择Frequencies选项,系统弹出Frequencies主对话框,如图1-3-2所示。

图1-3-2 Analyze→Descriptive Statistics→Frequencies

点击变量“x”进入Variable(s)框内,如图1-3-3所示。单击Statistics,弹出Statistics子对话框,在Percentile Values框下勾选Quartiles项,如图1-3-4所示。单击Continue返回,再单击OK,输出结果。

图1-3-3 操作过程

图1-3-4 操作过程中的选项选择

【结果】

结果如图1-3-5所示,四分位数间距=P75-P25=32.055

图1-3-5 输出的分析结果

(2)用1.5×IQR 计算离群值。 【操作】

1.5×32.055=48.0825 P75+48.0825=179.68 P25-48.0825=51.46

则大于179.68和小于51.46者为离群值。将数据按大小顺序排序,如图1-3-6所示,找到离群值180.08。

图1-3-6 右键单击→Sort Ascending或Sort Descending

(3)利用上述数据绘制箱式图并识别图中离群值,验证(2)的计算结果。 【操作】

1)数据准备:输入数据。

2)绘制绘制箱式图:点击Graphs菜单下的Legacy Dialogs子菜单,选择Boxplot选项,如图1-3-7

所示,系统弹出Boxplot预定义对话框,在Data in Chart Are单选框内选择Summaries for groups of cases,如图1-3-8所示。

图1-3-7 Graphs→Legacy Dialogs→Boxplot

图1-3-8 Boxplot预定义对话框

单击Define,弹出DefineSampleBoxplot: Summaries for groups of cases对话框:选中变量“x”将其送入Variable框,选中变量“类型”将其送入Category Axis框,如图1-3-9所示,单击OK,输出结果,如图1-3-10所示,有一个离群值,与(2)相符。(注:此处添加了变量“类型”以画出箱式图,若无此变量则无法点击OK)

图1-3-9 DefineSampleBoxplot: Summaries for groups of cases对话框

图1-3-10 箱式图

(4)尝试移除离群值,计算并比较移除前后的算术均数,探索离群值对数据 集中位置的影响。 【操作】

1)在图1-3-4中勾选Mean,得到未移除离群值前的算术均数,如图1-3-11所示。

N

Valid Missin g

Mean

120 8

114.4453

图1-3-11 Statistics(移除离群值前)

2)在数据比较少的情况下,可以排序后直接删除离群值。或者用以下方法:点击Data菜单下的Select Cases,如图1-3-12所示。弹出Select Cases对话框,如图1-3-13所示,选择If condition is satisfied,选择Delete Unselect Cases.点击if,在弹出的子对话框中限定x的范围,如图1-3-14所示。

图1-3-12 操作过程

图1-3-13 操作过程-选择记录

图1-3-14 操作过程-选择记录的条件

3)用1)中方法得到移除离群值之后的算术均数,如图1-3-15所示。由于移除了偏大的离群值,算术均数较之前变小。

N

Valid Missing

Mean

119 0

113.8937

图1-3-15 Statistics(移除离群值后)

4.略

5.(1)以非惯用手数据为X 轴,惯用手数据为Y 轴,分别对普通人和篮球运动

员绘制散点图,观察散点形状,识别是否有异常点,判断非惯用手和惯用手骨骼强 度的关系是否近似线性。 【操作】

1)数据准备:输入数据。如图1-5-1所示

图1-5-1 数据

2)拆分数据:点击Data菜单下的Splite File,如图1-5-2所示,在弹出的Splite File对话框中选择Organize output by groups,将Group选入Group Based on框中,如图1-5-3所示,点击OK。

图1-5-2 Data→Splite File

图1-5-3 Split File 对话框

3)绘制散点图:点击Graphs菜单下的Legacy Dialogs子菜单,选择Scatter/Dot选项,如

图1-5-4所示,系统弹出Scatter/Dot预定义对话框,选择Simple Scatter,如图1-5-5所示。

图1-5-4 Graphs→Legacy Dialogs→Scatter/Dot

图1-5-5 Scatter/Dot预定义对话框

单击Define,弹出Simple Scatterplot对话框,选择变量“used”进入Y Axis,选择变量“non_used”进入X Axis,如图1-5-6所示,单击OK,输出结果,如图1-5-7和1-5-8所示。

图1-5-6 Simple Scatterplot对话框

【结果】

图1-5-7 普通人惯用手和非惯用手数据散点图

图1-5-8 篮球运动员惯用手和非惯用手数据散点图

(2)分别分析普通人和篮球运动员惯用手和非惯用手骨骼强度间的相关关系。

【操作】

点击Analyze菜单下的Correlate子菜单,选择Biveriate选项,如图1-5-9所示,系统弹出Biveriate Correlations主对话框,选择变量“used”“non_used”将其送入Variables框内;在Correlations Coefficients复选框组中选择系统默认的Pearson,如图1-5-10所示,再单击OK,输出结果。

图1-5-9 Analyze→Correlate→Biveriate

图1-5-10 Biveriate Correlations主对话框

【结果】

结果如图1-5-11所示,group1为普通人组,group2为篮球运动员组。

图1-5-11 相关系数

(3)分别对普通人和篮球运动员:以非惯用手骨骼强度作为解释变量,惯用手骨骼强度作为反应变量,使用最小二乘法建立并解释回归方程,然后将回归拟合线添加到之前绘制的散点图上。 【操作】

1)点击Analyze菜单下的Regression子菜单,选择Linear选项,如图1-5-12所示,系统弹出Linear Regression主对话框,选择变量“used”将其送入Dependent框中,选择变量

“non_used”将其送入Independent(s)框内;在Method下拉列表中选择系统默认的Enter,如图1-5-13所示,再单击OK,输出结果。

图1-5-12 分析过程

图1-5-13 变量的调入

【结果】

普通人组结果如图1-5-14所示;篮球运动员组结果如图1-5-15所示。

图1-5-14 分析结果(1)

图1-5-15 分析结果(2)

(3)回归方程::Ŷ (普通人组)=0.505+0.875X Ŷ (篮球运动员组)=6.302+0.459X

4

(4) 一名普通成年男性和一名篮球运动员的非惯用手骨骼强度均为16cm/1000,使用对应

的回归方程预测他们的惯用手骨骼强度,比较预测值并思考两者的差异如何反应投篮训练对骨骼强度的影响。

答:Y(普通人)=0.505+0.875×16=14.505

Y(篮球运动员)=6.302+0.459×16=13.646

非惯用手骨骼强度相同的情况下,运动增加了惯用手骨骼强度。

(5)使用对应的最小二乘回归方程,计算表1-2(见教材)中1、2、3、4、16、17、18和19 号观测对象的残差。

答:残差=Y- Ŷ,各观察对象残差如图1-5-16:

ID 1 2 3 4 16 17 18 19 惯用手 15.7 25.2 17.9 19.1 17 16.9 17.7 21.2 非惯用手 16.3 26.9 18.7 22 19.3 19 25.2 37.7 Ŷ 残差 14.7675 0.9325 24.0425 1.1575 16.8675 1.0325 19.755 -0.655 15.1607 1.8393 15.023 1.877 17.8688 -0.1688 23.6063 -2.4063 图1-5-16 残差分析结果

因篇幅问题不能全部显示,请点此查看更多更全内容

Top