- SPSS 19.0统计分析综合案例详解
- 刘猛 李小园 封超
- 964字
- 2025-02-28 20:32:50
3.3 居民收入与储蓄关系分析
3.3.1 案例描述
由1997年《中国统计年鉴》可得中国城镇居民家庭人均生活费收入(X)和城镇储蓄(Y)两个变量数据如下所示。
城镇居民人均生活费收入(元):685.3 827.9 916.0 1 119.4 1 260.7 1 387.3 1 544.3 1 826.1 2 336.5 3 179.2 3 892.9 4 377.2
城镇储蓄(亿元):1 057.2 1 471.5 2 067.6 2 659.2 3 734.8 5 192.6 6 790.9 8 678.1 11 627.3 16 702.8 23 466.7 30 850.2
试对城镇居民人均生活费收入与城镇储蓄两变量配合最佳曲线模型。
3.3.2 操作步骤和结果分析
(1) 打开SPSS主界面,单击窗口下方的Variable View按钮,变量设置如图3-12所示。

图3-12 变量设置
(2) 单击窗口下方的Data View按钮,输入数据如图3-13所示。输入完成后,单击File菜单,选择Save As命令,保存为shouzhi.sav。

图3-13 输入数据
(3) 在菜单栏中依次选择Graphs→Interactive→Scatterplot命令,弹出Create Scatterplot对话框,如图3-14所示。

图3-14 Create Scatterplot对话框
(4) 从左侧的变量列表框中选择“城镇储蓄[Y]”选项,拖动鼠标使之进入纵轴框中;选择“城镇人均收入[X]”选项,拖动鼠标使之进入横轴框中,如图3-15所示。

图3-15 Create Scatterplot对话框设置
(5) 单击“确定”按钮,输出散点图,如图3-16所示。散点图显示出两变量呈现二次曲线或指数曲线或直线的关系,可对这3种模型分别进行配合,选择可决系数R2最大的那个模型最佳。

图3-16 散点图
(6) 在菜单栏中依次选择 Analyze→Regression→Curve Estimation 命令,弹出 Curve Estimation对话框,如图3-17所示。

图3-17 Curve Estimation对话框
(7) 从左侧的变量列表框中选择“城镇储蓄[Y]”选项,单击按钮使之进入Dependent(s)框中;选择“城镇人均收入[X]”选项,单击
按钮使之进入Independent中的Variabl框;选中Include constant in equation和Plot models复选框;在Models选项组中选中Linear、Quadratic和Exponential复选框;选中Display ANOVA table复选框,如图3-18所示。

图3-18 Curve Estimation对话框设置
(8) 单击Save按钮,弹出Curve Estimation: Save对话框,在Save Variables选项组中选中Predicted values、Residuals和Prediction inter复选框,如图3-19所示。单击Continue按钮返回到Curve Estimation对话框。

图3-19 Curve Estimation: Save对话框
(9) 上述步骤完成后,单击图3-18中的OK按钮,输出结果,如图3-20所示。

图3-20 结果输出窗口
(10) 输出线性模型分析表,如表3-7~表3-9所示。从中可以看出,可决系数R2=0.983。
表3-7 模型概览表

表3-9 相关系数表

表3-8 方差分析表

(11) 输出二次曲线模型分析表,如表3-10~表3-12所示。从中可以看出,可决系数R2=0.992。
表3-10 模型概览表

表3-12 相关系数表

表3-11 方差分析表

(12) 输出指数模型分析表,如表3-13~表3-15所示。从中可以看出,可决系数R2=0.878。
表3-13 模型概览表

表3-15 相关系数表

表3-14 方差分析表

(13) 由以上分析可知,3种模型的可决系数中最大的是二次曲线模型,因而,二次曲线模型为最佳配合模型。二次曲线模型可表示为:Y= - 1845.5+3.743X+0.001X2。3种模型的曲线如图3-21所示。

图3-21 各模型曲线图