自考“社会调查原理与方法”笔记(29)
2.根据统计表资料计算标准差,包括
<1>单值分组资料计算标准差,计算公式与原始资料计算标准差相同。
∑f(Xmid-X)2
n
<2> √
σ=
组距资料计算标准差,计算公式为:
三、相对差异量数
1.离散系数,是标准差与算术平均数的比值,是一个相对数,不受单位限制,离散系数越大,数据的离散程度越大,集中量数的代表性越小,限制:离散系数的比较只限于定距资料。
σ
X
公式:CV= ×100%
2.标准分数,作用(1)表明原始数据在总体分布中的相对位置;(2)对不同的各原始数据进行比较。(3)能测定相同或不同总体内个案的相对位置,并进行比较,是比较分析的有力工具。
X-X
σ
计算公式:Z=
第四节 相关与回归分析
一、相关分析的意义和测定方法
1.相关分析含义:是通过计算两个变量的相关系数来判断两个现象是否有联系以及联系的密切程度,只是对客观事物的一种描述。
2.散点图,横坐标代表一个变量,纵坐标代表另一个变量,对各资料依次用坐标点绘于图上,这图称为散点图,可以说明变量间有无线性相关关系、相关的方向,不能精确地说明变量之间的密切程度。
3.相关系数的计算方法
<1>相关系数是表明变量间关系密切程度的量数,符号为r,取值范围在-1到+1之间,具体取值为:
(1)r=-1,完全负相关;(2)r=1,完全正相关;(3)r=0,无相关;(4)r是负值,说明随着X变量的增大,Y变量减小,两个变量变化的方向相反;(5)r是正值,说明随着X变量的增大,Y变量也随着增大,两个变量变化的方向相同;(6)|r|=0.7-1.0之间认为两变量具有高度相关;(7)|r|=0.3-0.7之间认为两个变量之间具有中度相关;(8)|r|=0-0.3之间认为是低度相关。
n∑XY-(∑X)·(∑Y)
[n∑X2-(∑X)2]·[n∑Y2-(∑Y)2]
<2> √
相关关系的计算公式:r=
二、回归分析的意义和方法
1.含义:是对有相关关系的对象,根据关系的形态选一合适的数学模型用来近似地表达变量间平均变化关系;具有推理性质和因果性,是单向的,可以进行预测。
2.一元回归模型和计算
<1>散点图上坐标点在统计上可以用一条直线表示,即回归直线,但每条直线与实际值都有一定的偏差。因此回归计算目的是找出一条更佳回归线,使它与实际数值的偏差为更小。
n∑XY-(∑X)·(∑Y)
n∑X2-(∑X)2
数学模型为:Y=a+bX(其中a为直线在Y轴上的截距,b为直线的斜率,也称回归系数,标准方程为:
b=
a=Y-bX
∑Y=na+b∑X
∑XY=a∑X+b∑X2