【相关系数r的计算公式是什么】在统计学中,相关系数(Pearson相关系数)是衡量两个变量之间线性关系密切程度的一个重要指标。它可以帮助我们判断两个变量是否呈正相关、负相关或无明显相关性。相关系数的取值范围在-1到+1之间,数值越接近1或-1,表示两者的线性关系越强。
一、相关系数r的定义
相关系数r(Pearson correlation coefficient)是通过以下公式计算得出的:
$$
r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}
$$
其中:
- $ x_i $ 和 $ y_i $ 是第i个样本的两个变量值;
- $ \bar{x} $ 和 $ \bar{y} $ 分别是变量x和y的平均值;
- 分子为协方差的计算部分;
- 分母为标准差的乘积。
二、相关系数r的含义
| r值 | 含义 |
| 1 | 完全正相关 |
| 0.7~1 | 强正相关 |
| 0.3~0.7 | 中等正相关 |
| 0 | 无相关性 |
| -0.3~-0.7 | 中等负相关 |
| -0.7~-1 | 强负相关 |
| -1 | 完全负相关 |
三、相关系数r的计算步骤
1. 收集数据:获取两个变量x和y的成对观测值。
2. 计算均值:分别求出x和y的平均值 $ \bar{x} $ 和 $ \bar{y} $。
3. 计算分子部分:对每一对数据点,计算 $ (x_i - \bar{x})(y_i - \bar{y}) $ 的总和。
4. 计算分母部分:分别计算 $ \sum (x_i - \bar{x})^2 $ 和 $ \sum (y_i - \bar{y})^2 $,然后取它们的平方根乘积。
5. 代入公式计算r:将分子与分母相除,得到相关系数r。
四、相关系数r的应用场景
- 市场分析:分析销售额与广告投入之间的关系。
- 金融投资:评估不同股票之间的相关性,用于资产组合优化。
- 医学研究:研究药物剂量与疗效之间的相关性。
- 教育评估:分析学生考试成绩与学习时间的关系。
五、注意事项
- 相关系数只能反映线性关系,不能说明因果关系。
- 数据需要满足正态分布、线性关系和等方差性等前提条件。
- 若数据存在异常值,可能会影响相关系数的准确性。
六、表格总结
| 项目 | 内容 |
| 名称 | 相关系数(Pearson相关系数) |
| 公式 | $ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} $ |
| 范围 | -1 到 +1 |
| 含义 | 衡量两个变量之间的线性相关程度 |
| 应用 | 市场分析、金融、医学、教育等领域 |
| 注意事项 | 只能反映线性关系,不能说明因果关系 |
通过以上内容,我们可以更清晰地理解相关系数r的计算方法及其实际应用价值。在进行数据分析时,合理使用相关系数有助于我们更好地把握变量之间的关系。


