了解事物之间的相互关系可以丰富你的信息,让你了解真相,使你立于不败之地。
发现事物之间的相互关系:相关与回归。
数据类型探讨
单变量数据考虑的是一个单一变量的频数或者概率。
二变量数据给出两个变量的数值,如果其中一个变量以某种方式受到控制,或者被用来解释另一个变量,则这个变量被称为自变量或者解释变量,另一个变量则称为因变量或者反应变量。
二变量数据可视化
散点图或者散布图,描述二变量数据。
散点图显示出数据对之间的相关性。

相关关系与因果关系
两个变量存在相关关系并不一定意味着一个变量会影响另一个变量,也不意味着二者存在实际关系。
用最佳拟合线预测数值
能最好地接近所有数据点的线被称为最佳拟合线。
误差最小化

误差平方和

最小二乘回归总结


用相关系数衡量直线与数据的拟合度

相关系数计算公式

要点

总结
1回归和相关的概念
2线性回归的确立
3最小二乘法的应用
练习

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。