• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

变量间的关系分析_R语言

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

1 变量间的关系分析


1.1 变量间的关系

  • 函数关系(确定性关系)数学模型
  • 相关关系(非确定性关系)统计学
    • 平行关系(相关关系)
      • 一元相关分析
      • 多元相关分析
    • 依存关系(回归分析)
      • 一元回归分析
      • 多元回归分析

1.2 案例分析①_单变量一元回归分析

1. 读取数据

x = c(171, 175, 159, 155, 152, 158, 154, 164, 168, 166, 159, 164)
y = c(57, 64, 41, 38, 35, 44, 41, 51, 57, 49, 47, 46)

2. 直观图示

#散点图看x,y关系
plot(x, y)

3. 两变量间统计量分析:

总体线性相关系数

ρ=Cov(x,y)var(x)var(y)=σxyσx2σy2\rho = \frac{Cov(x,y)}{\sqrt{var(x)var(y)}}=\frac{\sigma_{xy}}{\sqrt{\sigma_{x}^{2}\sigma_{y}^{2}}}

样本线性相关系数:

	样本化:样本矩代替总体矩(协方差与标准差)

{lxx=(xxˉ)2=x2(x)2)nlyy=(yyˉ)2=y2(y)2)nlxy=(xxˉ)(yyˉ)=xy(x)(y)n\left\{\begin{matrix} l_{xx}=\sum{(x-\bar{x})^{2}}=\sum{x^{2}}-\frac{(\sum{x})^{2})}{n} & & \\ l_{yy}=\sum{(y-\bar{y})^{2}}=\sum{y^{2}}-\frac{(\sum{y})^{2})}{n} & & \\ l_{xy}=\sum{(x-\bar{x})(y-\bar{y})}=\sum{xy}-\frac{(\sum{x})(\sum{y})}{n} & & \\ \end{matrix}\right.

r=SxySx2Sy2lxylxxlyy=(xxˉ)(yyˉ)(xxˉ)2(yyˉ)2r=\frac{S_{xy}}{\sqrt{S_{x}^{2}\cdot S_{y}^{2}}}=\frac{l_{xy}}{\sqrt{l_{xx} \cdot l_{yy}}}=\frac{\sum{(x-\bar x)(y-\bar y)}}{\sqrt{\sum{(x-\bar x)^2}\sum{(y-\bar y)^2}}}

4.建立一个离均差积和函数

{lxx=556.9lyy=813lxy=645.5\left\{ \begin{matrix} l_{xx}=556.9 & & \\ l_{yy}=813 & & \\ l_{xy}=645.5 & & \end{matrix} \right.

r=lxxlxxlyy=645.5559.6×813=0.9593r=\frac{l_{xx}}{\sqrt{l_{xx}l_{yy}}}=\frac{645.5}{\sqrt{559.6\times 813}}=0.9593

5.R语言中计算相关系数函数

  ***cor(x, y=NULL, method=c("pearson", "kendall", "spearman"))***
  
  x: 数值向量、矩阵或数据框
  y:空或数值向量、矩阵或数据框
  method: 计算方法,默认:pearson

计算pearson相关系数

cor(x, y)

6.建立假设检验

H0:ρ=0,H1:ρ0,α=0.05H_ 0:\rho=0,H_ 1:\rho \neq 0,\alpha=0.05

假设检验思想

tr(rρ)Srft_ r\frac{(r-\rho)}{S_ r}\sim f分布

tr=r01r2n2=0.959312210.95932=10.74t_ r=\frac{r - 0}{\sqrt{\frac{1-r^2}{n-2}}}=\frac{0.9593 \sqrt{12 - 2}}{\sqrt{1-0.9593^2}}=10.74

n = length(x)
tr = r/sqrt((1-r^2)/(n-2));tr

7.计算t值和p值,作结论

cor.test(x,y)    
	Pearson's product-moment correlation

data:  x and y

t = 10.743, df = 10, p-value = 8.21e-07

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:

0.8574875 0.9888163

sample estimates:

cor 

0.9593031 

**分析:
**
**p < 5
**

**95%区间估计为[0.8574875 0.9888163]
**

拒绝H0H_ 0

8. 一元线性回归模型的额参数估计

直线方程的模型:y^=a+bx\hat y=a+bx

b=lxylxx=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2b=\frac{l_{xy}}{l_{xx}}=\frac{\sum_{i = 1}^{n}{(x_ i - \bar x)(y_ i - \bar y)}}{\sum_{i = 1}^{n}{(x_ i - \bar x)^2}}


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
R语言数据去重发布时间:2022-07-18
下一篇:
R语言学习笔记(十五):获取文件和目录信息发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap