• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

R语言Spark大数据分析/可视化环境配置/部署教程(sparklyr、hadoop) ...

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

R软件本身软件可以处理的数据量其实对于一些喜欢用R处理数据的有一些局限性,但是R现在也可以部署大数据环境,过程虽然比较艰辛,但结果是安逸的。

 

最开始我们需要下载配置环境,配置环境小编把分为两部分:

1、外部环境配置文件(java、spark);2、Rstudio中配置

1.1 java下载、安装,选择适合你系统的就可以; 

1.2安装好java后我们需要做的一件重要的事就是系统环境变量配置,至关重要的点就是这里

1.3在这个系统变量中添加java_home变量,它的值为jdk文件的根路径,如截图中的java_home 

1.4在 在这个系统变量中双击打开path变量,在编辑环境变量中添加jdk、jre的路径

1.5 配置完成后,打开电脑命令窗口,就是win+r,输入cmd回车,在命令窗口分别输入java、java若都有返回即可

1.6 spark下载,下载完成后配置spark所需系统环境,spark配置系统环境变量与java类似,同样需要添加spark_home变量,在path中加入环境变量,但并不是你的spark文件路径,而是%SPARK_HOME%\bin,这样外部环境就算是配置完成。

2.1 Rstudio内部环境,这里面了,先点击窗口中的connections,添加,选择spark,可以根据提示进行,但是这样容易报错,建议是把相关包加载后进行,相关的包如:sparklyr、shiny、rjava,这个里面有些包是在安装R后部署这个环境缺的,所以每个人缺的可能会不一样。

 

小编完成后的画面如下:

有什么问题一起来解决哈,let's go


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
《数据科学:R语言实现》——1.7 执行延迟计算发布时间:2022-07-18
下一篇:
R语言plot(lm)绘图结果解读发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap