Chinese In North America(北美华人e网)

注册
发新话题 回复该主题

1#

有没有人用R run against spark dataframe啊

烦死了,最近公司非要用azure. 好不容易折腾出个spark dataframe. 然后想用R的time series code run. 怎么弄啊。要把spark dataframe 变成一个r可以用的dataset吗?还是就保持原来的spark dataframe. 然后用spark r?
TOP
分享到微信 分享到Facebook 分享到Twitter 分享到新浪微博 复制到剪贴板
agree
0
disagree
0
2#

Ask on Stack Overflow not on Huaren
TOP
agree
2
disagree
0
3#

https://spark.rstudio.com/

https://docs.microsoft.com/en-us/azure/databricks/spark/latest/sparkr/overview

我真的不明白做数据的人连google的能力都没有怎么干活
TOP
agree
1
disagree
0
4#

https://spark.rstudio.com/

https://docs.microsoft.com/en-us/azure/databricks/spark/latest/sparkr/overview

我真的不明白做数据的人连google的能力都没有怎么干活
熊熊ABC 发表于 11/19/2019 3:35:21 PM [url=https://forums.huaren.us/showtopic.aspx?topicid=2473947&postid=81912499#81912499][/url]


不厚道啊
虽然倒是大实话
其实大多数情况下根本不需要spark
不过很多公司是为了spark而要用spark
TOP
agree
0
disagree
0
5#

多谢专家回复啊.....我这方面本来底子就差,以前就弄弄sas,还是看别人code改改,而且很多年都没弄这些了,突然弄这个,烦得不行所有背景知识都没有。你说我一个sql都不用的人,让我突然弄这个....

不过spark处理大dataset的确不错,我还先整了个小的dataset试code, 完了run整个的都没太大区别。就是把数据存下来的时候花了十几分钟。唉,还得慢慢看文件学习,烦。
TOP
agree
0
disagree
0
发新话题 回复该主题