大数据人|大数据第一社区

 找回密码
 注册会员

扫一扫,访问微社区

R——你知多少?

2015-10-11 20:51| 发布者: admin| 查看: 763| 评论: 0

摘要:   R是一个基于S语言的一个开源项目,S语言最初是由ATT贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释性语言。后来由Auckland大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发的一个R系统,因 ...
  R是一个基于S语言的一个开源项目,S语言最初是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释性语言。后来由Auckland大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发的一个R系统,因为软件作者名字的首字母都是R所以,其软件被命名为R。所以R自诞生起就具有统计学的基因。其最主要的特点是免费、开源、软件包小,各种各样的模块十分齐全,在R的综合档案网络CRAN中,提供了大量的第三方功能包,其内容涵盖了从统计计算到机器学习,从金融分析到生物信息,从社会网络分析到自然语言处理,从各种数据库各种语言接口到高性能计算模型,可以说无所不包,无所不容,这也是为什么R正在获得越来越多各行各业的从业人员喜爱的一个重要原因(引自程序员杂志2010年第8期) 。
R的优势
 
  R语言有两大强项,其中之一是统计分析,R的统计模块非常齐全,一些比较前沿的统计学方法,都可以用R语言轻松实现。R语言统计分析模块不仅全而且非常方便,比如进行一个回归分析,只要输入fit <- lm(x~y)就可以进行非常方便的回归分析了。
  R语言另一大强项是统计作图的能力,简单的几行语句就可以输出出版印刷质量的作图了。ggplot2的统计包,可以说是R语言的杀手级作图包,不仅能做出你想要的统计图,更难能可贵的是如此的简单方便。大数据时代,数据的可视化已经成为一种很重要的基本技能,展现如此复杂的数据,数据可视化将是一种很重要的技能。 

  R语言的资料充足,而且很多都是免费的。Springer有一个useR的系列专门讲R语言的运用的。(关于R语言书籍的介绍可以)而且R语言自身的帮助系统就非常完善,比如说,lm不知道是什么,只要输入?lm 相应的语法说明、例子应有尽有。这一个比SAS蹩脚的搜索好用多了。相比于C/C++,JAVA之类的编译型语言,R语言作为一种解释性语言,更加接近于自然语言,所以简单容易上手。但相比SAS语言,R语言更佳灵活上手可能比较慢,但是与其收益相比,这点难度其实不算什么的。 

R的劣势

  可能学习R的最大的劣势就是R语言的入门门槛,相比SPSS,Stata来说比较高了。SPSS只要点击菜单就可以完成简单的统计分析工作,R还需要写“莫名其妙”的代码。但是,如果想要做统计分析,R语言付出收入比很高,SPSS、SAS输出时候会输出一大堆东西,难点在于如何解读这些结果,而R你要什么就给什么,非常“小气”。正因为此,才能学好统计学,你需要明白每一步的意义。(说好的,说说R语言的劣势的!对不起我对R那是真爱啊!)R语言输出的结果并没有SPSS、SAS输出结果美观(特别是SAS 9.3以后的版本),看起来很“简陋”。 
  R饱受诟病的劣势是其内存管理,因为R所有对象都存储在内存里,所以非常消耗内存。而且处理1G以上数据,非常之慢,虽然现在很多技术已经大大加快了运行速度。但是貌似医学领域处理1G以上数据的机会不是很多。 
  总结一下,伴随着大数据分析热潮到来,R火起来了,R用户增加飞快。而且商业领域的运用越来越多,京东、阿里巴巴都在使用R语言,包括微软前段时间收购R语言研发公司Revolution analytics。现在医疗大数据的概念越来越多的被人提及,相信R语言会在以后派上大用场。
为您推荐
  推荐几个医学领域用的比较多的软件包,一个是Epicalc,看名字就知道是进行流行病学和卫生统计学计算的。常见的流行病学研究数据的处理,几行代码就可以出结果了,广大医学研究着的大福音,配合其他包,可以计算样本量,甚至比较复杂的抽样方法,比如说,PPS抽样,也可以很方便的计算。因此也不需要学习那么多的商业软件了,比如PASS等。对于研究遗传流行病学的人来说,也有很多软件包,大概有40多个,常用功能有多态位点的基本信息(MAF等)、Hardy-Weinberg平衡检验、LD的计算、关联研究常用检验方法、 Power的计算等,甚至包括双生子研究的包等,有兴趣的同学可以参考官方网站上的Genetics部分,可以肯定你不会失望的。 
  想得到更多推荐,请关注本平台后续推送!

鲜花

握手

雷人

路过

鸡蛋

最新评论

关闭

站长推荐上一条 /2 下一条


id="mn_portal" >首页Portalid="mn_P18" onmouseover="navShow('P18')">应用id="mn_P15" onmouseover="navShow('P15')">技术id="mn_P37" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">前沿id="mn_P36" onmouseover="navShow('P36')">宝箱id="mn_P61" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">专栏id="mn_P65" >企业id="mn_Nd633" >导航 折叠导航 关注微信 关注微博 关注我们

QQ|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2  

GMT+8, 2024-4-27 22:10 , Processed in 0.191507 second(s), 21 queries .

Powered by 小雄! X3.2

© 2014-2020 bigdataer Inc.

返回顶部