并没有认为哪个一定就好。就个人使用而言,需要看企业内的工作会用什么。
SAS是收费软件,而且价格不菲。其功能相当多,满足一般的企业数据分析应该是非常够了。代码可读性一般会高一些,有和sql语言非常相似的部分。传递参数的方式有些特殊,有些时候比较依赖宏。不太能够像R一样轻松地写出函数。软件本体大小视安装模块而定,但是十几二十个GB是免不了的。
R本身是免费的,目前在学术界使用应该算是比较普遍的。功能也很丰富。其依赖的各种程序包有个人和组织贡献,一些程序包的更新很大程度依赖个人。自己也遇到过有很想使用的程序包,结果只支持Linux或者已经停止更新从cran上移除的情况。不过相对应地,R有很多人参与更新,新的软件包不乏根据比较前沿的方法制作的,所以受到学术界和大多数中小型(需要节约成本的)企业欢迎。(相对应地,SAS要考虑商业化成本和需求,且商业化需要时间,这是SAS逊于R的灵活性部分)
R本身小巧,但是属于比较坑内存的类型,处理特别大的数据集并且使用个人电脑(内存大概8G这种)的时候会经常out of memory。在Windows上目前还没有非常完善的针对内存问题的处理。
更多的可以看看下面的链接:
http://bbs.pinggu.org/thread-2895495-1-1.html
数据分析师目前主流的2种
人民大学经济论坛主办的 《数据分析师》 英文简称:CDA
商业联合会数据分析专业委员会和工信部教育与考试中心主主办的 《项目数据分析师》 英文简称:CPDA
【关于CPDA】
CPDA全名叫项目数据分析师,国内最早的数据分析培训,原先是信息产业部在组织,目前由中商联数据分析专业委员会和工信部教育与考试中心主管,内容主要针对的是基于企业在投资、经营、管理领域的分析,类似MBA课程。
课程包括《数据分析基础》、《战略管理》、《量化投资》、《量化经营》等,涵盖企业运营的每个环节,以数据分析方法来进行管理、经营、投资等分析,应该说企业的管理层适合学习CPDA来进行管理层面的分析和指导。
目前很多课程没有实际可操作模型,而CPDA就有,其中介绍很多企业生产、管理、经营、投资分析和决策的案例和模型,目的也是为了使广大学员能够在管理岗位上能够有理论支持、实际模型可操作,使大家有切实可操作的实际模型去分析。
【关于CDA】
CDA全名是数据分析师,由中国人民大学经济论坛主办。主要是讲数据分析方法、技术和软件操作为主。
课程包括:1、统计概率基础;2、数据分析模型方法;3、软件、工具的运用。如果这些技术没有,也不可能会玩数据分析。所以,CDA主要是针对数据分析师必备的技术性培训,是从数据的获取、储存、整理、清洗、分析,检验到结果报告一个整体的流程,以及数据分析一些软件的操作。
【总结】
因此,对于这两者的区别,我想大家应该有一个清晰的认识,如果您是已经工作有数据分析基础技术的,想做到管理层,可以选择CPDA;
如果你是入门、转行零基础、基础薄弱、或只想做技术性工作的学员,首先的一步是掌握数据分析的方法和技术,这时你可以选择CDA。
另外,如果是研究算法的高级分析师、高级挖掘工程师、大数据分析师,可以参考其他相关的名师培训。
sc-cpda 数据分析公众交流平台
二者没有更好一说,只有更适合。听过一个比喻:R就像是Android,集大家之所成(指开源社区),资源更广,在Google的带领下,活跃的社区使得其不断进步;而SAS 则更像之前的iOS,App Store中的App没有前者多,但是其中的质量是得到官方保证的。也就是说,R非常自由活跃、新颖前卫、简单易用,但是其商业价值用途无法得到有效支持(虽然RStudio等也有在商业化上做出一些事情);SAS虽然有着非常完备的商业支持(软件部署、商业咨询等),但是其语言“晦涩难懂”、使用起来自有化程度不够,其高昂的价格也使得很多节约型公司望而却步。
当然,话说回来,如果是初学者,随便选一个都可以,R可能比较容易上手,如果是从业者,两者应该都得会,以及SPSS JMP SQL Excel 等都是需要熟识的。
个人感觉,cda的课程更偏行业数据分析,大讲台的课程更偏互联网数据分析。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....