我听说SAS是最权威的统计软件,是不是学好SAS在统计界就足够了呢...
统计的工作是什么?定义:收集、整理、分析和表述数据。
统计软件在收集数据中一般用处不大(只有试验设计可能需要计算机生成试验表),而后三部分则处处需要软件的帮助。
sas你能用好就很牛了。
一般工作确实只需要excel,它的功能已经足够强大了,特别是2007版。
但是还有很多功能是excel不能提供的,作为专业人士,还是要精通sas吧。
下面是我对各个统计软件的看法,需不需要多学就看楼主自己啦Stata软件Stata统计软件由美国计算机资源中心(Computer Resource Center)1985年研制。
特点是采用命令操作,也可以菜单操作,程序容量较小,统计分析方法较齐全,计算结果的输出形式简洁,绘出的图形精美。
不足之处是数据的兼容性差,占内存空间较大,数据管理功能需要加强。
网址: http://www.stata.com 。
Stata是各种商业统计软件中我最喜欢的一款(先声明我没有收取广告费),当然不管什么统计软件在我眼中都离R差远了,但是Stata确实做得还不错,虽然它的名声远不如SAS和SPSS,但其统计模块非常齐全,打开看看菜单就知道了。
尤其是计量经济学和医学统计的人,如果惧怕写代码,不妨试试Stata。
它分析小型数据应该是非常顺手,但能读取的数据种类有限,据我所知基本上仅仅是纯文本数据和Stata本身的数据(*.dta),而且计算受内存大小和程序版本种类限制,所以无法处理特大型的数据。
在用Stata菜单操作的时候它同时会在屏幕上输出与菜单对应的程序代码,因此若不熟悉Stata编程,可以通过这样的过程逐步学习,而且有些操作用菜单不方便实现,此时就可以结合不同的程序命令来完成。
(例如指定模型中的分类变量要用xi:命令,但它在模型的菜单中无法直接指定,所以可以直接把xi:加到模型命令的前面)另外需要提及的是,Stata自身有一本刊物Stata Journal,里面的内容比较学术,都是结合Stata命令讲一些统计方法如何实现,不过这本刊物要收费,这点对于学生来说是个比较大的障碍。
所以话说回来,要看这类文章还是看R News吧,它不但不收费,而且文章质量也都比较高,明年就要更名为The R Journal了。
SAS软件SAS是英文Statistical Analysis System的缩写,即统计分析系统,最初由美国北卡罗来纳州立大学两名研究生开始研制,1976年创立SAS公司,2003年全球员工总数近万人,统计软件采用按年租用制。
SAS系统具有十分完备的数据访问、数据管理、数据分析功能。
SAS系统是一个模块组合式结构的软件系统,共有三十多个功能模块。
SAS是用汇编语言编写而成的,通常使用SAS需要编写程序。
网址: http://www.sas.com 。
我在COS论坛( http://cos.name/bbs )上对SAS的介绍是“庞大的统计分析系统”,并没有强调它在统计分析方面的所谓优势。
论坛上有几位朋友认为SAS编写代码的方式已经非常“恐龙级”了,对此我基本认同,不过鉴于我对SAS了解并不深入,所以不敢大放厥词。
总之,“大”未必好,甚至以小人之心去揣测一下,也许“大”意味着代码臃肿。
总之我们也看不到源代码,不知道它的统计分析代码怎么能写到七张光盘那么大。
R的Windows安装文件30M,源文件16M左右。
别的不多说了,据我了解,我周围上下的同学在SAS上面花时间最多的是学习怎么把这个大家伙装进自己的电脑,然后道听途说一个proc名称,就开始把数据导进来写上几个变量名,然后提交run,直到有一天终于有了长达30页的报表了,就高兴了。
大家不妨对照看看自己是不是这么做的。
SPSS软件SPSS是Statistical Package for Social Science的缩写(后来改成什么服务Service了),即社会科学统计程序包,20世纪60年代末由美国斯坦福大学的三位研究生研制,1975年在芝加哥组建SPSS总部。
SPSS系统特点是操作比较方便,统计方法比较齐全,绘制图形、表格较有方便,输出结果比较直观。
网址: http://www.spss.com 。
算了,SPSS没什么好写的,自己打开看就是了。
懂统计的不用学,不懂统计的学了也白学。
反正要是不懂统计你总懂点右上角那个OK按钮吧。
SPSS是傻瓜软件,所以有时候开玩笑戏称之为Stupid Package for Social Science。
大数据是什么意思?哪些软件适合大数据分析?
"大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
大数据分析的标配是商业智能(BI)软件,传统数据分析的繁杂之处主要体现在两个方面,一是技术人员需要花费大量时间准备数据;二是业务人员基于数据偶得的一些分析需求实现过程复杂。
FineBI的Data Service模块,特有的分析设计模式和指标影响因素智能分析模块,能够帮助用户解决传统BI数据准备时间长,偶得数据分析过程复杂等问题,让技术人员准备数据时无需任何代码和复杂的设置过程,让非IT人员能够轻松自在得进行分析。
"
大数据分析工具有哪些,有什么特点?
1. 开源大数据生态圈Hadoop HDFS、Hadoop MapReduce, HBase、Hive 渐次诞生,早期Hadoop生态圈逐步形成。
开源生态圈活跃,并免费,但Hadoop对技术要求高,实时性稍差。
2. 商用大数据分析工具一体机数据库/数据仓库(费用很高)IBM PureData(Netezza), Oracle Exadata, SAP Hana等等。
数据仓库(费用较高)Teradata AsterData, EMC GreenPlum, HP Vertica 等等。
数据集市(费用一般)QlikView、 Tableau 、国内永洪科技Yonghong Data Mart 等等。
前端展现用于展现分析的前端开源工具有JasperSoft,Pentaho, Spagobi, Openi, Birt等等。
用于展现分析商用分析工具有Cognos,BO, Microsoft, Oracle,Microstrategy,QlikView、 Tableau 、国内永洪科技Yonghong Z-Suite等等。
大数据可以应用在哪些方面
展开全部 大数据可应用于各行各业,将人们收集到的庞大数据进行分析整理,实现资讯的有效利用。
举个本专业的例子,比如在奶牛基因层面寻找与产奶量相关的主效基因,我们可以首先对奶牛全基因组进行扫描,尽管我们获得了所有表型信息和基因信息,但是由于数据量庞大,这就需要采用大数据技术,进行分析比对,挖掘主效基因。
例子还有很多。
总的来说,大数据是对大量、动态、能持续的数据,通过运用新系统、新工具、新模型的挖掘,从而获得具有洞察力和新价值的东西。
以前,面对庞大的数据,我们可能会一叶障目、可见一斑,因此不能了解到事物的真正本质,从而在科学工作中得到错误的推断,而大数据时代的来临,一切真相将会展现在我们面前。
...
SAS编程语言知多少
Base SAS模块的:· Data Step(数据步,在SAS帮助文档中称为SAS 语言)· DS2(Data Step 2,最新一代的编程语言)· MACRO(宏)· SQL和FedSQL(虽然只是两个过程步,不能称之为一门语言,但是作为数据处理尤其是数据库处理的编程语言其作用相当重要。
)· FCMP(Function Compiler,用于用户自定义函数和子例程的编译和管理)· GTL(Graphic Template Language,图形模板语言)· Metadata Language(元数据管理语言)SAS/AF模块的:· SCL(SAS Component Language SAS组件语言,现在已经很少有人用了。
)SAS/OR模块的:· OPTMODEL(Optimization Model,优化模型编程语言)SAS/IML模块的:· IML(矩阵编程语言)SAS/IML Studio模块的:· IMLPlus(IML 语言的扩展,主要用于生成图形、调用SAS过程步和非SAS程序)JMP模块的:· JSL(JMP Script Language,JMP 脚本语言)
IT程序员可以从事大数据开发方面的工作吗
1、Java程序员作为Java开发者,你对软件工程的规则已经了然于心,能够设计软件系统执行复杂任务。
数据科学正是关于开发“数据产品”的一门科学,主要是基于数据和算法的软件系统。
对于Java程序员来说,第一步需要了解机器学习的各种算法:现在有哪些算法,都能解决哪些问题以及如何实现。
另外还需要学习使用R和Matlab等建模工具,此外WEKA、Vowpal Wabbit和OpenNLP等库也为大多数常见算法提供了经过验证的实现方法。
2、 Python程序员如果你是Python程序员,对软件开发和脚本编写一定很熟悉,也许已经在使用很多数据科学中常见的库例如NumPy和SciPy。
Python对数据科学应用的支持很好,尤其是NumPy/Scipy, Pandas, Scikit-learn, IPython等用于探索性分析的库,以及可视化方面的Matplotlib。
在处理大型数据集方面,多学些Hadoop及其与Python的流式集成。
3、 统计学家与应用科学家如果你有统计学或者机器学习的背景,那么你很可能很多年前就开始使用诸如R, Matlab或SAS进行回归分析、聚类分析等机器学习相关任务。
R、Matlab和SAS是很强大的统计分析和可视化工具,对于很多机器学习算法都有很成熟的实现方法。
但是,这些工具通常被用于做数据勘探和模型开发,很少单独用来开发产品级的数据产品。
在开发端到端的数据产品时,大多数情况下,你需要需要同时用到其他软件模块如Java、Python等,并与Hadoop等数据平台整合。
显然,熟悉一门或者多门现代编程语言,例如Python或Java是你的首要任务。
此外,与有经验的数据工程师紧密合作将有助于更好地理解他们开发生产级数据产品所用到的工具和方法。
4、业务分析师如果你的背景是SQL,那么说明你已经跟数据打交道很多年了,你很清楚如何通过数据获取业务分析结果。
Hive能让你以你熟悉的SQL语言访问Hadoop上的大数据集,因此是你步入大数据殿堂的首选。
数据产品通常需要使用SQL无法胜任的高级机器学习和统计,因此对于业务分析师来说,进入数据科学领域的第二个重要步骤就是在理论层面深入了解此类算法(例如推荐引擎、决策树、NLP),并熟悉目前的实现工具如Mahout, WEKA,或Python的Scikit-learn。
5、 Hadoop开发者作为Hadoop开发者,你一定已经了解了大数据集和集群计算的复杂性。
你还可能熟悉Pig、Hive、HBase并有丰富的Java经验。
第一步,你需要深入了解机器学习和统计,以及这些算法面向大数据集的高效实现方法。
Mahout是个不错的开始,可以在Hadoop上实现上述很多算法。
另外一个需要关注的领域是数据清理(data cleanup),很多算法在建模前都会为数据分配基本结构。
但不幸的是,现实中数据大多很“脏”,清理这些数据是数据科学中一项很繁重的工作。
Hadoop通常是建模前大规模数据清理和预处理的工具选择。
学习SAS程序有什么用?
SAS软件包是一个大型的统计分析系统,其核心是多个用于实现统计分析的实用过程。
统计分析离不开操作的数据对象, SAS采用的办法是建立SAS数据集。
而实现上述的一切都需要编制SAS引导程序,简称SAS程序。
SAS程序由一系列符合SAS语言语法规则的语句组成, 正如用任何一门计算机语言编制的程序一样。
SAS语言不仅提供了一般程序设计语言拥有的语句(如循环控制,条件判断,赋值,输入输出等),而且,其丰富的概率函数、分位数函数、样本统计量函数以及随机数函数更是其他语言无法比拟的。
SAS程序的基本组成是: 若干SAS语句组成数据步(DATA步),若干SAS语句组成过程步(PROC步),若干DATA步和若干PROC步组成一个完整的SAS程序,其中, DATA步通常产生SAS数据集, 而PROC步则对SAS数据集内的数据进行处理并输出结果或产生新数据集。
本章主要介绍如何产生数据集,而且由于数据集大部分由数据步完成,我们把精力也主要集中于数据步上。
第1节 数据步流程某小学10名9岁男学生6项智力测验得分结果————————————————————————————————————
大数据学习需要哪些课程?
(1)统计学:参数检验、非参检验、回归分析等。
(2)数学:线性代数、微积分等。
(3)社会学:主要是一些社会学量化统计的知识,如问卷调查与统计分析;还有就是一些社会学的知识,这些对于从事营销类的数据分析人员比较有帮助。
(4)经济金融:如果是从事这个行业的数据分析人员,经济金融知识是必须的。
(5)计算机:从事数据分析工作的人必须了解你使用的数据是怎么处理出来的,要了解数据库的结构和基本原理,同时如果条件充足的话,你还能有足够的能力从数据库里提取你需要的数据(比如使用SQL进行查询),这种提取数据分析原材料的能力是每个数据从业者必备的。
此外,如果要想走的更远,还要能掌握一些编程能力,从而借住一些专业的数据分析工具,帮助你完成工作。
扩展材料:大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。
据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。
大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
参考资料:百度百科-大数据
大数据专业要用那些软件
展开全部 hadoop作为一款开源分布式集群常常被用于大数据分析后台数据存储,但是并不能单独作为分析工具。
国内永洪科技bi工具Yonghong Z-Suite 可以看作是大数据分析软件,包含专业数据集市Yonghong Z-Data Mart ,是他们基于自己技术研发的,类似于hadoop ,然而查询和计算速度更快,适合用于大数据实时分析。
一般基础数据分析用 excel,origin,功能还是比较强大的,大数据分析用SAS, SPSS,RSA,MATLAB,DPS,EVIEWS, GAUSS, Minitab, Statistica,FineBI,最新的还有采用Hadoop技术。
SAS可以用来设计正交试验,SAS比SPSS功能多一些,RSA用来作相应面分析,MATLAB是面向矩阵的,可以做很多方面,比如:数值分析,模式识别,优化...里面包含了巨丰富的工具箱,小波分析,遗传算法等。
photoshop当然是必需的,可以修整下图片,润色,美化,删繁存简。
国内帆软公司的FineBI支持即时分析和多维分析即OLAP。
...
转载请注明出处51数据库 » sas软件能不能大数据
爱情游戏18644047