R 是统计领域广泛使用的诞生于 1980年左右的 S语言的一个分支。
统...
我用R几年了,很不错的,现在图书也很多了,虽然大都是翻译过来的。
视频的话,我看过两个:一个是网易公开课上面有,你搜网易公开课,然后搜r语言,就有了,是肖凯讲的。
我本来想给你链接,但是百度知道坑爹,每次回答带链接就把我的答案删除了,不知道他们想干嘛。
第二个是Coursera 上面有门课叫Computing for Data Analysis,很不错的,用R语言的,你可以学习。
希望能帮到你,给予采纳,谢谢!
统计建模与R软件怎么看有没有通过F检验
本人是个经济专业的大学生,大学接触到了图表,所以接触到了R语言,觉得非常好,所以就想学习,下面是我综合了别人的资源整合的文,希望对楼主有所裨益,另外,我个人是学习顺序是《153分钟学会R》、《R in action》、《R Graphics》、《ggplot2:Elegant Graphics for Data Analysis》、《统计建模与R软件》,因为比较倾向图形,所以会看Graphics的比较多,基本上,看完这些也就知道R语言是什么,但是现在R语言在国内的实例还是挺好的,应用少,就很难实践,仅兴趣爱好,下面的链接什么的都挺好的了。
PS:以下教材其实大部分都有电子版,但R语言实战本人强烈建议买实体书,大概五十多吧,里面的图表什么的我都觉得很好看。
另外这些书我都有电子版,如果有想要的可以追问。
分为6个部分,分别介绍初级入门,高级入门,绘图与可视化,计量经济学,时间序列分析,金融等。
1.初级入门 《An Introduction to R》 这是官方的入门小册子。
其有中文版,由丁国徽翻译,译名为《R导论》。
《R4Beginners》 这本小册子有中文版应该叫《R入门》。
《153分钟学会R》刘思喆 这本书收集了R初学者提问频率最高的153个问题。
为什么叫153分钟呢?因为最初作者写了153个问题,阅读一个问题花费1分钟时间,全局下来也就是153分钟了。
有了这些基础之后,要去读一些经典书籍比较全面的入门书籍 《Liu-R-refcard》 R语言一些简单的操作提示,如果学校有开课,可以作为小卡片使用。
2、进阶版 《统计建模与R软件》by 薛毅 需要有一定基础的人去阅读,主要是对R软件进行全面的介绍,此外,还介绍了在工程技术、经济管理、社会生活等各方面的统计问题及其统计建模方法,比较符合国内编者的一本书。
《R Cookbook》 没看过,不评价,但是翻了一下,还是比较循序渐进的一本书。
可挑选看。
《R in action》 中文名R语言实战,这是楼主当年买第一本关于R语言的纸质版的书籍,很喜欢里面的图表,有颜色,但是翻译确实有点问题,有英文基础的建议去看英文。
《R in a Nutshell》 这本书,也还可以,目前应该有中文版,可去翻看。
《The Art of R Programming》 《统计模拟及其R实现》 3.高阶级 《Statistics with R》 这本书比较系统的介绍了R在线性回归、方差分析、多元统计、R绘图、时间序列分析、数据挖掘等各方面的内容 《The R book》 4.数据可视化 自从大学看了餐巾纸(一本书)后,就比较倾向于看这类数据可视化的书籍,下面也介绍几本。
《现代统计图形》by谢益辉 网上有免费的版本,可以去下载,觉得对图表感兴趣的,可以先看这个作入门,其他的再慢慢看。
《R Graphics》 当年楼主是把这本书打印了出来,貌似是有四百多页+,楼主没能坚持住,只看了三分之一,觉得受益匪浅,在绘图和可视化方面,觉得能学到很多。
《ggplot2:Elegant Graphics for Data Analysis》 这本是楼主买的第二本实体书,虽然有电子版,但是还是希望有本,这本是因为国内关于R语言绘图的书比较少,看到亚马逊刚出,所以就买了,写的还可以,薄薄的一本,大概唯一的缺点就是翻译了,好吧楼主的英文不行。
5、其他 序列 《Lattice:Multivariate Data Visualization with R》。
经济 《Econometrics In R》 《Applied Econometrics with R》 《Time Series Analysis and Its Applications :with R examples》。
《Analysis of financial time series》《Analysis of Integrated and Cointegrated Time Series with R》。
《Wavelet Methods in Statistics with R》 金融 《Advanced Topics in Analysis of Economic and Financial Data Using R》 《Modelling Financial Time Series With S-plus》。
《Simulation Inference Stochastic Differential Equations:with R examples》 风险度量与管理类 《Simulation Techniques in Financial Risk Management》 《Modern Actuarial Risk Theory Using R》 《Quantitative Risk Management:Concepts, Techniques and Tools》 投资组合分析类和期权定价类 《Portfolio Optimization with R》 《Option Pricing and Estimation of Financial Models with R》。
数据挖掘 《Data Mining with R:learing with case studies》 其他学习资源网站 1. 常用网站 官网:http://cran.stat.sfu.ca/ 统计之都:http://bbs.pinggu.org/thread-961051-1-1.html 炼数成金论坛:http://f.dataguru.cn/thread-19318-1-1.html R数据挖掘:http://www.bassary.com/?cat=23 中国统计网:http://www.itongji.cn/article/121G4A2012.html R图集:http://gallery.r-enthusiasts.com/ 数据分析联盟:http://blog.sina.com.cn/s/blog_77ca69890101c5yh.html Gephi论坛:https://www.udemy.com/gephi/ Gephi论坛:http://gephi.org/users/ R数据导入导出: http://www.biosino.org/R/R-doc/onepage/R-data_cn.html#Introduction Winbugs软件: http://blog.sina.com.cn/s/blog_4b700c4c01017wj2.html http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml#intro 在swirl上学R http://swirlstats.com/ https://github.com/swirldev/swirl Cookbook for R http://www.cookbook-r.com/Graphs/ 统计之都关于ggplot2 http://cos.name/cn/topic/408087/...
数据库与数据处理第二章习题答案
2014电大最新《数据库基础及应用》形成性考核册作业答案一 (第1~第3章) 一、单选题(在每小题的空括号内填写上正确选项的字母,每小题2分,共36分) 1.在利用计算机进行数据处理的四个发展阶段中,第3个发展阶段是( C )。
A.人工管理 B.文件系统 C.数据库系统 D.分布式数据库系统 2实体中能够唯一标识自己的属性被称做( A )。
A.码 B.域 C.联系 D.元组 3、关系数据模型属于( B )。
A.概念数据模型 B.逻辑数据模型 C.存储数据模型 D.对象数据模型 4.若实体A和B是1对多的联系,实体B和C是多对1的联系,则实体A和C是( C )联系。
A.1对1 B.1对多 C.多对多 D.多对1 5.在数据库体系结构的三级模式中,全局模式处于( B )层。
A.最内 B.中间 C.最外 D.应用 6.下面不属于数据库体系结构中三级模式的是( C )。
A.存储模式 B.逻辑模式 C.数据模式 D.应用模式 7.设D1、D2和D3定义域中的基数分别为2、3和4,则D1xD2xD3的元组数为( B )。
A.9 B.24 C.10 D.14 8.设关系R1具有a1个属性和b1个元组,关系R2具有a2个属性和b2个元组,则关系R1*R2所具有的元组个数( D )。
A.a1+b1 B.a2+b2 C.a1xa2 D.b1xb2 9.若一个关系为R(学生号,姓名,性别,年龄),则可以作为主码的属性为( A )。
A.学生号 B.姓名 C.性别 D.年龄 10.设一个关系模式为R(A,B,C),对应的关系内容为R={{1,10,50},{2,10,60},{3,20,72},{4,30,60}},则δB>15(R)的运算结果中具有的元组个数为( B )。
A.1 B.2 C.3 D.4 11.设一个学生关系为S(学生号,姓名),课程关系为C(课程号,课程名),选课关系为X(学生号,课程号,成绩)。
则求出所有选修课程信息的运算表达式为П课程号(X)与( A )的自然连接。
A.C B.S C.X D.П课程号(C) 12.设两个关系中分别包含有m和n个属性,它们具有同一个公共属性,当对它们进行等值连接时,运算结果的关系中包含的属性个数为( C )。
A.m*n B.m+n-1 C.m+n D.m+n+1 13.在一个关系R中,若X,Y和Z为互不相同的单属性,并且存在X?Y和Y?Z,则必然存在X到Z的( B )函数依赖。
A.部分 B.传递 C.直接 D.平凡 14.在一个关系R中,若存在“学号?系号,系号?系主任”,则该关系必定存在着( )函数依赖。
A.部分 B.平凡 C.相互 D.传递 15.设一个关系为R(A,B.C,D,E),它的最小函数依赖集为FD={A?B,C?D,(A,C)?E},则该关系的候选码为( B )。
A.(A,B) B.(A,C) C.(A,D) D.(A,E) 16.设一个关系为R(A,B,C,D,E),它的最小函数依赖集为FD={A?B,B?C.B?D,D?E},则该关系的候选码为( C )。
A.(A,B) B.(A,D) C.A D.B 17.设一个关系为R(A,B,C,D,E),它的最小函数依赖集为FD={A?B,A?C,(C,D) ?E},则该关系的候选码为( C )。
A.(A,C) B.(C,D) C.(A,D) D.(B,D) 18.设一个关系为R(A.B,C,D,E,F,G),它的最小函数依赖集为FD={A?B,A?C,C?D,C?E,A?F,F?G},若要规范化为高一级的范式,则将得到( C )个关系。
A.1 B.2 C.3 D.4
老师有没有 R语言与数据挖掘最佳实践和经典案例 的电子版
不知不觉我跟R已经认识1年了,在这一周年的日子里,写篇纪念文章。
以前我并未对统计软件有特殊的偏好,spss、sas、eviews都在用,三个中稍倾向于spss,主要因为它比较简单,sas的学习难度和应用条件(模块很多,文件太大)是我所难以接受的,eviews只在时间序列里用。
那时更关注于具体的理论学习,不过在往深了学的时候,会有一个疑问,如果我在现实中要实现这些比较新的内容该怎么办?(商业软件一般没那么新的前沿的内容),这些复杂的公式对于没什么编程基础的我来说要实现起来真是难上加难。
也是去年这时候,有一个曾经在学院任教的老师(现在是加拿大英属哥伦比亚大学终身教授)回来给我们上了一个月的课,在这一个月的时间里,我接触了R语言。
接下来的一年里(现在依然如此),我始终处在自学R的阶段,虽然辛苦也受益良多,一方面是终于可以摆脱傻瓜软件的束缚(用了R之后,我基本不用spss了),另一方面也是最重要的是R镜像站的文档让我学了太多以前没接触的前沿知识并通过R语言进行了实践,这一切在以前都是不可想象的。
说实在的我的R水平还是处于基础阶段(虽然我已掌握了几乎所有传统统计学方法和数据挖掘算法的R语言实现),目前在文本挖掘,高级编程上与专业人士还存在很大的差距,不过我会继续努力。
R语言在中国的普及程度与国外简直是没法比,据我所知,目前高校用R作分析少之又少,企业普及率也低。
不过,R的影响正在不断扩大,统计之都举办的R语言会议已经到第5届了,而且去年的参会阵容已经相当豪华了(谢邦昌都去了),我相信R的前景会越来越好,当然也希望我的R能力能更快的提高。
下面是转的数据挖掘研究院的一篇文章(是篇翻译文章),是讲facebook和google的研究人员如何用R的。
在R用户组织的主题为“R与预测分析科学”的panel会议上,有来自工业界的四位代表发表了讲话,介绍各自在工业界是如何应用R进行数据挖掘。
他们分别是:Bo Cowgill, GoogleItamar Rosenn, FacebookDavid Smith, Revolution ComputingJim Porzak, The Generations Network他们分别介绍了在各个公司是如何使用R进行预测分析,R作为分析工具的优势和劣势,并且提供了学习案例,以下是对他们的介绍的相关总结。
Panel介绍R作为一门编程语言在以下三个方面具有很强的优势:数据处理,统计和数据可视化。
和其他数据分析工具不同的是,它是由统计学家开发的,它是免费的软件,并且可以通过用户开发的包进行扩展,目前大约有2000多个包在CRAN中。
很多包可以应用在预测分析中。
Jim重点介绍了 Max Kuhn 的caret包,它提供了大量的分类和回归模型,包括神经网络和朴素贝叶斯模型。
Bo Cowgill, Google根据Bo Cowgill 的介绍,R是google最流行的统计分析包,事实上,google也是R基础的捐助者。
他讲述道:R最好的事情是,它是统计学家发明的。
它最糟糕的事情是,它是统计学家发明的。
无论如何,他很乐观地看待R开发者社区的发展,R文档也逐步在改进,它的性能也在逐步提高。
Google主要使用R进行数据探索和构建模型原型,它并不是应用在生产系统,在Bo的团队中,R主要运行在桌面环境中。
Bo主要根据以下的流程使用R:(1)使用其他的工具提取数据;(2)将数据加载到R中;(3)使用R建模分析;(4)在生产环境中使用c 或者python实现结果模型。
Itamar Rosenn, FacebookItamar介绍了facebook数据团队使用R的情况,他回答了新用户提数的两个问题:预测用户是否保持在某个数据点,如果他们停留,如何预测他们在三个月之后是否还会停留。
对于第一个问题,Itamar的团队使用递归划分推断出仅仅两个数据点被预测出来用户是否保留在facebook上:(1)新用户拥有多个会话;(2)输入用户基本信息时。
对于第二个问题,他们使用最小角度回归方法建立逻辑回归模型(lars包),根据三个类别的行为发现用户三个月的活动:(1)用户被其他用户访问的频率;(2)第三方应用程序使用的频率;(3)即将访问该站点的用户。
David Smith, Revolution ComputingDavid的公司,R改革计算,不仅仅使用R,而且R是他们的核心业务。
David描述道:他们对R的贡献类似于redhat对linux 的贡献。
他的公司处理使用R遇到的一些问题,例如,(1)支持老版本软件,即向下兼容;(2)通过他们的ParallelR套件可以支持并行计算。
David展示了他们的生命科学客户是如何使用R通过randomForest包对基因组数据集进行分类处理,以及如何使用他们的foreach包对分类树分析进行并行处理。
他还提到他们和其他公司合作将R应用在生产环境中,将特定的脚本放在服务器上,用户通过客户端调用该脚本进行数据处理。
Jim Porzak, The Generations NetworkJim简单介绍了如何使用R进行市场分析。
尤其是,Jim还使用flexclust为sun公司的客户数据进行聚类分析,并且应用该结果数据识别高价值销售的主导业务。
在Q&A环节,还有很多提问,并且进行了回答。
1在使用R的过程中,如何解决内存限制问题?R工作区是在RAM上,因此他的大小是受到限制的。
办法:(1) 使用R的数据库连接功能(例...
转载请注明出处51数据库 » 统计建模与r软件第二章习题答案(r软件的