如何自学数据分析
很多人都觉得,自己是文科类出身,或者对数理专业不熟悉,会很难上手数据分析。其实不是这样子的,学习数据分析,不同于程序员,它不会专门要求我们一定要掌握编程,只是理解熟悉就可以。个人的逻辑思维能力、个人兴趣所在,以及自身的决心毅力,这些才是构成一个人学成与否的关键和最重要因素。
小编觉得最重要的一点就是,我们得清楚企业对数据分析师的基础技能需求是什么。这样我们才能有的放矢。我大抵总结如下:
(1)SQL数据库的基本操作,会基本的数据管理
(2)会用Excel/SQL做基本的数据分析和展示
(3)会用脚本语言进行数据分析,Python or R
(4)有获取外部数据的能力,如爬虫
(5)会基本的数据可视化技能,能撰写数据报告
(6)熟悉常用的数据挖掘算法:回归分析、决策树、随机森林、支持向量机等
之后,怎么安排自己的业余时间就看个人了。总体来说,先学基础,再学理论,最后是工具。基本上,每一门语言的学习都是要按照这个顺序来的。
1、学习数据分析基础知识,包括概率论、数理统计。基础这种东西还是要掌握好的啊,基础都还没扎实,知识大厦是很容易倒的哈。
2、你的目标行业的相关理论知识。比如金融类的,要学习证券、银行、财务等各种知识,不然到了公司就一脸懵逼啦。
3、学习数据分析工具,软件结合案列的实际应用,关于数据分析主流软件有(从上手度从易到难):Excel,SPSS,stata,R,Python,SAS等。
4、学会怎样操作这些软件,然后是利用软件从数据的清洗开始一步步进行处理,分析,最后输出结果,检验及解读数据。
深入浅出数据分析的编辑推荐
《深入浅出数据分析》:我们生活在数据的天地里,你的工作就是淋漓尽致地发挥数据的作用。从哪里起步?《深入浅出数据分析》将为你提供帮助:利用Excel或Openomce应用程序组织数据,在R应用程序中进行进一步整理,通过散点图和直方图找出有意义的模式,借助启发式算法作出结论,通过实验和假定测试预见未来,再以清楚直观的图形展示分析结果。
无论你是研究新产品可行性的开发人员,还是评估广告效果的市场营销经理;无论你是向客户呈报数据的营销员,还是管理所有这些数据密集型部门及种种其他事务的个人企业家,《深入浅出数据分析》都能为你带来全面的学习体验,让你将数据转变为事业中最有用的工具。
我们认为,您的时间极其宝贵,不该浪费在冥思苦想各种新名词、新概念上。《深入浅出数据分析》根据最新认知科学和学习理论,以形成多感官学习体验为目的,顺应大脑的工作方式,设计丰富的图形图表,你将不再被密密麻麻的文字催得昏昏欲睡。
深入浅出数据分析的媒体推荐
“是时候写一本通俗易懂、内容全面的数据分析知识指南了,好让概念的学习变得既简单又有趣。借助各种成熟的技术和免费的工具,数据分析将改变你思考问题和解决问题的方式。概念对理论有用,对实践更有用。”
“《深入浅出数据分析》写得漂亮,读者可以学到分析现实问题的系统性方法。从卖咖啡到开橡皮玩具厂,再到要求老板涨工资,此书告诉我们如何发现和解密数据在日常生活中的强大作用。从图形图表到Excel和R计算机程序,《深入浅出数据分析》想尽办法让各个层次的读者都体会到系统化的数据分析对于制定大大小小的决策的强大作用。”
“被堆积如山的数据压得喘不过气了?让Michael Milton做你的老师吧,在办公工具里添上数据分析工具,抢占技术先机。《深入浅出数据分析》将告诉你如何将原始数据转变成真的知识。别再抽签算卦了——几套软件,一本《深入浅出数据分析》,就能让你做出正确的决策。”
“Kathy和Bert合著的《深入浅出Java》(Head First Java)让白纸黑字摇身一变,成为读者领略过的最接近GUI的作品。作者以幽默、新潮的风格,让学习Java成为不断追问‘他们接下来打算怎么办呢?’的愉快体验。”
“《深入浅出Java》(Head First Java)引人入胜的风格会把一无所知的你变成斗志昂扬的Java战士,不仅如此,书中还收入了大量实用事例,这样的实用事例在其他文章中只会留给恐怖的‘读者练习’。此书睿智、幽默、新潮而实用——能在讲授对象序列化和网络加载协议知识的同时有这样的主张并坚持做到的书籍并不多见。
“此书明快,风趣,玩世不恭,引人入胜。细心读——你可能确实能学到东西!”
“正合我们这些喜欢研究技术、生活随意的程序员的口味,实用开发策略的称手参考书——让我的大脑尽情运转,无须硬着头皮应付迂腐乏味的专家说教。”
“有的书是用来买的,有的书是用来藏的,还有的书是用来摆在案头的。感谢O'Reilly和Head First的员工,他们出了最高等级的书——深入浅出(Head First)系列,让人爱不手、百读不厌。《深入浅出SQL》(Head First SQL)是我最心爱的书,都快翻烂了。”
“本书的透彻、幽默和睿智令人钦佩,连编程门外汉也能借助这样的书想出办法解决问题。”
“昨天收到书就开始读……一读就停不下来了,真是酷毙了。书很有趣,内容扎实,切中肯綮。印象太好了。”
“我读过的最有趣、最高明的软件设计图书之一。”
“过去要犯着错误摸索前进的漫长学习过程,现在干净利落地浓缩在一本迷人的平装书中。”
“每一章都凝聚着优雅的设计,每一条原理无不饱含实用价值与闪光智慧。”
“我《深入浅出HTML + CSS & XHTML》(Head First HTML with CSS & XHTML)。它以‘有趣’的模式,将全部知识倾囊相授。”
“通常,阅读设计模式方面的书或文章时,我都得头悬梁锥刺股才能保证注意力集中。这本书却是个例外,听起来可能有点怪,这本书让学习设计模式变得盎然有趣。“当其他设计模式方面的书籍还在教读者呀呀学语时,这本书却已在踏浪高歌‘加油,兄弟!’”
“我实实在在爱这本书。不瞒大家说,我当着老婆的面亲了这本书。”
做数据分析不得不看的书有哪些
一、数据分析入门:
《Head First Data Analysis》链接:深入浅出数据分析、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。
《Head First Statistics》
推荐理由同上,适合入门者的经典教材。
《R in Action-Data Analysis and Graphics with R》链接:
R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。
《数据之魅-基于开源工具的数据分析》链接:数据之魅
作者是华盛顿大学理论物理学博士。这本书是数据分析的经典之一,包含大量的R语言模拟过程及结果展示,例举了很多数据分析实例和代码。
《数据挖掘-市场营销、销售与客户关系管理领域应用》链接:数据挖掘技术
作者是Data Miners的创办人,有二十多年的营销和客户关系管理结合数据挖掘的经验。详细介绍了作为一个数据挖掘团队需要的知识体系,包括数据库、SAS使用、统计学、机器学习、数据可视化、如何访问用户收集需求、如何写论文与沟通等等。有条件的建议看英文原版。
《Data Analytics for Beginners: Basic Guide to Master Data Analytics》
入门五星推荐。里面很多图表实例,手把手教你如何EXCEL画图,对各种知识点(平均值,模式,中值,方差,标准偏差)的讲解相当的到位,比起大学里的各种课本靠谱。
先把这些花时间啃啃,数据分析的理论部分就基本入门了,根据实际情况还需要结合你的业务需求来进行系统的学习。
二、数据分析进阶:
《Doing Data Scienc》
作者Cathy O'Neil是哈佛大学的博士,MIT的数据博士后,曾今作为一名Quant在对冲基金D.E. Shaw 工作,目前是一家纽约初创公司的Data scientist 。这本书需要有一定的编程和理论基础,作为入门教材来说有点难,虽然只有400来页,但是涉及的知识点很全面。每一章节的核心内容都附有编程案例,R/Python/Shell三种语言任君挑选。
《Python for Data Analysis》
Python数据分析必看,适合入行不久的数据分析师。作者有多年的Python数据分析工作经验,对各种Pyhon包iPython,NumPy,pandas,matpotlib等有着很深的理解。看完这本,敲完代码,Python数据分析就算入行了。
《Data Science for Business》
很多牛人为之作序,数据科学如何与商业结合,相信这本书会给你一些启发。
《Python Data Science Handbook》
2016年6月出版的,500页保质保量,作者(Jake VanderPlas)是华盛顿大学电子科学研究所的高级数据科学研究员,研究领域包括天文统计学、机器学习和可扩展计算。书的前半部分介绍了用于数据分析和一般的科学计算的基本Python库,后面从实际应用的角度使用Python库scikit-learn开始机器学习实践。适合有一定Python基础人(或者R基础),并且想学习如何使用Python进行数据分析的人。
《Storytelling with Data》
作者Cole NussbaumerKnaflic,私募分析师,前Google人力分析团队总监。本书展示了如何高效率展示量化资讯,如何用丰富的资料讲故事。Google内部的数据可视化课程讲师,之前也在Maryland Institute College of Art兼职讲师。如果你想知道如何以图叙事,这边好书不容错过。
自学数据分析需要看哪些书的
第一大类:理论类。 理论层面的书籍,比如《大数据时代》 、《数据之巅》 。
第二大类:技术类。 技术层面的书籍,比如《Hadoop技术内幕》系列。这一类的书籍,主要是指系统技术类,在构建大数据系统时,系统如何运作,各系统组件的设计目标、框架结构、适用场景、工作原理、运作机制、实现功能等等。这类书籍,适合于IT系统部,开发部的技术人员。他们需要明白系统的运作机制,利用系统来实现大数据的应用开发,以及系统运维优化等。
第三大类:应用类。 应用层面的书籍,比如《数据挖掘技术》 、《基于SPSS的数据分析》等等。 这一类的书籍,主要是指应用技术类,告诉你如何应用工具和方法,从海量数据中提取有用的信息,来解决真实的业务问题。这类书籍,适合于业务部门、市场营销部门及与业务结合比较紧密的人员。他们更关注业务问题的解决,围绕业务问题来构建分析和解决方案。
转载请注明出处51数据库 » 深入浅出数据分析word