数据挖掘是从数据中提取价值的一系列循环的过程,记住是过程 ,非一次性的:商业理解 --数据准备--数据处理--构建模型--评估--产生知识 。但学术上往往偏向算法的研究 。我的建议是先把经典的几类算法有个熟悉之后再深入某一类阅读相关文献,试图找出突破的口,那你的毕业论文就有了 。另外最好参与科研或实习,在实际业务中成长得更快 。
ps1:我说的熟悉算法是在了解算法之后用代码实现,加深理解,同时能发现未知的问题。
ps2:光啃书的确是比较困难的事情,这里有几个经典的相关网络课程供推荐:台大机器学习,MIT机器学习,炼数成金网络课堂。
ps3:预备知识如概率论,线代,统计软件或某一编程语言必须要具备,不然学习起来太为痛苦 。
ps4:附上如何成为一名数据科学家的文章(这才是重点,大牛的总结)。
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....