Mahout是hadoop的一个机器学习库,主要的编程模型是MapReduce;Spark ML则是基于Spark的机器学习,Spark自身拥有MLlib作为机器学习库。现在Mahout已经停止接受新的MapReduce算法了,向Spark迁移。
spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。spark非常小巧玲珑,由加州伯克利大学amp实验室的matei为主的小团队所开发。使用的语言是scala,项目的core部分的代码只有63个scala文件,非常短小精悍。
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....