引用以前看过的一个比较好好的比喻:
“你数一号书架,我数二号书架。我们人数多,数书就更快。这就是map;最后我们到一起,把所有人的统计数加在一起,就是reduce。”
关于比较专业的概念解释的话,百度百科就行了,会给你专业的回答。
reduce并不需要map全部结束后才开始运行,当一定比例的map任务结束后,reduce就开始执行,这个比例由参数mapreduce.job.reduce.slowstart.completedmaps来控制。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....