非常多,基本上的互联网公司都有自己的Hadoop集群,研究Hadoop的人主要分为两类
1、研究如何使用Hadoop,如:搜索引擎如何在Hadoop中构建海量数据的索引、如何通过hadoop的Map/Reduce解决海量数据的分析工作,等等。目前通过Hadoop分析数据比较常用的是使用Hive来编写HiveSql。
2、下一代Hadoop,主要就是解决Hadoop的发展问题,比如说Hadoop中有MasterNode,存在单点故障。很多知名公司都会有自己这方面的解决方案。比如说吧MasterNode中的一些对象持久化到数据库中。采取多个MasterNode的部署,每个MasterNode就像普通Web服务器一样,单纯的接受请求和相应请求。
你好!
微软现在都开始介入进来了,显然,它有很好的发展前景。它实现了分布式文件系统,对海量数据进行分布式处理,加快了处理速度
如有疑问,请追问。
不算太多
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....