最简单的,你直接读读hadoop的库函数,其中就有很多处理的例子。而且pig的源代码很不错,对hadoop上常见的问题都给给出了通用的处理方式。
太多了啊,比如很多搜索网站利用hadoop等类似技术存储爬虫程序获得的网页信息,再通过mapreduce计算每个网页pr值。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....