你说writable类型不太准确, hadoop会有你说的这种类型是因为分布式的原因,要将数据进行序列化,这样才能进行后面的计算,所以应该说mapreduce 中map的key、vlaue必须实现了序列化,hadoop自己提供一些序列化的类型,比如IntWritable等,当然也可以自己定义
你可以定义新的类型
但是也要implement writable
序列化是因为需要网络传输
mr避免不了网络io的
所以必须writable
但是具体类型
你不满意他提供的
那自己写
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
| 文章分类: |
|
还能输入300字
上传中....
黄山老婆婆