part-r-0000这个文件时存放在hdfs上的,并非本地文件系统,所以你当然找不到了,你只能通过hdfs的命令查看,或者使用插件。 hdfs的文件虽然底层也是存放在本地文件系统的,但是你是没法显式查看的,跟数据库一样的。
你第一个job应该使用的是textoutputformat,所以输出默认是key-value形式的文本文档,当作为输入之后默认是使用textoutputformat,读入的key是每行的偏移量而非上一个job输出时的key,这是需要显示设置第二个job的输入格式为keyvalueinputformat。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....