1、下载安装JDK,以及Eclipse
具体看此链接:http://blog.csdn.net/weixuehao/article/details/17715793
2、新建JAVA Project
3、去cloudera网站下载hadoop的CDH3u6版本。将起解压到win7的某个目录
4、选中OperateHDFS,右击,选择“property”,弹出右侧的窗口;
选择“Java Build Path” —— “Libraries” —— Add External Jars
5、到上面的画面后,下面就是选择开发hadoop程序时,用到的一些jar包
将lib文件夹下的所有的jar包,添加进去;将红框内的jar包,安装进去。
6、创建配置文件夹
7、将core-site.xml,hdfs-site.xml,mapred-site.xml放入到此文件夹中。
8、右键->属性 进行如下操作,添加刚刚创建conf文件夹
配置搞定!
写代码的过程中要写入的namenode和jobtracker地址(修改为你自己的)
在你的代码中,加入如下代码就可以了
Configuration conf = new Configuration();
conf.set("fs.default.name","192.1.1.2:9000");
conf.set("mapred.job.tracker","192.1.1.2:9001");
(1)准备工作 1) 安装jdk 6或者jdk 7 2) 安装scala 2.10.x (注意版本) 2)下载intellij idea最新版(本文以intellij idea community edition 13.1.1为例说明,不同版本,界面布局可能不同) 3)将下载的intellij idea解压后,安装scala插件,流程如下: 依次选择“configure”–> “plugins”–> “browse repositories”,输入scala,然后安装即可 (2)搭建spark源码阅读环境(需要联网) 一种方法是直接依次选择“import project”–> 选择spark所在目录 –> “sbt”,之后intellij会自动识别sbt文件,并下载依赖的外部jar包,整个流程用时非常长,取决于机器的网络环境(不建议在windows 下操作,可能遇到各种问题),一般需花费几十分钟到几个小时。注意,下载过程会用到git,因此应该事先安装了git。 第二种方法是首先在linux操作系统上生成intellij项目文件,然后在intellij idea中直接通过“open project”打开项目即可。在linux上生成intellij项目文件的方法(需要安装git,不需要安装scala,sbt会自动下载)是:在 spark源代码根目录下,输入sbt/sbt gen-idea 注:如果你在windows下阅读源代码,建议先在linux下生成项目文件,然后导入到windows中的intellij idea中。 (3)搭建spark开发环境 在intellij idea中创建scala project,并依次选择“file”–> “project structure” –> “libraries”,选择“+”,将spark-hadoop 对应的包导入,比如导入spark-assembly_2.10-0.9.0-incubating-hadoop2.2.0.jar(只需导入该jar 包,其他不需要),如果ide没有识别scala 库,则需要以同样方式将scala库导入。之后开发scala程序即可: 编写完scala程序后,可以直接在intellij中,以local模式运行,方法如下: 点击“run”–> “run configurations”,在弹出的框中对应栏中填写“local”,表示将该参数传递给main函数,如下图所示,之后点击“run”–> “run”运行程序即可。 如果想把程序打成jar包,通过命令行的形式运行在spark 集群中,可以按照以下步骤操作: 依次选择“file”–> “project structure” –> “artifact”,选择“+”–> “jar” –> “from modules with dependencies”,选择main函数,并在弹出框中选择输出jar位置,并选择“ok”。 最后依次选择“build”–> “build artifact”编译生成jar包。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....