1. Nutch 是一个开源Java 实现的搜索引擎。
2. 它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和Web爬虫。
3. 现在Nutch分为两个版本:1.x和2.x,这两个版本的主要区别在于底层的存储不同。
4. 1x版本是基于Hadoop架构的,底层存储使用的是HDFS,而2.x通过使用Apache Gora,使得Nutch可以访问HBase、Cassandra、MySQL、DataFileAvroStore、AvroStore等。
nutch 是一个开源java 实现的搜索引擎。 它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和web爬虫。 现在nutch分为两个版本:1.x和2.x,这两个版本的主要区别在于底层的存储不同。 1x版本是基于hadoop架构的,底层存储使用的是hdf...
用户登录
还没有账号?立即注册
用户注册
投稿取消
| 文章分类: |
|
还能输入300字
上传中....
00左中左00