为什么常识

有人做过搜索引擎吗,能对Heritrix和Nutc-的性能及适用性做个比较分析么?

生活词典 changshi.cidiancn.com

阅读: 105

有人做过搜索引擎吗,能对Heritrix和Nutc-的性能及适用性做个比较分析么?搜索引擎里面肯定得用到爬虫框架,现在找到的比较好的框架中有Heritrix和Nutc-两个,由于网山对它们的比较分析的文章大多数是重复的,所以看看这里有没有哪位对这个比较了解,并能给点比较分析。谢谢。2 个答案

答案 1:

目前来说Java版本的是Lucene,一般可以考虑Solr+Lucene来实现分布式的可容灾的一个索引和检索的平台,如果数据量是海量级别,可参考Hadoop+Nutc-实现,其他的开源技术框架有,Lily(solr+Hbase+-adoop),zoie(实时搜索引擎),Sp-ider (Sp-ider是一个轻量级,采用PHP开发的web spider和搜索引擎)。

答案 2:

我用的是Lucene

分享常识给亲友.

下一篇:如何界定涉及他人隐私的故事该不该发布在知乎上? 下一篇 【方向键 ( → )下一篇】

上一篇:点点网的盈利模式是什么呢? 上一篇 【方向键 ( ← )上一篇】