Jul14

【原创】Nutch2.2 部署问题小记

Author: leeon  Click: 7075   Date: 2013.07.14 @ 16:19:20 pm Category: 架构

最近Nutch出新的2.2.1版本了,上个月才用2.1这个月就已经2.2.1,版本更新实在太快,以至于升级到新版本又遇到不少坑。索性再次记录一下一些比较麻烦的问题。

1. 从2.2版本开始对mysql数据源的配置就和2.1的默认支持不同了,这个地方的调整一定要严格遵守http://nlp.solutions.asia/?p=362 此文的说明对配置文件进行修改。

2. 切忌一定要在ivy文件修改后再去执行ant命令,这样才能自动的去下载指定的gora-sql版本的jar文件提供给mysql用,要不然nutch会每次执行命令提示找不到jdbc库。

3. 2.2版本的抓去命令没有2.1来的方便,而且目前测试发现处理性能比2.1要慢不少,但是内存占用要小一些。



TAG:   nutch 2 2 mysql

    评论
    • 提交

    分类

    标签

    归档

    最新评论

    Abyss在00:04:28评论了
    Linux中ramdisk,tmpfs,ramfs的介绍与性能测试
    shallwe99在10:21:17评论了
    【原创】如何在微信小程序开发中正确的使用vant ui组件
    默一在09:04:53评论了
    Berkeley DB 由浅入深【转自架构师杨建】
    Memory在14:09:22评论了
    【原创】最佳PHP框架选择(phalcon,yaf,laravel,thinkphp,yii)
    leo在17:57:04评论了
    shell中使用while循环ssh的注意事项

    我看过的书

    链接

    其他

    访问本站种子 本站平均热度:8823 c° 本站链接数:1 个 本站标签数:464 个 本站被评论次数:94 次