none
SharePoint 2007 Search 全爬网不规则 RRS feed

  • 问题

  • 我在SSP Search里配置了Full Crawl 是每天的12:00AM incremental Crawl是每天10AM4PM,每2小时一次。客户反映文件上传到SharePoint文档库后三天后才能在搜索里找到,

    我登陆服务器看爬网日志,每次的全爬网间隔至少是2天,有的时候3天,我的问题是:

    1. 问什么设置了每天凌晨12点全爬网,可是却有时候不执行?

    2. 文档库里新上传的office文档,只有全爬网才能搜到吗? incremental Crawl不行?

    谢谢

     


    Misnotm
    2011年3月24日 4:18

答案

  • 先回答第二个问题, incremental crawl是可以的, 不用full crawl.

    再排错之前,我建议你取消full crawl的设置,full crawl只用在第一次爬的时候进行,以后不应该做或者少做full crawl。

    因为full crawl会删除掉爬好的索引,你这样设置full crawl和incremental crawl很容易冲突的。导致文件找不到。

     

    我对你的建议是,重置索引,进行一次full crawl,然后以后都只用incremental crawl.

    如果2小时爬不完,就延长下间隔时间。


    上善若水
    Lambert Qin [秦磊] | 博客(Blog): SharePoint in My Eyes 中文 / LinkedIn
    Posting is provided "AS IS" with no warranties, and confers no rights.
    2011年3月25日 2:27

全部回复

  • 先回答第二个问题, incremental crawl是可以的, 不用full crawl.

    再排错之前,我建议你取消full crawl的设置,full crawl只用在第一次爬的时候进行,以后不应该做或者少做full crawl。

    因为full crawl会删除掉爬好的索引,你这样设置full crawl和incremental crawl很容易冲突的。导致文件找不到。

     

    我对你的建议是,重置索引,进行一次full crawl,然后以后都只用incremental crawl.

    如果2小时爬不完,就延长下间隔时间。


    上善若水
    Lambert Qin [秦磊] | 博客(Blog): SharePoint in My Eyes 中文 / LinkedIn
    Posting is provided "AS IS" with no warranties, and confers no rights.
    2011年3月25日 2:27
  • 你好

    你是否考虑过每次全爬网一次需要多少时间?

    关于爬网开始时间的问题我还没测试过,如果说一次全爬网需要的时间太长,可能会对其有影响。

    只有全爬网后才能增量爬网。关于这点的说明文档中有一句解释。

    Note that you must run a full crawl for a particular content source before you can run an incremental crawl. Even if you specify an incremental crawl for content that has not yet been crawled, the system performs a full crawl.

    关于爬网,你可以看看下面的文档。

    http://technet.microsoft.com/en-us/library/cc262926.aspx


    Microsoft Online Community Support
    2011年3月25日 2:57
  • 谢谢, 我回头就按lambert说的,先清除检索,进行一次full crawl。


    Misnotm
    2011年3月25日 5:13