none
请教关于微软search server 2008爬网的问题 RRS feed

  • 问题

  •  

    我安装的是免费的search server 2008 express版本。请教以下几个问题:

     

       1、爬网规则方面。能不能同一规则里面同时放几条链接?一定要一条规则一个链接吗?比如说准备排除“http://123.com/1.asp”和“http://123.com/2.asp”,能不能在同一条规则里面这样录入:“http://123.com/1.asp?id=*;http://123.com/2.asp?id=* ”  ?  我看系统旁边的例子好像就是用分号分开的。但实际测试,好像不行,必须一条规则一个链接。这样子搞得规则好多阿~

     

      2、登陆爬网问题。我们单位内网使用的是一种单点登陆网页,就是一次登陆可以登陆多个平台,好像叫什么ldap统一登陆平台。登陆页面是jsp,用户名只能选择,不能录入,密码可以录入。我用规则中的窗体认证也罢、cookie认证也罢,都不行。在认证的弹出窗口里面无法正常显示出用户名 。

     

      3、如何解决大小写的问题?微软的iis忽略了大小写,search server2008 也一样。可是很多网站都不是用iis的,这时候大小写就成了问题。比如我们单位的网页,News.action与news.action是不一样的,可是search server2008 不管三七二十一,用小写爬网,结果无法爬网。经过我搜索互联网,好像moss有了补丁,不知道search server 2008有没有?

     

     

      4、开始地址问题。search server2008 的开始地址带参数与不带参数好像是一样的,比如“http://123.com/page.asp?id=3’与“http://123.com/page.asp?id=4’,search server2008 会当做是同一个开始地址,如果多填了还不行,会显示为重复对象。但是我们知道,虽然同是page.asp,可是带不同参数就是不同的开始页面阿!怎么解决?

     

    2009年1月5日 16:37

答案

  •  

    您好!

     

    我们论坛是专门讨论MOSS相关的问题,由于您的问题涉及到Microsoft Search Server 2008 Express,该问题已经超出了我们的技术支持范围。我们建议您将该问题发送到下面的forum,在那里也许您能够得到更好地帮助。

     

    TechNet Forums » Microsoft Search Server 2008 Express » Installation, Configuration and Administration

    http://forums.microsoft.com/TechNet/ShowForum.aspx?ForumID=1940&SiteID=17

     

    谢谢您的配合!

     

    Rock Wang 望正茂

    2009年1月6日 2:55
    版主

全部回复

  •  

      补充1点,爬网日志里面显示:“由于非索引特性,服务器拒绝了此url”是什么意思?
    2009年1月5日 17:37
  •  

    您好!

     

    我们论坛是专门讨论MOSS相关的问题,由于您的问题涉及到Microsoft Search Server 2008 Express,该问题已经超出了我们的技术支持范围。我们建议您将该问题发送到下面的forum,在那里也许您能够得到更好地帮助。

     

    TechNet Forums » Microsoft Search Server 2008 Express » Installation, Configuration and Administration

    http://forums.microsoft.com/TechNet/ShowForum.aspx?ForumID=1940&SiteID=17

     

    谢谢您的配合!

     

    Rock Wang 望正茂

    2009年1月6日 2:55
    版主
  •  

              晕,你提供的链接好像是英文的,我英文不行啊。

     

      

    search server 2008好像是构建在wss上的,发在这个版面,好像也可以把?

     

               

    2009年1月6日 5:06
  •  

    您好!

     

    很抱歉,目前还没有中文的Microsoft Search Server 2008 Express 论坛。

     

    Rock Wang望正茂

    2009年1月7日 7:37
    版主
  • 你那个4 的问题。
    可以建个爬网规则 例如 http://www.xxx.com/yyy/*

    选"包含此路径的的所有项目"
     

    2009年4月2日 13:11