none
コンテンツのクロールについて RRS feed

  • 質問

  • お世話になります。

    MOSSコンテンツのクロールでエラーログが表示されます。

    [構成]
    ・サーバーファーム構成を採り、Web/Index/SQLの構成です。
    ・GroupBoard2007をインストールし、回覧版等々を利用しています。
    ・クロールのアカウントは、Domain Adminsのメンバーであるadminアカウントを指定しています。
    ・SQLサーバの認証もWindows統合認証を使用しており、上記のadminアカウントを指定しています。
    ・サイトコレクションを分割していますが、既定のコンテンツアクセスアカウントは全て上記の
     adminアカウントを指定しています。
    ・サーバは全て同一セグメントにあるため、検索の設定で特にプロキシの設定はしていません。

    [状況]
    ・MOSSコンテンツのフルクロールを実施すると、以下のエラーメッセージが表示されます。
      -----------------------------------ここから-----------------------------------
     http://pekepeke/xxx/xx...xxx/xxxx/xxxx
     このアイテムをクロールするときに、認識できないHTTP応答が受信されました。
     ブラウザでこのアイテムにアクセスできるかどうかを確認してください。

     最終コンテンツソース:ローカルのOffice SharePoint Serverサイト
      -----------------------------------ここから-----------------------------------

    ・クロールログからリンクを辿ると、特に問題無くリンク先のページが表示されます。
    ・リンク先のリスト又はライブラリのアクセス権の問題かと思いましたが、前述のadminアカウント
     がフルコントロール権限で設定されており、特に問題があるとは思えません。

    大変恐縮ですが、どなたか原因と解決策をご教授いただけますか?
    宜しくお願いいたします。

    2009年8月18日 12:26

回答

  • こんばんわ。

    解決に繋がるかは不明ですが、参考になりそうな情報を。

    SharePoint Server 2007 でクロールされるコンテンツと、エラー メッセージ:"に認識できない HTTP ステータスを受信しました。 Internet Explorer を使用して、アドレスをアクセスできることを確認する
    http://support.microsoft.com/kb/938219

    機械語なのでかなりイミフですが(原文読んだ方がいいかも…)、
    「プロキシを設定していないこと」が問題になることもあるようです。

    また、全く別の角度からの情報も。

    Unrecognized HTTP response was received when attempting to crawl
    http://social.technet.microsoft.com/Forums/en-US/sharepointsearch/thread/1632241d-d750-45d8-a4cf-8f00bfc61472

    この方の環境では、HOSTS を設定することで解決した、となっていますね。

    >When configuring the Office SharePoint Server Search service, do choose
    >"Use all web front end computers for crawling."
    >Manually modify the HOSTS file (C:\windows\system32\drivers\etc)
    >on all WFEs adding entries for each web application you desire to crawl.
    >Using the example from above, I would add the following to the HOSTS file of each WFE:
    >127.0.0.1 share
    >127.0.0.1 myshare
    >127.0.0.1 sspshare
    >(Following the pattern used by the SharePoint timer job which normally sets these,
    >you could also use the WFE's IP address instead of the localhost IP shown above.)

    >Execute "ipconfig /flushdns" to clear the DNS cache on each WFE
    >Crawl away!


    saruhiko
    • 回答としてマーク tayudari 2009年10月1日 6:28
    2009年8月18日 16:16

すべての返信

  • こんばんわ。

    解決に繋がるかは不明ですが、参考になりそうな情報を。

    SharePoint Server 2007 でクロールされるコンテンツと、エラー メッセージ:"に認識できない HTTP ステータスを受信しました。 Internet Explorer を使用して、アドレスをアクセスできることを確認する
    http://support.microsoft.com/kb/938219

    機械語なのでかなりイミフですが(原文読んだ方がいいかも…)、
    「プロキシを設定していないこと」が問題になることもあるようです。

    また、全く別の角度からの情報も。

    Unrecognized HTTP response was received when attempting to crawl
    http://social.technet.microsoft.com/Forums/en-US/sharepointsearch/thread/1632241d-d750-45d8-a4cf-8f00bfc61472

    この方の環境では、HOSTS を設定することで解決した、となっていますね。

    >When configuring the Office SharePoint Server Search service, do choose
    >"Use all web front end computers for crawling."
    >Manually modify the HOSTS file (C:\windows\system32\drivers\etc)
    >on all WFEs adding entries for each web application you desire to crawl.
    >Using the example from above, I would add the following to the HOSTS file of each WFE:
    >127.0.0.1 share
    >127.0.0.1 myshare
    >127.0.0.1 sspshare
    >(Following the pattern used by the SharePoint timer job which normally sets these,
    >you could also use the WFE's IP address instead of the localhost IP shown above.)

    >Execute "ipconfig /flushdns" to clear the DNS cache on each WFE
    >Crawl away!


    saruhiko
    • 回答としてマーク tayudari 2009年10月1日 6:28
    2009年8月18日 16:16
  • saruhiko様

    お世話様です。ご指摘有難うございます。

    KB938219はこちらでも認識していました(機械翻訳は確かに読みにくいですね ^^;)
    こちらの環境では特にプロキシを利用していないので、MOSSサーバ上でプロキシの設定はしていません。
    また、IEでもプロキシの設定はしていません。

    HOSTSの方は初めて聞きました。Jeremy Jameson for his blogも読んでみましたが英語なので...言葉の壁は厳しいですね。
    クロール処理にhostsを利用している、と言う事なのでしょうか?
    まずは試してみます。
    有難うございます。



    • 回答としてマーク tayudari 2009年8月27日 5:20
    • 回答としてマークされていない tayudari 2009年10月1日 6:28
    2009年8月19日 4:55
  • saruhiko様

    お世話様です。tayudariです。

    ご指摘いただいた通り、Indexサーバのhostsにホスト名を追加して再度クロールしたところ、
    見事に「認識できないHTTP応答」のエラーが消えました!

    クロール処理をする際、最初にhostsを見に行って、その段階で他のサーバがhostsに書かれて
    いないため、「無いよ」と言ってにエラーを吐いてたのですね。

    色々ご指導いただき、本当に有難うございます。

    2009年8月20日 2:47