none
SharePoint Foundation 2010でPDFファイルを検索できない RRS feed

  • 質問

  • 仮想サーバ上に一つの仮想環境を構築し下記1のようにSharePoint Foundation 2010を
    インストールしました。下記3のようにPDFを検索するための設定をしました。
    しかし、下記2のPDFファイルの中のキーワード「生産」でファイル検索できません。
    対象のPDFファイルをアクロバットリーダーで開いて同じキーワードで検索するとヒットします。
    下記3の設定後、仮想環境は何度も再起動しています。また、インディックスのリセットも
    実行後、フルクロールも実行しました。また、サイトは一つしか作成していません。
    PDFファイルの中のキーワードの検索を可能とするにはこの他にどうすればよろしいでしょうか。
    ご助言お願いします。
    クロールログを調べても成功数は加算されていますがエラーは発生していません。


    1.SharePoint Foundation 2010サーバのソフトのインストール状況
     次の(1)から(4)のソフトを一つの仮想環境にインストールしています。

    (1)Windows Server 2008 R2 Std SP1
    (2)SharePoint Foundation 2010
       インストールウィザードで次のように選択。
        ①インストールの種類を選択してください。:「サーバーファーム」を指定。
        ②サーバーの種類: 「スタンドアローン」を指定。
    (3)Search Server 2010 Express
    (4)SharePoint Designer 2010


    2.検索対象のPDFファイルの情報

     PDF変換: Adobe PDF Library 8.0
     PDFのバージョン: 1.6 (Acrobat 7.x)


    3.SharePoint FoundationでPDFファイルを検索するために実施した設定
      次のマイクロソフトサポートの設定をサーバに実施しました。

      http://support.microsoft.com/kb/2293357/en-us
      http://support.microsoft.com/kb/2518465

     

    2011年10月3日 1:19

すべての返信

  • どうも。
    切り分けのためのご確認ですが、PDFファイル自体は検索にヒットするが、中に含まれる
    テキスト情報が検索対象になっていない、ということで正しいでしょうか?
    加えて、PDFファイル自体の容量はどのくらいありますか?
    また、こちらが参考になるかも知れません : 
    http://social.technet.microsoft.com/Forums/ja-JP/sharepoint2010generalja/thread/6cdc9533-9ae2-4ddf-925d-3aada5eb59d3/

    SharePoint MANIACS あなたの SharePoint 活用できていますか?ちいさな「アドバイス」からご支援します。 http://sharepointmaniacs.com/
    2011年10月3日 5:36
  • ご回答ありがとうございます。

    PDFファイル内のキーワード「生産」で検索してもPDFファイル自体が検索にヒットしません。

    「検索結果はありません。生産」と表示されます。

    PDFファイル自体の容量は11MBです。

    ご提示いただいたサイトの3つのレジストリは全て設定してサーバも再起動しています。その後PDFファイルを追加してクロールしても

    結果は変わりません。

    <input id="bc608fba-8247-44fc-ab08-e3c5461856bd_attachments" type="hidden" />
    2011年10月4日 1:09
  • こちらの部分は如何ですか?「~PDFファイル自体は検索にヒットするが」

    例えばファイル名で検索して、そのPDFファイルは検索結果に表示されるでしょうか?

    また、同じリスト/ライブラリにある別の、例えばワードファイルはどうでしょう?

     

    とりあえずぱっと思いつく可能性ですが

    a: PDFが検索(インデックス)対象になっていない

    b: リスト/ライブラリが検索対象に入っていない

    c: リスト/ライブラリ側で検索に入らないよう設定されている

    d : 適切なifilter が導入されていない

    こんな感じですかね…

     

    お役にたてれば幸いです


    SharePoint MANIACS あなたの SharePoint 活用できていますか?ちいさな「アドバイス」からご支援します。 http://sharepointmaniacs.com/
    2011年10月4日 12:06
  • PDFファイル内の文章が「生産性の高い・・・」であるのに対し「生産」で検索するとヒットしませんでしたが、

    「生産性」ではヒットすることが分かりました。どうやらSharePointがインディックスを作成する際に文章の中のワード分割が

    大雑把なために起きているようです。

    もしそうなら希望するワードを追加したりするカスタマイズはできないのでしょうか。

     

     

     

    2011年10月5日 4:43
  • ワードブレイクの問題ですね。

    ある程度はできます。が、最終的にはブラックボックスですので、いかんともしがたいです。

    SharePoint 2007 の記事のため直接のご参考になるかは微妙ですが、

    検索の仕組み大枠は変わっていないはずですので、こちらが参考になるかと思います:

    http://sharepointmaniacs.com/archives/298


    SharePoint/Office365導入検討・運用・活用支援 http://sharepointmaniacs.com/ http://simplesso.jp
    2011年10月5日 7:32