none
PDFおよびDocuWorksファイルの検索について RRS feed

  • 質問

  • Microsoft Search Server 2008 Expressの設定をしています。
    検索したい資料の一部にPDFのファイルがありhttp://support.microsoft.com/kb/960628/ja
    に記載されている解説「32 ビット版の Office SharePoint Server 2007 および Windows SharePoint Services 3.0 において、
    Adobe PDF IFilter 8 および Adobe PDF IFilter 9 を使用し PDF ドキュメントを検索する方法」
    にしたがってAdobe Reader 9のインストール、レジストリの編集、サービスの再起動を実施しました。
    しかし、PDFの検索はファイル名などに入っている語句では検索されますが、中身のOCRなどによる
    文字情報でヒットしません。。メタデーターのプロパティのマッピングの設定などを変更する必要があるのでしょうか?
    OSはMicrosoft Windows Server 2003 R2 Standard Edition Service Pack 2です。

    追加補足
    DocuWorksのファイルに対してもContent Filter 7.0をインストールしていますが、同様の状況です。。
    同じ資料をコンセプトベースなどでは検索出来ているので検索対象のファイルには問題ないと思っています。

    2009年12月3日 7:40

回答

  • こんばんは

    ありがちな間違いとしては、
    1.GUIDが間違っている
    2.iFilterを導入後、フルクロールを実施していない
    3.64Bit版のSharePointを使っている

    使用しているiFilterによって、GUIDが違う可能性があるので、古いバージョンのiFilterを使うのが良いかもしれません。
    古いバージョンのiFilterはWeb上で手順を探す事が容易だからです。
    取合えずで試すのであれば、6.0辺りが良いかもしれません。
    • 回答としてマーク 三沢健二 2009年12月17日 7:03
    2009年12月6日 16:34
  • yuma chanさん返信ありがとうございました。
    業務の合間に設定しており、確認遅くなりました。

    いくつか間違いがありました。
    まず、PDFのiFilterですが、Adobe Reader 9のみインストールしているつもりが、
    他の管理者によりiFilter 6.0がインストールされていました。

    また、Microsoft Office SharePoint Server用のレジストリとMicrosoft Windows SharePoint Services用のレジストリを
    混同しており、
    HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\12.0\Search\Applications\<GUID>\Gather\Search\Extensions\ExtensionList
    には、PDFがないままになっているのに気がついていませんでした。
    Microsoft Office SharePoint ServerとMicrosoft Windows SharePoint Servicesの違いがよく
    わかっていないのですが、両方設定必要なのでしょうか?
    (おそらくMicrosoft Windows SharePoint Servicesのみ使っている?)

    GUIDをiFilter 6.0用に変更したり、iFilter 6.0をアンインストールして、
    Adobe Reader 9のGUIDにしてみたりいろいろ試しましたが現状まだうまくいっていません。

    Docuworksはhttp://linxcel.spaces.live.com/を参考に設定したところ
    中身がクロール出来るようになりました。
    • 回答としてマーク 三沢健二 2009年12月17日 7:02
    2009年12月8日 7:32
  • この後、試しにFoxit PDF IFilterを入れてみたところ。pdfの中身を
    クロール出来るようになりましたが、、PDFファイルとの
    相性か何故か文字化けしているファイルが多々。。
    Foxit PDF IFilterをアンインストールして再度
    Adobe Reader 9をインストール。
    Adobe Reader 9用にレジストリを設定しなおしたところ
    ちゃんとクロール出来るようになったようです。
    どこかレジストリがおかしくなっていたのだと思います。
    • 回答としてマーク 三沢健二 2009年12月17日 7:02
    2009年12月8日 8:38

すべての返信

  • PDFファイルのクロールに関して再度調べ直したところ

    http://pnpk.net/cms/archives/1120/2
    に記載されているうちの
    文字列値を新規作成します。
    オブジェクト名を”38″に変更し、値を”pdf”とします。
    の部分は実行していなかった為実行してみました。
    ですが、、サービスを再起動すると
    コンテンツソースを読み込み中のまま
    クロールのコンテンツソースを選択しても
    HRESULT からの例外: 0x80040D1B

    というエラーが出て何もさわれない状況になりました。。
    検索結果もクエリ内の範囲が存在しません。とだけ表示される状況です。。。。


    2009年12月4日 9:40
  • 上記の状況は、レジストリを戻したところ復旧しました。
    PDFを追加しましたが、見落としておりすでにありました。。
    (2重になっていた為エラーになっていた。)
    中身を検索出来ない状況はかわりないですが、、、。
    検索出来ないものなのでしょうか??
    2009年12月4日 10:29
  • こんばんは

    ありがちな間違いとしては、
    1.GUIDが間違っている
    2.iFilterを導入後、フルクロールを実施していない
    3.64Bit版のSharePointを使っている

    使用しているiFilterによって、GUIDが違う可能性があるので、古いバージョンのiFilterを使うのが良いかもしれません。
    古いバージョンのiFilterはWeb上で手順を探す事が容易だからです。
    取合えずで試すのであれば、6.0辺りが良いかもしれません。
    • 回答としてマーク 三沢健二 2009年12月17日 7:03
    2009年12月6日 16:34
  • yuma chanさん返信ありがとうございました。
    業務の合間に設定しており、確認遅くなりました。

    いくつか間違いがありました。
    まず、PDFのiFilterですが、Adobe Reader 9のみインストールしているつもりが、
    他の管理者によりiFilter 6.0がインストールされていました。

    また、Microsoft Office SharePoint Server用のレジストリとMicrosoft Windows SharePoint Services用のレジストリを
    混同しており、
    HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\12.0\Search\Applications\<GUID>\Gather\Search\Extensions\ExtensionList
    には、PDFがないままになっているのに気がついていませんでした。
    Microsoft Office SharePoint ServerとMicrosoft Windows SharePoint Servicesの違いがよく
    わかっていないのですが、両方設定必要なのでしょうか?
    (おそらくMicrosoft Windows SharePoint Servicesのみ使っている?)

    GUIDをiFilter 6.0用に変更したり、iFilter 6.0をアンインストールして、
    Adobe Reader 9のGUIDにしてみたりいろいろ試しましたが現状まだうまくいっていません。

    Docuworksはhttp://linxcel.spaces.live.com/を参考に設定したところ
    中身がクロール出来るようになりました。
    • 回答としてマーク 三沢健二 2009年12月17日 7:02
    2009年12月8日 7:32
  • この後、試しにFoxit PDF IFilterを入れてみたところ。pdfの中身を
    クロール出来るようになりましたが、、PDFファイルとの
    相性か何故か文字化けしているファイルが多々。。
    Foxit PDF IFilterをアンインストールして再度
    Adobe Reader 9をインストール。
    Adobe Reader 9用にレジストリを設定しなおしたところ
    ちゃんとクロール出来るようになったようです。
    どこかレジストリがおかしくなっていたのだと思います。
    • 回答としてマーク 三沢健二 2009年12月17日 7:02
    2009年12月8日 8:38
  • こんにちは、フォーラムオペレーターの三沢健二です。

    yama chan さん、アドバイスありがとうございます。

    しろうさ さん、調査結果のご報告ありがとうございました。

    自己解決されたようですが、こちらのスレッドを情報共有させていただくために、私の方で [回答としてマーク] を付けさせていただきました。


    それでは、今後とも TechNet フォーラムをよろしくお願いします。

    ______________________________________
    マイクロソフト株式会社 フォーラム オペレーター 三沢健二

    2009年12月17日 7:04