none
關於PDF的全文搜尋... RRS feed

  • 問題

  • 請教各位前輩......

     

    近日想測試一下關於PDF搜尋的機制,

    於是安裝了ADOBE釋出的IFilter(5.0及6.0皆裝過...)

    確定了機碼正確,

    (不過不知道是否未安裝完全,ADOBE PDF的小圖示出不來,還是爬文另外以添加圖片的方式讓他顯示)

     

    但是在搜尋結果,假設檔名為KMKM.pdf

     

    顯示結果便會呈現

    ﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦

    KMKM.pdf(主檔名)

    KMKM.pdf… KMKM.pdf… pdf (原本應該顯示內文的地方)

    ﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦﹦

    左邊的小圖示也是IE的標誌,我想是無法辨識副檔名的關係,

    因為測試添加一個fff.ggg的文件,由於無法辨識副檔名,呈現的結果也是一樣

     

    不知道有沒有前輩出現了相同的情況,是否與Server端也要安裝PDF的Reader有關?

    與IFilter的安裝順序是否也有關?

    還是哪個環節忽略掉了,還請各位前輩解答。

     

     

    另外,就搜尋方面,檔名2222.pdf的文件

    搜尋2222可以搜尋得到,但是搜尋22就搜尋不到,數字格式是否也有WordBreakers的問題?

     

    才疏學淺,有些問題頗沒水準,還請見諒。

    2007年6月15日 上午 04:47

解答

  • Dear:

     

    1. Download Adobe Reader v.8 .

    2. Add the filter-extension to the File types crawled:

    Start -> Program -> Microsoft Office Server -> SharePoint 3.0 Central Administration  -> <Name of SharedService Provider> -> Search Settings -> File Types -> New File Type (Add extension  pdf here)

    3. Modify the following Registry keys by changing their "Default" value to the new CLSID of the Adobe IFilter: 

    {E8978DA6-047F-4E3D-9C78-CDBE46041603}

     

    HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office server\12.0\Search\Setup\ContentIndexCommon\Filters\Extension\.pdf

    Default --> {E8978DA6-047F-4E3D-9C78-CDBE46041603}

     

    HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Shared Tools\Web Server Extensions\12.0\Search\Setup\ContentIndexCommon\Filters\Extension\.pdf

    Default --> {E8978DA6-047F-4E3D-9C78-CDBE46041603}

     

    4.  Add the Installation directory of the Adobe Reader v.8 to the System Path. For example, if the Reader is installed on "D:\Program  Files\Adobe", then add "D:\Program Files\Adobe\Reader 8.0\Reader" to the system path by:

    Right Click on My Computer -> Properties -> Advanced -> Environment Variables -> Path (Under System Variables) -> Edit -> (Add "D:\Program Files\Adobe\Reader 8.0\Reader").

     

    This effectively tells the adobe IFilter where to pick up the dependent DLLs.

     

    5. Recycle the search service: > net stop osearch

                                                                > net start osearch

     

    6. Walla! Now we can crawl and search PDF documents with v.8 Reader.

    2007年6月23日 下午 04:56