コンテンツ クエリ Web パーツ (2.今日の日付を表示する)
コンテンツ クエリ Web パーツ (3.更新日時と本文を取得する)

PDF 用の IFilter 6.0 のインストール方法

※ 2009.2.6 追加

IFilterに関する最新情報は別の記事として投稿し直しました。最新情報は以下の投稿記事をご参照ください。
http://shanqiai.weblogs.jp/sharepoint_technical_note/2009/02/pdf-ifilter-a1b.html

*******************************

他の方もブログに IFilter 6.0 のインストール方法など書かれているようですが、受講者の方からのご質問が多いのでこちらのブログにも、以前自分なりに調べた内容を投稿しておきます。(通常は一日1投稿にしているんですが、今日はイレギュラーに2本目の投稿です。)

作業の概要

  1. PDF 用の IFilter をインストール
  2. アイコンの登録
・ダウンロード : Adobe PDF IFilter 6.0
・アイコン ファイル: ICPDF.gif(Steven Van さんのブログからダウンロードしたものを共有しておきます)

作業内容

  1. IIS Admin サービスを停止する
    [スタート] メニュー- [ファイル名を指定して実行] をクリックし、"services.msc"と入力し[OK] をクリックする。[サービスの管理]コンソールが表示されるので "IIS Admin Service" を停止する
  2. サーバー上でAdobe PDF IFilter 6.0 のセットアッププログラムを実行する
  3. アイコンファイル " ICPDF.GIF" を次のフォルダに格納する
    "C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\12\Template\Images"
  4. 次のフォルダ内にある "DOCICON.XML" をメモ帳などで開く
    C:\Program Files\Common Files\Microsoft Shared\Web server extensions\12\Template\Xml\DOCICON.XML
  5. 一連の<Mapping Key>タグに下記の、拡張子 *.pdf 用のエントリを追加する
    <Mapping Key="pdf" Value="icpdf.gif"/>
  6. iisreset を実行してIISを再起動する
  7. インデックスのリストに pdf ファイルの種類を追加する
    [共有サービス管理] ページの [検索]セクションにある[検索の設定]をクリックし、[クロール設定セクション]の[ファイルの種類]をクリックする。 新しいファイルの種類として拡張子"pdf"を追加する。
  8. フルクロールを実行する

なお上記 3,4,5 はアイコン表示を登録する設定です。


参考: Steven Van de Craen's Blog (英語)


以下、追記です。

これまで IFilter は単体をダウンロードしてきて利用していましたが、Adobe Acrobat Reader v8.以降ではアーキテクチャが変更されIFilter が含まれるようになっています。Adobe Acrobat Reader v8.1 に含まれる IFilter 8 は、 64bit 版 Windows Server 2003 上の SharePoint での利用がサポートされるようになっているようです。

32bitの環境でAcrobat Reader v8 を利用する場合の構成方法は、saruhiko さんの「SharePoint MANIACS」ブログに投稿がありましたので、参考にされるとよいと思います。ただし、アイコン表示は IFilter 6.0 の場合と同様に手動で登録する必要があります。

MOSS におけるPDFテキスト検索

コメント

Nishimura

こんにちは。
先週ハンズオンセミナーを受けさせていただいた西村です。
PDFアイコンの登録成功しました!ありがとうございます。
山崎さんのブログはきっと活用させていただくことになるかと思います。今後ともよろしくお願いいたします。

山崎愛

西村様、先週はご受講いただきまして、ありがとうございました。急ぎ、設定方法をこちらのブログにてご案内させていただきましたが、無事にアイコンが登録できたそうで良かったですconfident。こちらこそ、今後ともどうぞよろしくお願いいたします。

Nishimura

ありがとうございますcat
クロールの話が出ていましたので少しお聞きしたいのですが、クロールログに
「このファイルはダウンロードの制限に達しました。ドキュメントのテキスト全体を有効にクロールできるかどうか確認してください。」
というログがあがっていました。このダウンロード制限はどこに設定されているのでしょうか。MOSSではなくIIS側の設定でしょうか。だとするとメタファイルの直修正が必要なのかな。。

山崎愛

西村様
クロールログのことですね。既定ではファイルの先頭から16MBまでがクロールされるようになっています。これに起因するログです。この上限を変更する場合は、レジストリを変更する必要があります。SPS 2003 の頃からのものでリソースキットには記載があったかと思うのですが、これもまたきっと他の方も知りたいところだと思いますのでブログの記事として投稿するようにしたいと思います。 ですが、一日一投稿と自分ルールを決めており、今週分はすでにタイマーをしかけておりまして、、、来週分として公開したいと思います。少々お待ちいただけますでしょうか?よろしくお願いいたします。

Nishimura

おお、ありがとうございます。
SharePoint側の制限だったのですね。了解しました。
投稿ルールに従い、来週の投稿をお待ちしております。
よろしくお願いいたします。

さと

山崎さんのブログやセミナーをいつも参考にしています。
(ノ´▽`)ノ センセイ

さっそく質問ですが、IfilterをWSSにも導入できますか?
上記手順の7番の設定がわかりません・・・。
(8番も・・・。)

(いっつもWSSですみません・・・)

山崎愛

さとさん、

WSS v3 にもインストールできますよ。7.と 8. の手順が分からないということですが、この設定項目はMOSS 2007特有のものでWSS v3 にはありませんから、無理もありませんね。手元にWSS v3 単体の検証環境を持ち合わせていないのですが、Web で調べてみたところでは、1-6まではMOSSの場合と同様なのですが、WSS v3 の場合 iFilter インストール後にどうやらレジストリを編集しなければならないようです。詳細は以下のKBが参考になります。
http://support.microsoft.com/kb/927675/en-us

最後にフルクロールを実行しますが、 WSS v3 では GUI からは実行できないので、次のコマンドラインを実行する必要があります。
stsadm.exe -o spsearch -action fullcrawlstop
stsadm.exe -o spsearch -action fullcrawlstart

(参考)
http://workerthread.wordpress.com/2008/01/03/configure-pdf-ifilter-in-wss-30/

以上、ご参考まで。

rhigashi

はじめまして。

現在、以下の環境で64bit版 iFilter 8 の動作検証を行っております。

Windows Server 2003 Standard x64 Edition
SQL Server 2005 Enterprise Edition x64
MOSS 2007 Enterprise x64
全て1台のマシンにインストールしており、VMWare Workstation 6.0.2上で動いています。

以下のサイトを参考にして、レジストリや環境変数をいじりながら設定しています。

PDF iFilter 8 - 64-bit Support
http://labs.adobe.com/wiki/index.php/PDF_iFilter_8_-_64-bit_Support

Post Sharepoint 2007 / WSS 3.0 ToDos: Enable PDF in search and display
http://cs.grossmann.com/blogs/fg/archive/2007/07/10/post-sharepoint-todos.aspx

どちらのDLLもクロークはうまくいくのですが、検索が成功しません。
PDFファイルが検索対象外なのか、日本語で記述したPDFと英語で記述したPDFの両方をMOSS2007の保存しているのですが、どちらも検索結果に表示しません。
他に何か設定があれば、ご教授していただければ幸いです。

以上、よろしくお願いいたします。


山崎愛

nhigashiさん

はじめまして。残念ながら 手持ちの検証環境に64bit 環境がないため動作確認できずにおります。MSDNフォーラムの方に同一の投稿をされていらっしゃるようですので、私もそちらのほうで有志の方からのコメントがあることをまってみたいと思います。よろしくお願いいたします。

コメントの確認

コメントのプレビュー

プレビュー中です。コメントはまだ投稿されていません。

処理中...
コメントを投稿できませんでした。エラー:
コメントを投稿しました。コメントは記事の投稿者が承認してから表示されます。 さらにコメントを投稿する

入力された文字と数字は画像と一致していません。再度入力してください。

最後に、下の画像の中に見える文字と数字を入力してください。これはプログラムを使ってコメントを自動的に投稿するのを防ぐために行われています。

画像を読み取れない場合は 別の画像を表示してください。

処理中...

コメントを投稿

コメントは記事の投稿者が承認してから表示されます。

アカウント情報

(名前とメールアドレスは必須です。メールアドレスは公開されません。)