■Namazu for WINのインストール
NamazuはlinuxなどUNIX系OSをはじめ、Windowsにも移植されたフリーで高機能な全文検索システムです。Windowsへのインストールはそれほど難しくありません。WindowsでもapacheやAN HTTPDなどWebサーバと組み合わせればCGIとして利用できます。Search-S for namazuというGUIなアプリケーションを利用すれば、LocalなPCに保存しているhtmlやtext、word、excel、power point、pdf、一太郎などのファイルを全文検索できるようになります。

 ■Microsoft Windows Installerのインストール
Namazuの動作に必要なActive Perlなどのインストールに欠かせないMicrosoft Windows Installer(InstMsi.exe)をインストールします。

Microsoft Windows Installerはマイクロソフトが提供しているmsiという拡張子の形式のファイルをインストールするためのインストーラです。Active Perlやapacheは最近、msi形式でも提供されるようになりました。Microsoft Windows Installerは9x系(98、ME)用とNT系(NT、2000、XP)用があります。MEと2000、XPは標準で入っています。インストールはダウンロードしたInstMsi.exeを起動するだけです。なお、Microsoft Windows Installerにはversion1.1とversion2.0の2種類があります。最近はversion2.0でないと、インストールできないアプリケーションもあります。Active Perlの最新バージョンはversion2.0が必要です。インストール時に「version2.0以上が必要」との英語のメッセージが表示されたら、バージョンアップしましょう。

入手先

Version2.0
9x系用
http://www.microsoft.com/downloads/release.asp?releaseid=32831
http://download.microsoft.com/download/WindowsInstaller/Install/2.0/W9XMe/EN-US/InstMsiA.exe

NT系用
http://www.microsoft.com/downloads/release.asp?releaseid=32832
http://download.microsoft.com/download/WindowsInstaller/Install/2.0/NT45/EN-US/InstMsiW.exe

Version1.1
9x系用
http://download.microsoft.com/download/platformsdk/wininst/1.1/W9X/EN-US/InstMsi.exe
NT系用
http://download.microsoft.com/download/platformsdk/wininst/1.1/NT4/EN-US/InstMsi.exe

 ■Active perlのインストール
PerlはCGIでおなじみのスクリプト言語です。Namazuはインデックスを作成するmknmzコマンドや各種文書フィルタなどがperlで記述されているため、Perlが動作する環境でないと、インストールできません。Windows用のPerl(Active Perl)はhttp://www.activestate.com/から入手できます。最新バージョンはActivePerl-5.6.1.635です。

なお、Active PerlはActivePerl 5.8.0 build 804など新しい5.8系もリリースされていますが、5.8系環境ではNamazuのインストールに失敗するようです(PPMがインストールできない)。Win32版のパッケージャの竹迫さんが5.8用のPPMをコンパイルして暫定的に公開されていますので、それを利用すると使えるようになるようです。手元の環境では試していませんので、自己責任でどうぞ。

http://www.namazu.org/ml/namazu-win32-users-ja/msg01528.html


入手先
5.6.1.631
http://downloads.activestate.com/ActivePerl/Windows/5.6/ActivePerl-5.6.1.631-MSWin32-x86.msi

5.6.1.632
http://downloads.activestate.com/ActivePerl/Windows/5.6/ActivePerl-5.6.1.632-MSWin32-x86.msi

5.6.1.633
http://downloads.activestate.com/ActivePerl/Windows/5.6/ActivePerl-5.6.1.633-MSWin32-x86.msi

5.6.1.635
http://downloads.activestate.com/ActivePerl/Windows/5.6/ActivePerl-5.6.1.635-MSWin32-x86.msi

任意のフォルダにダウンロードしたActivePerl-5.6.1.***-MSWin32-x86.msi(***は635などのバージョン番号)をダブルクリックすると、Microsoft Windows Installerが起動します。9x系はversion2.0が必要です。基本的に標準の設定のままで進めればOKです。インストール先はC:\perlが分かりやすいと思います。なお、5.6.1.630は98系にインストールした場合、Namazuのインストールが失敗する不具合(バグ)があるそうです。

C:\Autoexec.batをテキストエディタ(メモ帳など)で開き、Perl用のパスとして

SET PATH=C:\Perl\bin;%PATH%

が書き込まれていることを確認します。NT系の場合は環境変数にPerlのパスが書き込まれていることを確認します。PCを再起動します。再起動後、MS-DOSプロンプト(NT系はコマンドプロンプト)を起動し、perl -vと入力してみます。

C:\WINDOWS>perl -v

This is perl, v5.6.1 built for MSWin32-x86-multi-thread
(with 1 registered patch, see perl -V for more detail)

Copyright 1987-2001, Larry Wall

Binary build 631 provided by ActiveState Tool Corp. http://www.ActiveState.com
Built 17:16:22 Jan 2 2002


Perl may be copied only under the terms of either the Artistic License or the
GNU General Public License, which may be found in the Perl 5 source kit.

Complete documentation for Perl, including FAQ lists, should be found on
this system using `man perl' or `perldoc perl'. If you have access to the
Internet, point your browser at http://www.perl.com/, the Perl Home Page.

と表示されれば、インストール成功です。

 ■kakasiのインストール
kakasi(かかし)は検索対象にしたいファイルに含まれる文章を意味が通る単語単位に分割(分かち書きというそうです)してくれる機能を提供しています。本来は「漢字かなまじり文をひらがな文やローマ字文に変換することを目的として作成したプログラムと辞書の総称」(http://kakasi.namazu.org/)だそうです。分かち書き機能が付いたため、日本語全文検索システムで有効に使えるようになっています。最新バージョンはkakasi-2.3.4です。

入手先
http://kakasi.namazu.org/win32/kakasi-2.3.4.zip

kakasiにはインストーラが付いていませんので、手動でフォルダの作成やパスの設定をする必要があります。以下はCドライブにkakasi(C:\kakasi)というフォルダを作成して作業するという前提で説明します。従って、インストール先が異なる場合はパスの設定などを適宜読み替えてください。

ダウンロードしたkakasi-2.3.4.zipを適当なフォルダ(C:\tempなど)で展開(解凍)します。Cドライブにkakasiという名前のフォルダ(C:\kakasi)を作成します。C:\kakasiフォルダに、C:\tempに展開したフォルダとファイルをすべてコピーします。(もちろん、kakasiフォルダを先につくり、このフォルダにkakasi-2.3.4.zipを展開しても構いません)

9x系の場合はC:\Autoexec.batをテキストエディタで開き、行末に以下のパスを手動で記述した上で、上書き保存します。

SET PATH=C:\kakasi\bin;%PATH%
SET KANWADICTPATH=C:\kakasi\share\kakasi\kanwadict
SET ITAIJIDICTPATH=C:\kakasi\share\kakasi\itaijidict

NT系は環境変数のシステム環境変数の変数Pathを編集し、値にC:\kakasi\binを追加するとともに、新規で変数KANWADICTPATHとITAIJIDICTPATHを作成し、それぞれの値にC:\kakasi\share\kakasi\kanwadictとC:\kakasi\share\kakasi\itaijidictを記入します。

Autoexec.batに記述した設定はPCを再起動するか、Autoexec.batを実行しないと有効になりません。よく分からない場合はAutoexec.batの編集が終わった時点でPCを再起動しましょう。

 ■Namazuのインストール
Namazuの最新バージョンは2.0.12です。詳細はhttp://www.namazu.org/を参照してください。WIN版は自己解凍形式のnmz2012.exeと、ZIP形式のnmz2012.zipが置いてありますが、通常の場合、自己解凍形式をダウンロードしましょう。インストールが楽です。

入手先
2.0.12
http://www.namazu.org/win32/nmz2012.exe

2.0.10
http://www.namazu.org/win32/nmz2010.exe


適当なフォルダにダウンロードしたnmz2012.exeをダブルクリックして実行します。インストーラが立ち上がるので、インストール先をC:\とします。実際にはC:\namazuにインストールされます。

インストール作業の途中でMS-DOSプロンプト(NT系はコマンドプロンプト)が開き

###
### Namazu for Win32 auto setting program.
###
Namazu for Win32の実行に必要な準備をセットアップします.
Do you wish to proceed? [Y/n]

とセットアップを実行するか聞かれるので、yを入力し、Enterキーを押します。

次に

----------------------------------------------
   Perl modules Installar for Windows ActivePerl
----------------------------------------------
Are you sure to install perl modules? [Y/n]

とPerl モジュールをインストールするか聞かれるので、yを入力し、Enterキーを押します。

なお、Word、Excel、Power Pointのファイルを検索対象にしたい場合、Namazuより先に各アプリケーションがインストールされている必要があります。Wordなどを後からインストールした場合は念のため設定ファイル(後述します)のバックアップを取った上で、再び、nmz2012.exeを実行して上書きインストールしてしまうのが簡単です。文書フィルタなどをカスタマイズしていれば、これもバックアップしておきましょう。PDFなどは後から必要なアプリケーションをインストールすれば、検索できるようになります。


C:\Autoexec.batをテキストエディタで開き、次のパスが行末に新たに記述されていることを確認します。

REM ###### Namazu for Win32 Environment variable setting
SET PATH=C:\namazu\bin;"%PATH%"
SET NAMAZURC=C:\namazu\etc\namazu\namazurc
SET NAMAZULOCALEDIR=C:\namazu\share\locale
SET MKNMZRC=C:\namazu\etc\namazu\mknmzrc
SET HOME=C:\namazu
SET LANG=ja_JP.SJIS

確認したら、PCを再起動します。なお、環境にもよるかもしれませんが、Windows XP Home EditionにNamazuをインストールした際、環境変数にHOMEのパスが設定されませんでしたので、手で記述しました。

再起動後、MS-DOSプロンプト(NT系はコマンドプロンプト)を起動し、namazu --helpと入力します。

C:\WINDOWS>namazu --help

namazu 2.0.12, Namazu の検索プログラム

使い方: namazu [options] <query> [index]...
-n, --max=NUM 一度に表示する件数
-w, --whence=NUM 表示する検索結果の先頭番号
-l, --list 検索結果を URI・パス名をリストで出力する
-s, --short 短い書式で出力する
--result=EXT 結果表示に用いる NMZ.result.EXT を指定する
--late 検索結果を新しい順にソートする
--early 検索結果を古い順にソートする
--sort=METHOD ソート方法を指定する (score, date, field:name)
--ascending ソートの方向を昇順にする (標準は降順)
-a, --all 検索結果をすべて表示する
-c, --count ヒット数のみを表示する
-h, --html HTMLで出力する
-r, --no-references 参考ヒット数を表示しない
-H, --page 先の検索結果へのリンクを表示する (ほぼ無意味)
-F, --form <form> ... </form> の部分を強制的に表示する
-R, --no-replace URI の置き換えを行わない
-U, --no-decode-uri URI encode の復元を行わない
-o, --output=FILE 指定したファイルに検索結果を出力する
-f, --config=FILE 設定ファイルを指定する
-C, --show-config 設定を表示する
-q, --quiet 検索結果以外のメッセージを表示しない
-d, --debug デバッグモード
-v, --version ヴァージョンを表示する
--help このヘルプを表示する

バグ報告は <bug-namazu@namazu.org> へどうぞ

namazuコマンドのオプションが表示されればインストールは成功です。

ついでにmknmz(インデックスを作成するときにお世話になるプログラム)のオプションを表示してみましょう。
C:\WINDOWS>mknmz --help
mknmz 2.0.12, Namazu のインデックス作成プログラム

使い方: mknmz [オプション] <対象>...

対象ファイル:
-a, --all すべてのファイルを対象とする
-t, --media-type=MTYPE 対象ファイルの文書形式を指定する
-h, --mailnews --media-type='message/rfc822' と同じ
--mhonarc --media-type='text/html; x-type=mhonarc' と同じ
-F, --target-list=FILE インデックス対象のファイルのリストを読み込む
--allow=PATTERN 対象とするファイル名の正規表現を指定する
--deny=PATTERN 拒絶するファイル名の正規表現を指定する
--exclude=PATTERN 除外するパス名の正規表現を指定する
-e, --robots 次の記述を含む HTMLファイルを除外する
<meta name="ROBOTS" content="NOINDEX">
-M, --meta HTMLの metaタグをフィールド指定検索に用いる
-r, --replace=CODE URIを置換するためのコードを指定する
--html-split HTMLファイルを <a name="..."> 単位で分割処理する
--mtime=NUM 変更日制限 find(1) の -mtime と同じ規則
例: -50 で 50 日以内、+50 で 50 日より古いものだ

形態素解析:
-c, --use-chasen 日本語の単語のわかち書きに ChaSen を用いる
-k, --use-kakasi 日本語の単語のわかち書きに KAKASI を用いる
-m, --use-chasen-noun 名詞のみを抽出する
-L, --indexing-lang=LANG インデックス時に言語に特化した処理を行なう

文字列処理:
-E, --no-edge-symbol 単語の両端の記号は削除する
-G, --no-okurigana 送り仮名を削除する
-H, --no-hiragana 平仮名のみの単語は登録しない
-K, --no-symbol 記号をすべて削除する

要約:
-U, --no-encode-uri URIのencodeを行わない
-x, --no-heading-summary HTML のヘディングによる要約作成を行わない


インデックス作成:
--update=INDEX 更新するインデックスを指定する
-Y, --no-delete 削除された文書の検出を行わない
-Z, --no-update 文書の更新・削除を反映しない

その他:
-s, --checkpoint チェックポイント機構を作動させる
-C, --show-config 現在の設定を表示する
-f, --config=FILE 設定ファイルを指定する
-I, --include=FILE カスタマイズ用ファイルを読み込む
-O, --output-dir=DIR インデックスの出力先を指定する
-T, --template-dir=DIR NMZ.{head,foot,body}.* のディレクトリを指定する
-q, --quiet インデックス処理の最中にメッセージを表示しない
-v, --version ヴァージョンを表示する
-V, --verbose 口やかましいモード
--debug デバッグモード
--help このヘルプを表示する

バグ報告は <bug-namazu@namazu.org> へどうぞ

これでNamazuのインストールは完了です。設定作業に移りましょう。

TOPに戻る miyazawat@hotmail.com