Web内を全文検索するためのツール「Namazu」をインストールしましょう。Namazuは高林哲氏が開発した日本語対応の全文検索エンジンです。ここでは、検索エンジンとしてNamazuを使用し、文書のフィルタリングに高橋裕信氏が開発したKAKASIを利用します。他にnkfも使用します。
1.nkfのインストール
ここを参照してください。なお、RedHat Linux 7.1J の場合は、デフォルトでインストールされていましたが、これは選んだパッケージによっても違うかもしれませんので、# rpm -qa | grep nkf で確認します。もしなければ、rpm ファイルがありますので、それでインストールします。RHL の場合、/usr/bin/ にインストールされます。
# rpm -ivh nkf-1.92-4.i386.rpm
2.KAKASIのインストール
これも、rpm パッケージにあるので、インストールされていなければ、インストールします。
# rpm -ivh kakasi-2.3.3-2.i386.rpm # rpm -ivh kakasi-devel-2.3.3-2.i386.rpm # rpm -ivh kakasi-dict-2.3.3-2.i386.rpm
3.Namazuのインストール
3-1.Namazuのダウンロード
Namazu の rpm ファイルをダウンロードしてインストールしてもいいのですが、何故か日本語表示がうまくいかなかったため、ソースからコンパイルすることにしました。最新バージョンは2001年8月現在、2.0.6 です。
# cd /usr/local/src # tar zxvf namazu-2.0.6.tar.gz # cd namazu-2.0.6
3-2.Namazuのmake
configureしてmakeします。makeの途中で失敗することがありますが、その場合はメッセージに従い指示されたどおりにします。そして、namazu.cgiをapacheのcgi-binディレクトリにコピーします。
# ./configure # make # make install # cp /usr/local/libexec/namazu.cgi /var/www/cgi-bin/
さらに、正しく日本語表示できるように、bashrc を書き換えます。
# vi /etc/bashrc ----- export LANG=ja_JP.eucJP
これで準備は整いました。
4.インデックスファイルの作成
次にインデックスファイルを準備します。デフォルトではインデックスファイルは、/usr/local/var/namazu/index ディリクトリーに置かれますので、そこでインデックスを作成します。
# cd /usr/local/var/namazu/index # mknmz /var/www/html/
これで数分から数十分後にインデックスが完成します。ここでメッセージに日本語が出ない場合は、環境設定を日本語に代える必要があります。毎朝6時にインデックスを作るようにcrontabを設定しましょう。
# crontab -e ----- 0 6 * * * cd /usr/local/var/namazu/index ; mknmz /var/www/html/ > /dev/null 2>&1 -----
5.namazurc の書き換え
このままでも、ブラウザから、/cgi-bin/namazu.cgiにアクセスすれば検索可能なのですが、検索結果がディリクトリパスで表されるため、URLで表現されるように一部書き加えます。サンプルファイルをコピーして適宜書き換えます。
# cd /usr/local/etc/namazu/ # cp -p namazurc-sample namazurc # cp -p mknmzrc-sample mknmzrc # vi namazurc ----- Replace /var/www/html/ http://www2.fujie.org/ ----- Lang ja_JP.SJIS