このページではWebコンテンツサイト内検索機能を付加する全文検索エンジンNamazuインストールについて初心者/ビギナー向けに解説します。

HPの格安エントリーサーバー機"HP ProLiant ML115"でのLinuxサーバー構築記を掲載しました。サーバー機の選定にお悩みの方は是非お越しください...。お便利サーバー.com管理人。
補助ツールのセットアップ
全文検索システムNamazuの構築

全文検索エンジンとは

Namazuのインストール

Namazuのファイル構成

Apacheによる公開設定

索引作成のための設定

mknmzによる索引の作成

検索出力のための設定

namazu.cgiによる検索の実行

出力デザインのカスタマイズ

Namazu検索窓の設置

Namazuの運用のポイント

サイト内検索

日本語全文検索エンジンの草分け"Namazu"について

Namazu は、検索サイトの付加サービスや CMS が一般化するよりもずっと前から利用されている全文検索エンジンで、かつては日本語 コンテンツ の検索エンジンサービスのスタンダードとして確固たる地位を確立していました。

実際、今でも LinuxOS の多くの ディストリビューション で標準実装されています。

Namazuは HTML ファイルや テキスト ファイルだけではなく、補助プログラムをインストールすることでアドビ社のアクロバット形式やマイクロソフト社のオフィス形式のファイルまで扱うことができますから、 クライアント 用途でもしばしば用いられます。

ただ最近では代替システムの登場によって「サイト内検索エンジンの選択肢の一つ」という地位に甘んじてしまっている感は否めません。

しかしCMSに頼らないコンテンツで、なおかつ良質なサイト内検索サービスを提供するには今でも最適なシステムと言ってよいでしょう。

Namazuの解説書です

残念なことに、Namazuは RedHatLinux FedoraCore3 までは RPM の標準パッケージが実装されていて、 yum で簡単に インストール できたのですが、 WBEL CentOS 、そして新しいFedoraCoreでは標準ではなくなっているため、 ソース からインストールするか他のディストリビューションのパッケージを転用する必要があります。

以下にWBELやCentOSにNamazuをインストールする方法を示します。

このページの先頭へ↑

Namazuシステムのダウンロードとインストール(WBEL3,CentOS3)

WBEL3 及び CentOS3 Namazu のシステムを構築する場合、 RedHatLinux9 RPM を転用することができます アプリケーション導入の考え方について

Namazuはいくつかのプログラムの組み合わせで動作しますので、RedHatLinux9用の以下のRPMをすべて インストール する必要があります。

namazu-2.0.12-5.i386.rpm ...Namazuプログラム本体

namazu-cgi-2.0.12-5.i386.rpm ...検索用CGIプログラム

namazu-devel-2.0.12-5.i386.rpm ...Namazu開発用プログラム

kakasi-2.3.4-10.i386.rpm ...日本語変換プログラムKAKASI本体

kakasi-devel-2.3.4-10.i386.rpm ...KAKASI開発用プログラム

kakasi-dict-2.3.4-10.i386.rpm ...KAKASI辞書

perl-File-MMagic-1.16-3.noarch.rpm ...ファイル種判定 Perl モジュール

perl-NKF-1.71-10.i386.rpm ...文字コード変換Perlモジュール

perl-Text-Kakasi-1.05-5.i386.rpm ...KAKASI用Perlモジュール

これらのファイルは例えば理化学研究所の アノニマスFTP サイト 理化学研究所のアノニマスFTPサイトへ に接続し、

Linux→redhat→archive.redhat.com→redhat→linux→9→en→os→i386→RedHat→RPMS

の順に開くと見つかりますので、ご利用の クライアント機 に一旦 ダウンロード してから 構築中のLinuxサーバー FTPクライアント などを使って アップロード します。

コマンドを叩くのが好きな方は、 構築中のLinuxサーバー にSSHクライアントでログインして wget コマンドでダウンロードしてもOKです。
もっとも、こんなにファイルの数が多いケースではクライアント機経由のほうが簡単だと思います。

アップロードするRPMの数が多いので他の用途のRPMと混ざらないように、例えば ホームディレクトリ "/home/tanaka/" 以下に "namazu_rpm" のようなディレクトリを作成して、その中にまとめてアップロードすると良いでしょう。

次に、 サブネット 内の適当な クライアント機 から SSHクライアント 構築中のLinuxサーバー ログイン します SSHクライアントでサーバーに接続する(WBEL3) SSHクライアントでサーバーに接続する(CentOS3)

それから su コマンド ユーザーアカウント "root" に変更し、 rpm コマンドでこれらのRPMをインストールします。

Perlのモジュールなど既にインストールされているパッケージがある場合は、「インストール済み」という英語のメッセージが出て、必要なパッケージだけがインストールされます。
[tanaka@web1 tanaka]$ su -Enter
Password: "root"のパスワードを入力します。 Enter
[root@web1 root]# rpm -ivh /home/tanaka/namazu_rpm/*.rpmEnter
警告: /home/tanaka/namazu_rpm/kakasi-2.3.4-10.i386.rpm: V3 DSA signature: NOKEY, key ID db42a60e
Preparing...        ########################################### [100%]
  1:kakasi         ########################################### [ 11%]
  2:perl-Text-Kakasi    ########################################### [ 22%]
  3:perl-NKF        ########################################### [ 33%]
  4:perl-File-MMagic    ########################################### [ 44%]
  5:namazu         ########################################### [ 56%]
  6:kakasi-devel      ########################################### [ 67%]
  7:kakasi-dict      ########################################### [ 78%]
  8:namazu-cgi       ########################################### [ 89%]
  9:namazu-devel      ########################################### [100%] [root@web1 root]#

以上でインストール作業は終了です。

このページの先頭へ↑

Namazuシステムのダウンロードとインストール(WBEL4,CentOS4)

WBEL4 及び CentOS4 Namazu のシステムを構築する場合、 FedoraCore3 RPM を転用することができます アプリケーション導入の考え方について

Namazuはいくつかのプログラムの組み合わせで動作しますので、FedoraCore3用の以下のRPMをすべて インストール する必要があります。

namazu-2.0.13-3.i386.rpm ...Namazuプログラム本体

namazu-cgi-2.0.13-3.i386.rpm ...検索用CGIプログラム

namazu-devel-2.0.13-3.i386.rpm ...Namazu開発用プログラム

kakasi-2.3.4-17.i386.rpm ...日本語変換プログラムKAKASI本体

kakasi-devel-2.3.4-17.i386.rpm ...KAKASI開発用プログラム

kakasi-dict-2.3.4-17.i386.rpm ...KAKASI辞書

perl-File-MMagic-1.21-2.noarch.rpm ...ファイル種判定 Perl モジュール

perl-NKF-2.04-3.i386.rpm ...文字コード変換Perlモジュール

perl-Text-Kakasi-1.05-11.i386.rpm ...KAKASI用Perlモジュール

これらのファイルは例えば理化学研究所の アノニマスFTP サイト 理化学研究所のアノニマスFTPサイトへ に接続し、

"i386" のところはお使いの環境によって変わります。
多分どっちでも構わないと思いますけど。

Linux→fedora→core→3→i386(またはx86_64)→os→Fedora→RPMS

の順に開くと見つかりますので、ご利用の クライアント機 に一旦 ダウンロード してから 構築中のLinuxサーバー FTPクライアント などを使って アップロード します。

コマンドを叩くのが好きな方は、 構築中のLinuxサーバー にSSHクライアントでログインして wget コマンドでダウンロードしてもOKです。
もっとも、こんなにファイルの数が多いケースではクライアント機経由のほうが簡単だと思います。

アップロードするRPMの数が多いので他の用途のRPMと混ざらないように、例えば ホームディレクトリ "/home/tanaka/" 以下に "namazu_rpm" のようなディレクトリを作成して、その中にまとめてアップロードすると良いでしょう。

次に、 サブネット 内の適当な クライアント機 から SSHクライアント 構築中のLinuxサーバー ログイン します SSHクライアントでサーバーに接続する(WBEL4) SSHクライアントでサーバーに接続する(CentOS4)

それから su コマンド ユーザーアカウント "root" に変更し、 rpm コマンドでこれらのRPMをインストールします。

Perlのモジュールなど既にインストールされているパッケージがある場合は、「インストール済み」という英語のメッセージが出て、必要なパッケージだけがインストールされます。
[tanaka@web1 ~]$ su -Enter
Password: "root"のパスワードを入力します。 Enter
[root@web1 ~]# rpm -ivh /home/tanaka/namazu_rpm/*.rpmEnter
警告: /home/tanaka/namazu_rpm/kakasi-2.3.4-17.i386.rpm: V3 DSA signature: NOKEY, key ID 4f2a6fd2
Preparing...        ########################################### [100%]
  1:kakasi         ########################################### [ 11%]
  2:perl-Text-Kakasi    ########################################### [ 22%]
  3:perl-NKF        ########################################### [ 33%]
  4:perl-File-MMagic    ########################################### [ 44%]
  5:namazu         ########################################### [ 56%]
  6:kakasi-devel      ########################################### [ 67%]
  7:kakasi-dict      ########################################### [ 78%]
  8:namazu-cgi       ########################################### [ 89%]
  9:namazu-devel      ########################################### [100%] [root@web1 ~]#

以上でインストール作業は終了です。

このサイトに対するご意見、ご要望、苦情、泣き言、献上品、資金援助などがございましたら こちら からお寄せください(お返事できなかったらごめんなさい)。もちろん リンクフリー です。趣味や勉強のためでしたら、引用、転用、コピー、朗読、その他OKです。このサイトへのリンクについては こちら をご覧ください。
Powered by Apache
”Linux”は、Linus Torvalds 氏の各国における登録商標です。”Red Hat”及びRed Hatのロゴおよび Red Hat をベースとしたすべての商標とロゴは、各国におけるRed Hat, Inc. 社の商標または登録商標です。その他のプログラム名、システム名、製品名などは各メーカー、ベンダの各国における登録商標又は商標です。
Powered by White Box Enterprise Linux