Hyper Estraier:インデックス管理系コマンド

最終更新日時:2009-06-16 00:00:00
Hyper Estraier

Hyper Estraierは、主に estcmd というコマンドを使用してインデックスを管理します。
estcmd は非常に多くのオプションがあり、機能も多機能なので、そのうちの代表的なものだけここでは紹介します。

インデックス作成


まず初めにインデックスを作成します。

 % estcmd gather -il ja -sd index_path target_path


index_pathはインデックスとなるディレクトリ、target_pathは検索対象となるディレクトリです。
-sdはファイルの作成日時と更新日時をインデックスに記録するというオプションで、次回から差分のみ更新する場合に必要となります。

2回目からは以下のようにしてインデックスを更新します。
-cmはインデックス内に存在しないか、更新日時が新しい文書のみを登録するオプションです。
-clは上書きされた文書が含んでいた語句のインデックスを再構築するオプションです。

 % estcmd gather -cl -il ja -sd -cm index_path target_path


インデックス表示


以下を実行すると、インデックスに登録されている文書のID,uriの一覧を表示することができます。

 % estcmd list index_path


インデックス削除


インデックスから明示的にファイル情報を指定して削除するには以下のようにします。

 % estcmd out -cl index_path expr


exprは、uri、ローカルパス、IDですが、正規表現が使えないので少々不便。
安全面を考えると仕方ないのかも知れませんが。

検索対象となるファイル群からファイルが削除された際には、以下のようにしてインデックスからそのファイル情報を削除します。

 % estcmd purge  -cl index_path


上書きされたファイルや削除されたファイルは、上記の更新や削除を行ってもマークが付けられているだけで実際にはインデックス上に残っています。
以下のようにして、これらを実際に削除してインデックスを最適化します。

 % estcmd optimize   index_path


インデックス修復


インデックス作成中の異常終了等により、インデックスが壊れることがあります。
その時にはダメ元で以下のように修復を試みてみましょう。

 % estcmd repair index_path


お問い合わせは 掲示板 にて。