NamazuとChasen
2008-07-03
某サービスで Namazu を使っているのだが、これが非常に性能が悪い(-_-#
インデックス化の際に24時間を超えることもあるし。。。。
アルゴリズム的に非常にマズイことは明らかなのだが、そもそも mknmz が非常に遅い。
これ、なんとかならないのか???と思って調べてみると、、、、そもそも性能が大幅に劣化したのは、形態素解析がKAKASIからChasenに変わったタイミングの模様。
KAKASIよりもChasenの方が優秀だと思えるのでこれは仕方がないのだが、この変えたタイミングで、何故か Chasen の Perl モジュールを入れなかったのが問題みたい。
というか、KAKASI の時も Perl モジュールを入れていなかったみたいだが(-_-#
これは、Namazu を使うエンジニアとしては少々あり得ないので、まさかの盲点だった。。。
ということで、Chasen の Perl モジュール Text::Chasen をインストールし、Namazu の方で、明示的にそれを使うようにして一件落着。
今まで、最大で24時間以上かかっていたインデックス作成が、ものの数分で終わるようになったw
こんなの放置して引き継ぎとかちょっとあり得んだろ。。。。