細かい修正点は他にもたくさんあります。データベースに格納するデータが大幅に増えたため、gonzui-import にかかる時間も増えました。性能の改善に徐々に取り組んでいく予定です。
マルチバイト文字の検索は今のところ unigram という非常に安直な方法をとっています。茶筌やMeCabなどを用いた単語分割は行いません。たとえば ruby-1.8.2.tar.gz を取り込んで「オブジェクト サイズ」で検索すると このような検索結果が得られます。ただのテキストファイルをまとめて突っ込んでも同様の検索ができますが、 gonzui-import はかなり遅いのが難点です。
開発者用のメーリングリストを sourceforge.jp に作りました。興味のある方は参加していただければと思います。