トップページunix
987コメント301KB

全文検索エンジンEstraier

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。NGNG
個人用途向けの全文検索エンジンEstraierに関する話題を扱う
スレッドです。

http://estraier.sourceforge.net/
0488名無しさん@お腹いっぱい。2005/11/14(月) 01:24:38
>>487
> ちなみに高林氏の友人でもあるPRIME作者の小松弘幸氏もGoogleで
> インターンやっていたらしい。

アメリカ留学時にインターンやって、帰国してGoogle入りしたんでしょ。

0489名無しさん@お腹いっぱい。2005/11/18(金) 01:53:59
1.0.6リリースage
正規表現サポートの模様
0490名無しさん@お腹いっぱい。2005/11/18(金) 02:33:40
>>489
今 ML で話題になってるけど(つかこんな時間に流れてくるとわ…)
またちょっと互換性問題があるみたいね。
0491名無しさん@お腹いっぱい。2005/11/18(金) 02:55:40
crmgr って
QDBM http://qdbm.sourceforge.net/
の中に入ってるコマンドのことかー
0492名無しさん@お腹いっぱい。2005/11/21(月) 00:03:55
超弩級迷子になっている件
0493名無しさん@お腹いっぱい。2005/11/21(月) 03:47:18
絶対遊んでいるだろ
0494名無しさん@お腹いっぱい。2005/11/25(金) 10:23:52
ブログ見てると、そろそろMeCabもサポートされそうな勢いだね。
本当に10倍速くなったらすごいな。
0495名無しさん@お腹いっぱい。2005/11/29(火) 11:07:55
なまずからはどうやって乗り換えればいいんですか?
0496名無しさん@お腹いっぱい。2005/11/29(火) 18:07:39
>>495
まず、HyperEstraierのドキュメントを読み、書いてある手順にしたがってインストールする。
それから、ナマズが対象にしていたファイルのインデックスをHyperEstraierで作りなおす。
0497名無しさん@お腹いっぱい。2005/11/30(水) 22:35:59
HyperEstaraier関係での質問なのですが,
replaceの正規表現による置換で,前方参照の書き方がわかりません.

replace: ^file:///home/hoge/diary/html/([0-9]{4})/([0-9]{\
4})\.html{{!}}http://hoge.example/diary/\1\2.html

のような置換が書きたいです.
どのように書けばよいでしょうか.

なにか良い方法がありましたら,よろしくお願いします.
0498名無しさん@お腹いっぱい。2005/11/30(水) 23:22:44
>>497
ほんとだ。出来ると思って試してみたら \1 とかだめだね。
mod_rewrite で誤魔化すしかなさそう。

replace: は(たぶん)上から評価されていくから、お馬鹿な方法なんだけれども

replace: ^file:///home/hoge/diary/html/{{!}}http://hoge.example/diary/
replace: 1999/{{!}}1999
replace: 2000/{{!}}2000
replace: 2001/{{!}}2001

って延々やっていくとか。
regex 使える前はこれしか実際出来なかったし。
0499名無しさん@お腹いっぱい。2005/11/30(水) 23:50:02
レスありがとうございます.
他に$1なども試しては見たのですが無理でした.

とりあえず,>>498さんの方法を使わせていただき,
前方参照の方法に対応したら,そちらを使うことにします.

ありがとうございました.
0500名無しさん@お腹いっぱい。2005/12/01(木) 00:00:50
estcmd gatherの-pxオプションで登録時にURLを指定すればいいんじゃない?

find /home/hoge/diary/html -type -f -name '*.html' -print |
perl -e '
while(<>){
chomp($_);
printf("%s", $_);
$_ =~ s/([0-9]+)\/([0-9]+)\.html$/\1\2.html/;
print $_;
}' |
estcmd gather -il ja -fh -px @uri casket -
0501名無しさん@お腹いっぱい。2005/12/01(木) 00:20:24
>>500
ほぅ、@uri に格納すればできたのかー
知らなかった。
0502名無しさん@お腹いっぱい。2005/12/01(木) 00:26:49
>>500
ありがとうございます.
もとの属性を変えてしまう,という方法ですね.
勉強になります.
0503名無しさん@お腹いっぱい。2005/12/01(木) 00:42:20
作者氏が、だれかEmacsインターフェース作って〜と呼びかけていますね。

着手した人はいますか?
0504名無しさん@お腹いっぱい。2005/12/01(木) 06:18:35
てかEmacsだと検索式入力がミニバッファくらいしか思い浮かばず萎える。
estcmdじか打ちのスクリプト組んでgnome-terminalみたいなURIをリンクとして
読んでくれるターミナル使ったほうがよさげだし
UNIX環境ならelispアプリにする必要性を感じなかったな
0505名無しさん@お腹いっぱい。2005/12/01(木) 09:31:19
そりゃ単にあんたの好みの問題だろう
0506名無しさん@お腹いっぱい。2005/12/01(木) 09:32:29
ミニバッファだからこそ使い易いんじゃないかな。
Firefoxの検索機能も今はミニバッファになったでしょ。
思考停止時間を最小にするのが目的だと思われ。
結果表示画面もEmacsならではの操作性にできるなら最高だ。
Mewとかと連携することもできるかもね。

0507名無しさん@お腹いっぱい。2005/12/01(木) 10:31:41
検索UIも欲しいけど、それより、ChangeLogをインデックスに登録するようにしてくれないかな。
ファイル全体を文書にするんでなくて、個々のエントリを文書として扱ってほしい。
セーブする時に古いファイルとdiffとればどこのエントリが更新されたかわかるはずだから、
更新されたエントリだけを登録するようにできそう。
05087542005/12/01(木) 10:37:52
ttp://www.mitsuki.no-ip.com/~seagull/diary/archives/by_id/000388.html

オレはこれで満足してるけど。
0509名無しさん@お腹いっぱい。2005/12/01(木) 16:06:27
満足した瞬間、人は死にはじめるのである。
0510名無しさん@お腹いっぱい。2005/12/01(木) 19:41:33
作者さんのコメント:
「Emacsインターフェイスのアイデア」
http://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11333263561092714358

M-x est-search-migemoって、ものすごい数のOR検索をすることになるけど、
実用的速度で動くのかね。
一致文章絞り込み段階での論理演算の順番の変更による最適化なんかの問題も
あったね。

0511名無しさん@お腹いっぱい。2005/12/11(日) 02:34:19
ver1.1.1 age
0512名無しさん@お腹いっぱい。2005/12/11(日) 02:38:14
残念なお知らせ
インデックスの互換性がぬぁい orz
0513名無しさん@お腹いっぱい。2005/12/11(日) 02:56:37
これ,更新履歴はどうやって見れる?

WEBにはまとまった履歴があがってないし,
ChangeLogにはソースコードの変更が書かれているだけ.

普通の人が意味のわかるChangeLogならまだしも,
これは作った人以外には理解不能でしょう.
0514名無しさん@お腹いっぱい。2005/12/11(日) 04:18:24
>>513
そこがいつもネックなのだがねぇ。

ver1.1.1 の変更点みたいなものは作者ブログ?で・・・
ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11342311101232356139
0515名無しさん@お腹いっぱい。2005/12/11(日) 04:24:12
>>513
確かにね。でも例えば Apache と比較しても、
http://www.apache.org/dist/httpd/CHANGES_2.2
それはたいして変わらないんじゃない?

httpd.conf を 2.0.5x から書き換える必要があるとか、
増えたディレクティヴが分かるわけではない。
0516名無しさん@お腹いっぱい。2005/12/11(日) 09:30:29
全然違うだろ
Webから参照できるだけど大違いだし、ソースレベルではない変更が書かれているし、
アップグレードに関することは別の文書としてまとまっているし。
0517名無しさん@お腹いっぱい。2005/12/11(日) 11:00:40
開発者は一度はGNU coding standardを読むべし。
何から何まで真似する必要はないけど。
0518名無しさん@お腹いっぱい。2005/12/11(日) 11:44:31
たぶん、作者の人はAPIを開発のメインと考えているようなので、
普通の人むけのChangeLogはあまり重要と考えていないんじゃないかな。

ああいうChangeLogはソースのdiffと一緒に読んでねっていうノリだからね。
なんつーかオープンソースならではってことでおおらかに構えるか、
またはMLで情報の集積場所が欲しいとか訴えてみれば? 手伝うっていえば喜ぶでしょ

しかしApache Projectと比べてサポートが劣っているていうはかわいそうだよ...
0519名無しさん@お腹いっぱい。2005/12/11(日) 11:48:24
ChangeLogはソースコードの変更箇所を特定するためのものであって、
機能説明をするものではない。必要十分な情報を簡潔に書くのがよいとされる。
エンドユーザにわかるようにだらだら書くのはむしろ間違いだろ。
0520名無しさん@お腹いっぱい。2005/12/11(日) 12:25:43
問題なのは、へたにChangeLog書き強制圧力をかけたりすると、
作者の意欲が減退したりポンと消失したりすることがあることである。

まわりの人がサポートするケースのように思える。
メーリングリストとやらのメンバーたちは何をやっているのか?
クレクレ君の集まりなのか?


0521名無しさん@お腹いっぱい。2005/12/11(日) 12:28:48
誰もChangeLog形式で書けとは言ってない

形式は問わず、もう少し上のレベルの更新履歴が欲しいと言ってるだけ

それがChangeLogの形式で提供されててもいいかね、という程度
ChangeLogにしろ、という話ではない
0522名無しさん@お腹いっぱい。2005/12/11(日) 12:29:18
つか、ブログ見ればすごい詳しく書いてあるだ。
0523名無しさん@お腹いっぱい。2005/12/11(日) 13:49:25
暗いと不平を言う前に、自分で火を放ちましょう。
0524名無しさん@お腹いっぱい。2005/12/11(日) 14:24:52
とりあえず,>>514を読んで満足しました.
0525名無しさん@お腹いっぱい。2005/12/11(日) 14:28:51
estcmd extkeys -um casket
はデータベースを更新するたびに呼んだほうがいいのかな?
0526名無しさん@お腹いっぱい。2005/12/11(日) 14:47:28
どうやらそのようですね.
2回目以降は更新のあったものだけが処理される風味.
0527名無しさん@お腹いっぱい。2005/12/11(日) 14:50:26
>>525
多分そう。
ほとんどの項目は passed になるからそんなに時間かからないっぽ。
05285272005/12/11(日) 14:51:07
すまん。かぶった。
0529名無しさん@お腹いっぱい。2005/12/11(日) 17:24:05
>>522
ブログにしか書いてなく、しかもそれがWebサイトからでは
容易には辿り着けないことを問題としてるんだろう。
情報があっても、そこへの誘導が皆無であれば無いのと同じこと。
0530名無しさん@お腹いっぱい。2005/12/11(日) 17:56:02
更新履歴の執筆なんかに力を入れるよりも、この調子でガンガン開発を続けて
いってほしい気がするけど。

0531名無しさん@お腹いっぱい。2005/12/11(日) 18:02:41
別に履歴に力を入れろとは言わないが、情報をまとめて欲しい。

なぜそこで履歴に力を入れることになってるのか疑問。
0532名無しさん@お腹いっぱい。2005/12/11(日) 18:12:18
じゃ、「力を入れる」は「気をつかう」に修正。
0533名無しさん@お腹いっぱい。2005/12/11(日) 18:15:30
だからこういうパターンでは、周辺がサポートすることで
対応するのが一般的な方法論だって。
0534名無しさん@お腹いっぱい。2005/12/11(日) 19:10:04
一般的
キタコレ
0535名無しさん@お腹いっぱい。2005/12/11(日) 19:19:49
いやだからblogに書いているようなことをトップから辿れるようにすればいいだけの話でしょ
なんでそうやって論点をズラそうとするんだか
0536名無しさん@お腹いっぱい。2005/12/11(日) 19:20:24
じゃぁ更新があったらMLでその都度聞けば?
そういう奴がウザいと思ったらきっとだれかが更新履歴とか、ブログの記事をまとめ始めるでしょ。

自分でやるのが嫌でも、そのくらいならできるでしょ。
煽りのつもりじゃないぞ
0537名無しさん@お腹いっぱい。2005/12/11(日) 19:54:23
他人がまとめたってそれじゃ作者のblogと同レベルかそれ以下だろう。
てか、なんでそこまで履歴を分かりやすくすることに否定的なのか意味が分からん。
0538名無しさん@お腹いっぱい。2005/12/11(日) 19:59:32
意外と本人がこのスレを見て芸風をあっさり変えたりしてな。
0539名無しさん@お腹いっぱい。2005/12/11(日) 20:48:27
なんでそこまで履歴に拘るのかも意味分からん。
0540名無しさん@お腹いっぱい。2005/12/11(日) 21:43:11
>>537
とりあえず更新のたびに関連するブログのエントリへのリンクのリストを並べるだけでいいじゃん。
おれも個人的にはなぜそこまでくわしい履歴が欲しいのかCとRuby経由からしか
使ってないからよくわからん。

だがアプリケーションとして普及させるならサポートは厚い方がいいに決まってるよね。
しかし、作者は全文検索アプリのためのAPIとして見てほしくて、インターフェイスは単なるデモ
みたいな発言をしていたよ。

それが不満なら...作者に直接声の届くmlか、直接メールするかして、
その上で作者が乗り気でないなら乗り換えるしかない気がするが。

ああ、いやもちろんプロジェクトをフォークする自由は常にある。LGPLだからね。
0541名無しさん@お腹いっぱい。2005/12/11(日) 22:25:45
アプリであろうとAPIであろうと、バージョンアップしたのなら
どこがどう変わったのか知りたいと思うのは普通じゃないの?
その変更点がWebから簡単に参照できればよいね、ってだけの話でしょ。
0542GNU coding standardのChangeLogの説明2005/12/11(日) 22:52:40
変更の目的を逐一書いたり, ある変更点と別の変更点との関係を書いたりする必要はありません.
変更についての説明が必要だと思うこともあるでしょう. その場合,おそらくその通りでしょう.
大いに説明を書いてください. ただし,その説明は,プログラム中にコメント文として書いてください.
そうすれば,プログラムを読む人は必ずそのコメント文を見ることになるからです. 例えば,関数を
一個追加したとき,変更履歴には "New function" と書けば充分です.その関数が何をする関数かの
説明はソースコード中で, その関数の定義の前にコメントとして書かれているはずだからです.
0543名無しさん@お腹いっぱい。2005/12/11(日) 22:55:05
だから、
ソースを読まずにChangeLogだけ読んで、「こんなんじゃ書いた本人しか分からん」
というのは筋違いだし、クレクレ君の典型だ。541の要求はもっともだが、そういう
書き出しから始まっているあたりが反感を買ったんだろう。
0544名無しさん@お腹いっぱい。2005/12/11(日) 23:15:34
論点をずらそうとしているのか、それとも論点を分かっていないのか…
0545名無しさん@お腹いっぱい。2005/12/11(日) 23:30:39
blogはWebから簡単に参照できるけど。
0546名無しさん@お腹いっぱい。2005/12/11(日) 23:42:03
ChangeLogはソースコードをコミットするときに書くようにけど。
ChangeLogと違ってユーザ向けのNEWSは更新を確実にするチャンスがないから。
粒度もChangeLogとは合致しないし、開発中はユーザにとっての変更が出る筈で
はなくても後からみてNEWSに書くべきことが発生していたというのもあり得る。

blogなら、ここに書いてなかったのに変わっとるのは怪しからん! という奴は
いないが、NEWSにしたら絶対そういう奴が出てくるだろうから、開発者が
無理なくそういう変更を拾って記述できるようなアイデアをセットで提案しないと。
0547名無しさん@お腹いっぱい。2005/12/12(月) 00:34:02
たしかにサポートって言う奴は要求する方は勝手だけど、
それを誰がやるのかっていうのはこれは大問題だよね。

マジで言い出しっぺがやってくださいよ。お願いしますよ。
たしかにその要求はもっともだからさ。


あと>>544 == >>541 だったならば、>>542
論点へいたる前提を論じてるのだと思うよ。
0548名無しさん@お腹いっぱい。2005/12/12(月) 01:51:50
で、Wikiの設置という流れになるのがトレンド。
0549名無しさん@お腹いっぱい。2005/12/12(月) 03:54:39
Windows版でMeCabを組み込めた香具師いる?
0550名無しさん@お腹いっぱい。2005/12/12(月) 04:29:19
> まわりの人がサポートするケースのように思える。
> メーリングリストとやらのメンバーたちは何をやっているのか?
> クレクレ君の集まりなのか?

> だからこういうパターンでは、周辺がサポートすることで
> 対応するのが一般的な方法論だって。

周辺とかまわりのひとってなんなのかね?
発言してる本人はどれにも該当しない第三者なの?

>>549
ML には
> なお、Windows版バイナリではMeCabのサポートはしていません。
となってる。
0551名無しさん@お腹いっぱい。2005/12/12(月) 13:11:08
>>550
> 周辺とかまわりのひとってなんなのかね?
> 発言してる本人はどれにも該当しない第三者なの?

そうだろうな。開発に参加していないくせに指示だけ出すやつだろ。
こういうやつは相手にしちゃいけない。コードを書かないやつは無視。
0552名無しさん@お腹いっぱい。2005/12/12(月) 13:25:19
>>550
「発言してる本人」が
「サポート」が必要だと感じてるとは限らんでしょ。
0553名無しさん@お腹いっぱい。2005/12/12(月) 13:28:16
電球の交換に必要な人員数をカウントするスレはここでつか?
0554名無しさん@お腹いっぱい。2005/12/12(月) 14:20:51
> コードを書かないやつは無視。

そんなこと言ってたら、ユーザは何も要望を出せなくなるだろ。
OSSはユーザのフィードバックがあってナンボなんだから、そんな偏狭な
姿勢ではプロジェクトは盛り上がってこないでしょ。
いろんな提案が出されることは歓迎すべきで、それを採用するかどうかは開発者の自由。
0555名無しさん@お腹いっぱい。2005/12/12(月) 15:54:28
>>554
要望ならいいんじゃね?
0556名無しさん@お腹いっぱい。2005/12/12(月) 16:06:16
>>554
> OSSはユーザのフィードバックがあってナンボなんだから、そんな偏狭な

そんな事はない。ユーザなど何の役にもたたないことがほとんど。

> 姿勢ではプロジェクトは盛り上がってこないでしょ。

ユーザゼロでも盛り上がる。

> いろんな提案が出されることは歓迎すべきで、それを採用するかどうかは開発者の自由。

いろんな提案が出されることを歓迎するかどうかは開発者の自由。
0557名無しさん@お腹いっぱい。2005/12/12(月) 16:19:37
>>556
キミがOSSの開発者だったとしたら、普通の人の反応としては、
その製品は使いたくないし、開発に貢献したいとも思わないってなるんじゃないかな。
ユーザがいなくていいならそもそも公開なんてしないっしょ。
0558名無しさん@お腹いっぱい。2005/12/12(月) 16:25:36
>>556
お前のような傲慢なやつは、ユーザにそっぽ向かれて消えるだけ。

オープンソースはユーザに使っていただいているものなのだから、

ユーザに対する謙虚な姿勢を忘れたら存在する意味は無い。

消えな。
0559名無しさん@お腹いっぱい。2005/12/12(月) 16:32:15
>>556
ユーザゼロで盛り上がった例を知りたい.

もちろん,ゼロっていうんだから,
コード書いてる人も使ってない状況でね.
0560名無しさん@お腹いっぱい。2005/12/12(月) 16:41:42
>>559
さあ、fj臭が漂ってまいりました!
0561名無しさん@お腹いっぱい。2005/12/12(月) 16:45:05
コード書いている人が使っていても他のユーザが使わなかったら
オープンソースとして盛り上がってるとは言わないだろ.
0562名無しさん@お腹いっぱい。2005/12/12(月) 16:46:58
開発者一人だけで盛り上がってる様を想像してワロタ
0563名無しさん@お腹いっぱい。2005/12/12(月) 18:15:10
>>560
これだからUNIX板の住人は…('A`)
0564名無しさん@お腹いっぱい。2005/12/12(月) 21:48:40
>>562
おなぬーですな。
0565名無しさん@お腹いっぱい。2005/12/12(月) 23:03:40
おまいらいいかげんスルーって行為を学習しような
0566名無しさん@お腹いっぱい。2005/12/13(火) 19:08:29
voidさん!はやく!
0567名無しさん@お腹いっぱい。2005/12/14(水) 19:03:58
506でこのスレは終了しました
0568名無しさん@お腹いっぱい。2005/12/14(水) 19:37:15
では、ここから仕切りなおして再開↓
0569名無しさん@お腹いっぱい。2005/12/14(水) 22:55:40
Luceneとどっちが速いの?
0570名無しさん@お腹いっぱい。2005/12/15(木) 12:49:51
>>569
Luceneって、キーワードハイライト機能ありますか?
0571名無しさん@お腹いっぱい。2005/12/15(木) 13:08:55
Luceneはテキストの登録と検索の機能を提供するライブラリにすぎないので、
表示部分は自分で作る必要がある。したがって、ハイライト機能も自分で作れば
どうとでもなる。
0572名無しさん@お腹いっぱい。2005/12/15(木) 13:21:46
要するにLuceneにその機能はない
0573名無しさん@お腹いっぱい。2005/12/15(木) 13:26:51
包丁に煮る機能がないのと同じだな。
0574名無しさん@お腹いっぱい。2005/12/15(木) 18:17:41
麻婆豆腐に例えれば豆鼓醤みたいなものか。
0575名無しさん@お腹いっぱい。2005/12/16(金) 14:41:26
>>574
入れればウマーくなるけど、入れなくても差し支えないよね、っていうことでつか
0576名無しさん@お腹いっぱい。2005/12/16(金) 17:11:17
>>575
あ、そうきたか。じゃあ麻婆豆腐で言えば豆腐ということで。
0577名無しさん@お腹いっぱい。2005/12/16(金) 17:26:56
麻婆豆腐が食べたくなってきた・・・
0578名無しさん@お腹いっぱい。2005/12/16(金) 17:30:52
574は気の利いた切り返しのつもりがぐだぐだだな。
水切りをサボった麻婆豆腐みたいなもんか。
0579名無しさん@お腹いっぱい。2005/12/16(金) 17:37:07
もういいから。
0580名無しさん@お腹いっぱい。2005/12/18(日) 23:59:45
>>25
エスカレイヤーかよ!
0581名無しさん@お腹いっぱい。2005/12/19(月) 00:38:08
1.1.2キターーー
0582名無しさん@お腹いっぱい。2005/12/19(月) 23:57:09
全文検索エンジンを用いたファイルシステムの名前空間拡張
滝田 裕、多田好克(電通大)

これってどんなのなんだろう?

0583名無しさん@お腹いっぱい。2005/12/20(火) 00:09:45
>>582
たとえば、「/search/検索語」というディレクトリの中を見ると、その検索語を含む
ファイルがずらっと出てくる。

とかなんじゃないかな?

なにそれ、Estraierが使われてるの?
0584名無しさん@お腹いっぱい。2005/12/20(火) 09:34:29
全文検索と言えば、日経コンピュータに
ファイルサーバーのってことで Google アプライアンスとかが紹介されてたな。
Namazu とか Estraier は全くふれられていなかったが。

ファイルサーバーの管理やったこと在るんだけど、
導入に見合った結果が得られるとは言い難いんだよな。
0585名無しさん@お腹いっぱい。2005/12/21(水) 19:44:28
>>584
>ファイルサーバーの管理やったこと在るんだけど、
>導入に見合った結果が得られるとは言い難いんだよな。

ユーザー(社員、学生?)が全文検索の意義を理解してくれないと言う事ですか?

たんに、UIが悪くて使ってもらえないくらいの意味ですか?

ぜひ詳しく聞きたいっす。


0586名無しさん@お腹いっぱい。2005/12/22(木) 09:12:13
おれも聞きたいな。

一般ユーザは、GoogleよりYahooの方が好きだし。
何であんなごちゃごちゃしている上に検索結果もいまいちな
インターフェイスが好きなのだ?
0587名無しさん@お腹いっぱい。2005/12/22(木) 15:35:21
> 検索結果もいまいちな

このあたりに鈍感だからだろう。
■ このスレッドは過去ログ倉庫に格納されています