全文検索エンジンEstraier
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
NGNGスレッドです。
http://estraier.sourceforge.net/
0488名無しさん@お腹いっぱい。
2005/11/14(月) 01:24:38> ちなみに高林氏の友人でもあるPRIME作者の小松弘幸氏もGoogleで
> インターンやっていたらしい。
アメリカ留学時にインターンやって、帰国してGoogle入りしたんでしょ。
0489名無しさん@お腹いっぱい。
2005/11/18(金) 01:53:59正規表現サポートの模様
0490名無しさん@お腹いっぱい。
2005/11/18(金) 02:33:40今 ML で話題になってるけど(つかこんな時間に流れてくるとわ…)
またちょっと互換性問題があるみたいね。
0491名無しさん@お腹いっぱい。
2005/11/18(金) 02:55:40QDBM http://qdbm.sourceforge.net/
の中に入ってるコマンドのことかー
0492名無しさん@お腹いっぱい。
2005/11/21(月) 00:03:550493名無しさん@お腹いっぱい。
2005/11/21(月) 03:47:180494名無しさん@お腹いっぱい。
2005/11/25(金) 10:23:52本当に10倍速くなったらすごいな。
0495名無しさん@お腹いっぱい。
2005/11/29(火) 11:07:550496名無しさん@お腹いっぱい。
2005/11/29(火) 18:07:39まず、HyperEstraierのドキュメントを読み、書いてある手順にしたがってインストールする。
それから、ナマズが対象にしていたファイルのインデックスをHyperEstraierで作りなおす。
0497名無しさん@お腹いっぱい。
2005/11/30(水) 22:35:59replaceの正規表現による置換で,前方参照の書き方がわかりません.
replace: ^file:///home/hoge/diary/html/([0-9]{4})/([0-9]{\
4})\.html{{!}}http://hoge.example/diary/\1\2.html
のような置換が書きたいです.
どのように書けばよいでしょうか.
なにか良い方法がありましたら,よろしくお願いします.
0498名無しさん@お腹いっぱい。
2005/11/30(水) 23:22:44ほんとだ。出来ると思って試してみたら \1 とかだめだね。
mod_rewrite で誤魔化すしかなさそう。
replace: は(たぶん)上から評価されていくから、お馬鹿な方法なんだけれども
replace: ^file:///home/hoge/diary/html/{{!}}http://hoge.example/diary/
replace: 1999/{{!}}1999
replace: 2000/{{!}}2000
replace: 2001/{{!}}2001
…
って延々やっていくとか。
regex 使える前はこれしか実際出来なかったし。
0499名無しさん@お腹いっぱい。
2005/11/30(水) 23:50:02他に$1なども試しては見たのですが無理でした.
とりあえず,>>498さんの方法を使わせていただき,
前方参照の方法に対応したら,そちらを使うことにします.
ありがとうございました.
0500名無しさん@お腹いっぱい。
2005/12/01(木) 00:00:50find /home/hoge/diary/html -type -f -name '*.html' -print |
perl -e '
while(<>){
chomp($_);
printf("%s", $_);
$_ =~ s/([0-9]+)\/([0-9]+)\.html$/\1\2.html/;
print $_;
}' |
estcmd gather -il ja -fh -px @uri casket -
0501名無しさん@お腹いっぱい。
2005/12/01(木) 00:20:24ほぅ、@uri に格納すればできたのかー
知らなかった。
0502名無しさん@お腹いっぱい。
2005/12/01(木) 00:26:49ありがとうございます.
もとの属性を変えてしまう,という方法ですね.
勉強になります.
0503名無しさん@お腹いっぱい。
2005/12/01(木) 00:42:20着手した人はいますか?
0504名無しさん@お腹いっぱい。
2005/12/01(木) 06:18:35estcmdじか打ちのスクリプト組んでgnome-terminalみたいなURIをリンクとして
読んでくれるターミナル使ったほうがよさげだし
UNIX環境ならelispアプリにする必要性を感じなかったな
0505名無しさん@お腹いっぱい。
2005/12/01(木) 09:31:190506名無しさん@お腹いっぱい。
2005/12/01(木) 09:32:29Firefoxの検索機能も今はミニバッファになったでしょ。
思考停止時間を最小にするのが目的だと思われ。
結果表示画面もEmacsならではの操作性にできるなら最高だ。
Mewとかと連携することもできるかもね。
0507名無しさん@お腹いっぱい。
2005/12/01(木) 10:31:41ファイル全体を文書にするんでなくて、個々のエントリを文書として扱ってほしい。
セーブする時に古いファイルとdiffとればどこのエントリが更新されたかわかるはずだから、
更新されたエントリだけを登録するようにできそう。
0508754
2005/12/01(木) 10:37:52オレはこれで満足してるけど。
0509名無しさん@お腹いっぱい。
2005/12/01(木) 16:06:270510名無しさん@お腹いっぱい。
2005/12/01(木) 19:41:33「Emacsインターフェイスのアイデア」
http://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11333263561092714358
M-x est-search-migemoって、ものすごい数のOR検索をすることになるけど、
実用的速度で動くのかね。
一致文章絞り込み段階での論理演算の順番の変更による最適化なんかの問題も
あったね。
0511名無しさん@お腹いっぱい。
2005/12/11(日) 02:34:190512名無しさん@お腹いっぱい。
2005/12/11(日) 02:38:14インデックスの互換性がぬぁい orz
0513名無しさん@お腹いっぱい。
2005/12/11(日) 02:56:37WEBにはまとまった履歴があがってないし,
ChangeLogにはソースコードの変更が書かれているだけ.
普通の人が意味のわかるChangeLogならまだしも,
これは作った人以外には理解不能でしょう.
0514名無しさん@お腹いっぱい。
2005/12/11(日) 04:18:24そこがいつもネックなのだがねぇ。
ver1.1.1 の変更点みたいなものは作者ブログ?で・・・
ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11342311101232356139
0515名無しさん@お腹いっぱい。
2005/12/11(日) 04:24:12確かにね。でも例えば Apache と比較しても、
http://www.apache.org/dist/httpd/CHANGES_2.2
それはたいして変わらないんじゃない?
httpd.conf を 2.0.5x から書き換える必要があるとか、
増えたディレクティヴが分かるわけではない。
0516名無しさん@お腹いっぱい。
2005/12/11(日) 09:30:29Webから参照できるだけど大違いだし、ソースレベルではない変更が書かれているし、
アップグレードに関することは別の文書としてまとまっているし。
0517名無しさん@お腹いっぱい。
2005/12/11(日) 11:00:40何から何まで真似する必要はないけど。
0518名無しさん@お腹いっぱい。
2005/12/11(日) 11:44:31普通の人むけのChangeLogはあまり重要と考えていないんじゃないかな。
ああいうChangeLogはソースのdiffと一緒に読んでねっていうノリだからね。
なんつーかオープンソースならではってことでおおらかに構えるか、
またはMLで情報の集積場所が欲しいとか訴えてみれば? 手伝うっていえば喜ぶでしょ
しかしApache Projectと比べてサポートが劣っているていうはかわいそうだよ...
0519名無しさん@お腹いっぱい。
2005/12/11(日) 11:48:24機能説明をするものではない。必要十分な情報を簡潔に書くのがよいとされる。
エンドユーザにわかるようにだらだら書くのはむしろ間違いだろ。
0520名無しさん@お腹いっぱい。
2005/12/11(日) 12:25:43作者の意欲が減退したりポンと消失したりすることがあることである。
まわりの人がサポートするケースのように思える。
メーリングリストとやらのメンバーたちは何をやっているのか?
クレクレ君の集まりなのか?
0521名無しさん@お腹いっぱい。
2005/12/11(日) 12:28:48形式は問わず、もう少し上のレベルの更新履歴が欲しいと言ってるだけ
それがChangeLogの形式で提供されててもいいかね、という程度
ChangeLogにしろ、という話ではない
0522名無しさん@お腹いっぱい。
2005/12/11(日) 12:29:180523名無しさん@お腹いっぱい。
2005/12/11(日) 13:49:250524名無しさん@お腹いっぱい。
2005/12/11(日) 14:24:520525名無しさん@お腹いっぱい。
2005/12/11(日) 14:28:51はデータベースを更新するたびに呼んだほうがいいのかな?
0526名無しさん@お腹いっぱい。
2005/12/11(日) 14:47:282回目以降は更新のあったものだけが処理される風味.
0527名無しさん@お腹いっぱい。
2005/12/11(日) 14:50:26多分そう。
ほとんどの項目は passed になるからそんなに時間かからないっぽ。
0528527
2005/12/11(日) 14:51:070529名無しさん@お腹いっぱい。
2005/12/11(日) 17:24:05ブログにしか書いてなく、しかもそれがWebサイトからでは
容易には辿り着けないことを問題としてるんだろう。
情報があっても、そこへの誘導が皆無であれば無いのと同じこと。
0530名無しさん@お腹いっぱい。
2005/12/11(日) 17:56:02いってほしい気がするけど。
0531名無しさん@お腹いっぱい。
2005/12/11(日) 18:02:41なぜそこで履歴に力を入れることになってるのか疑問。
0532名無しさん@お腹いっぱい。
2005/12/11(日) 18:12:180533名無しさん@お腹いっぱい。
2005/12/11(日) 18:15:30対応するのが一般的な方法論だって。
0534名無しさん@お腹いっぱい。
2005/12/11(日) 19:10:04キタコレ
0535名無しさん@お腹いっぱい。
2005/12/11(日) 19:19:49なんでそうやって論点をズラそうとするんだか
0536名無しさん@お腹いっぱい。
2005/12/11(日) 19:20:24そういう奴がウザいと思ったらきっとだれかが更新履歴とか、ブログの記事をまとめ始めるでしょ。
自分でやるのが嫌でも、そのくらいならできるでしょ。
煽りのつもりじゃないぞ
0537名無しさん@お腹いっぱい。
2005/12/11(日) 19:54:23てか、なんでそこまで履歴を分かりやすくすることに否定的なのか意味が分からん。
0538名無しさん@お腹いっぱい。
2005/12/11(日) 19:59:320539名無しさん@お腹いっぱい。
2005/12/11(日) 20:48:270540名無しさん@お腹いっぱい。
2005/12/11(日) 21:43:11とりあえず更新のたびに関連するブログのエントリへのリンクのリストを並べるだけでいいじゃん。
おれも個人的にはなぜそこまでくわしい履歴が欲しいのかCとRuby経由からしか
使ってないからよくわからん。
だがアプリケーションとして普及させるならサポートは厚い方がいいに決まってるよね。
しかし、作者は全文検索アプリのためのAPIとして見てほしくて、インターフェイスは単なるデモ
みたいな発言をしていたよ。
それが不満なら...作者に直接声の届くmlか、直接メールするかして、
その上で作者が乗り気でないなら乗り換えるしかない気がするが。
ああ、いやもちろんプロジェクトをフォークする自由は常にある。LGPLだからね。
0541名無しさん@お腹いっぱい。
2005/12/11(日) 22:25:45どこがどう変わったのか知りたいと思うのは普通じゃないの?
その変更点がWebから簡単に参照できればよいね、ってだけの話でしょ。
0542GNU coding standardのChangeLogの説明
2005/12/11(日) 22:52:40変更についての説明が必要だと思うこともあるでしょう. その場合,おそらくその通りでしょう.
大いに説明を書いてください. ただし,その説明は,プログラム中にコメント文として書いてください.
そうすれば,プログラムを読む人は必ずそのコメント文を見ることになるからです. 例えば,関数を
一個追加したとき,変更履歴には "New function" と書けば充分です.その関数が何をする関数かの
説明はソースコード中で, その関数の定義の前にコメントとして書かれているはずだからです.
0543名無しさん@お腹いっぱい。
2005/12/11(日) 22:55:05ソースを読まずにChangeLogだけ読んで、「こんなんじゃ書いた本人しか分からん」
というのは筋違いだし、クレクレ君の典型だ。541の要求はもっともだが、そういう
書き出しから始まっているあたりが反感を買ったんだろう。
0544名無しさん@お腹いっぱい。
2005/12/11(日) 23:15:340545名無しさん@お腹いっぱい。
2005/12/11(日) 23:30:390546名無しさん@お腹いっぱい。
2005/12/11(日) 23:42:03ChangeLogと違ってユーザ向けのNEWSは更新を確実にするチャンスがないから。
粒度もChangeLogとは合致しないし、開発中はユーザにとっての変更が出る筈で
はなくても後からみてNEWSに書くべきことが発生していたというのもあり得る。
blogなら、ここに書いてなかったのに変わっとるのは怪しからん! という奴は
いないが、NEWSにしたら絶対そういう奴が出てくるだろうから、開発者が
無理なくそういう変更を拾って記述できるようなアイデアをセットで提案しないと。
0547名無しさん@お腹いっぱい。
2005/12/12(月) 00:34:02それを誰がやるのかっていうのはこれは大問題だよね。
マジで言い出しっぺがやってくださいよ。お願いしますよ。
たしかにその要求はもっともだからさ。
あと>>544 == >>541 だったならば、>>542は
論点へいたる前提を論じてるのだと思うよ。
0548名無しさん@お腹いっぱい。
2005/12/12(月) 01:51:500549名無しさん@お腹いっぱい。
2005/12/12(月) 03:54:390550名無しさん@お腹いっぱい。
2005/12/12(月) 04:29:19> メーリングリストとやらのメンバーたちは何をやっているのか?
> クレクレ君の集まりなのか?
> だからこういうパターンでは、周辺がサポートすることで
> 対応するのが一般的な方法論だって。
周辺とかまわりのひとってなんなのかね?
発言してる本人はどれにも該当しない第三者なの?
>>549
ML には
> なお、Windows版バイナリではMeCabのサポートはしていません。
となってる。
0551名無しさん@お腹いっぱい。
2005/12/12(月) 13:11:08> 周辺とかまわりのひとってなんなのかね?
> 発言してる本人はどれにも該当しない第三者なの?
そうだろうな。開発に参加していないくせに指示だけ出すやつだろ。
こういうやつは相手にしちゃいけない。コードを書かないやつは無視。
0552名無しさん@お腹いっぱい。
2005/12/12(月) 13:25:19「発言してる本人」が
「サポート」が必要だと感じてるとは限らんでしょ。
0553名無しさん@お腹いっぱい。
2005/12/12(月) 13:28:160554名無しさん@お腹いっぱい。
2005/12/12(月) 14:20:51そんなこと言ってたら、ユーザは何も要望を出せなくなるだろ。
OSSはユーザのフィードバックがあってナンボなんだから、そんな偏狭な
姿勢ではプロジェクトは盛り上がってこないでしょ。
いろんな提案が出されることは歓迎すべきで、それを採用するかどうかは開発者の自由。
0555名無しさん@お腹いっぱい。
2005/12/12(月) 15:54:28要望ならいいんじゃね?
0556名無しさん@お腹いっぱい。
2005/12/12(月) 16:06:16> OSSはユーザのフィードバックがあってナンボなんだから、そんな偏狭な
そんな事はない。ユーザなど何の役にもたたないことがほとんど。
> 姿勢ではプロジェクトは盛り上がってこないでしょ。
ユーザゼロでも盛り上がる。
> いろんな提案が出されることは歓迎すべきで、それを採用するかどうかは開発者の自由。
いろんな提案が出されることを歓迎するかどうかは開発者の自由。
0557名無しさん@お腹いっぱい。
2005/12/12(月) 16:19:37キミがOSSの開発者だったとしたら、普通の人の反応としては、
その製品は使いたくないし、開発に貢献したいとも思わないってなるんじゃないかな。
ユーザがいなくていいならそもそも公開なんてしないっしょ。
0558名無しさん@お腹いっぱい。
2005/12/12(月) 16:25:36お前のような傲慢なやつは、ユーザにそっぽ向かれて消えるだけ。
オープンソースはユーザに使っていただいているものなのだから、
ユーザに対する謙虚な姿勢を忘れたら存在する意味は無い。
消えな。
0559名無しさん@お腹いっぱい。
2005/12/12(月) 16:32:15ユーザゼロで盛り上がった例を知りたい.
もちろん,ゼロっていうんだから,
コード書いてる人も使ってない状況でね.
0560名無しさん@お腹いっぱい。
2005/12/12(月) 16:41:42さあ、fj臭が漂ってまいりました!
0561名無しさん@お腹いっぱい。
2005/12/12(月) 16:45:05オープンソースとして盛り上がってるとは言わないだろ.
0562名無しさん@お腹いっぱい。
2005/12/12(月) 16:46:580563名無しさん@お腹いっぱい。
2005/12/12(月) 18:15:10これだからUNIX板の住人は…('A`)
0564名無しさん@お腹いっぱい。
2005/12/12(月) 21:48:40おなぬーですな。
0565名無しさん@お腹いっぱい。
2005/12/12(月) 23:03:400566名無しさん@お腹いっぱい。
2005/12/13(火) 19:08:290567名無しさん@お腹いっぱい。
2005/12/14(水) 19:03:580568名無しさん@お腹いっぱい。
2005/12/14(水) 19:37:150569名無しさん@お腹いっぱい。
2005/12/14(水) 22:55:400570名無しさん@お腹いっぱい。
2005/12/15(木) 12:49:51Luceneって、キーワードハイライト機能ありますか?
0571名無しさん@お腹いっぱい。
2005/12/15(木) 13:08:55表示部分は自分で作る必要がある。したがって、ハイライト機能も自分で作れば
どうとでもなる。
0572名無しさん@お腹いっぱい。
2005/12/15(木) 13:21:460573名無しさん@お腹いっぱい。
2005/12/15(木) 13:26:510574名無しさん@お腹いっぱい。
2005/12/15(木) 18:17:410575名無しさん@お腹いっぱい。
2005/12/16(金) 14:41:26入れればウマーくなるけど、入れなくても差し支えないよね、っていうことでつか
0576名無しさん@お腹いっぱい。
2005/12/16(金) 17:11:17あ、そうきたか。じゃあ麻婆豆腐で言えば豆腐ということで。
0577名無しさん@お腹いっぱい。
2005/12/16(金) 17:26:560578名無しさん@お腹いっぱい。
2005/12/16(金) 17:30:52水切りをサボった麻婆豆腐みたいなもんか。
0579名無しさん@お腹いっぱい。
2005/12/16(金) 17:37:070580名無しさん@お腹いっぱい。
2005/12/18(日) 23:59:45エスカレイヤーかよ!
0581名無しさん@お腹いっぱい。
2005/12/19(月) 00:38:080582名無しさん@お腹いっぱい。
2005/12/19(月) 23:57:09滝田 裕、多田好克(電通大)
これってどんなのなんだろう?
0583名無しさん@お腹いっぱい。
2005/12/20(火) 00:09:45たとえば、「/search/検索語」というディレクトリの中を見ると、その検索語を含む
ファイルがずらっと出てくる。
とかなんじゃないかな?
なにそれ、Estraierが使われてるの?
0584名無しさん@お腹いっぱい。
2005/12/20(火) 09:34:29ファイルサーバーのってことで Google アプライアンスとかが紹介されてたな。
Namazu とか Estraier は全くふれられていなかったが。
ファイルサーバーの管理やったこと在るんだけど、
導入に見合った結果が得られるとは言い難いんだよな。
0585名無しさん@お腹いっぱい。
2005/12/21(水) 19:44:28>ファイルサーバーの管理やったこと在るんだけど、
>導入に見合った結果が得られるとは言い難いんだよな。
ユーザー(社員、学生?)が全文検索の意義を理解してくれないと言う事ですか?
たんに、UIが悪くて使ってもらえないくらいの意味ですか?
ぜひ詳しく聞きたいっす。
0586名無しさん@お腹いっぱい。
2005/12/22(木) 09:12:13一般ユーザは、GoogleよりYahooの方が好きだし。
何であんなごちゃごちゃしている上に検索結果もいまいちな
インターフェイスが好きなのだ?
0587名無しさん@お腹いっぱい。
2005/12/22(木) 15:35:21このあたりに鈍感だからだろう。
■ このスレッドは過去ログ倉庫に格納されています