トップページunix
987コメント301KB

全文検索エンジンEstraier

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。NGNG
個人用途向けの全文検索エンジンEstraierに関する話題を扱う
スレッドです。

http://estraier.sourceforge.net/
0112名無しさん@お腹いっぱい。NGNG
我が道を行った方がいいんじゃねえの?
他と同じだったら存在価値ないし。
0113名無しさん@お腹いっぱい。NGNG
>>111
Namazuのことかestraierのことかどっち?
0114名無しさん@お腹いっぱい。NGNG
作者が我が道を見失ったらお終いだろ
0115名無しさん@お腹いっぱい。NGNG
アイデンティティを失ったらおしまい。
周りが見えなくなったら地下に埋もれる。
0116名無しさん@お腹いっぱい。NGNG
>>111
一時期のリリース速度がはんぱじゃなかったから、安定してない気はしてしまうよな。
最近は落ち着いてきたみたいだけど。
あと、仕様書にある
>Estraierのバージョンが上がる際には、古いバージョンで作成した転置インデッ
>クスの互換性は保証されない。
ってあたりも、つっ走り感を漂わせてるかも。
0117名無しさん@お腹いっぱい。NGNG
作者の気まぐれでオタオタするのはもうごめんだしなあ。
0118名無しさん@お腹いっぱい。NGNG
作者がBAKAなんだっけ
0119名無しさん@お腹いっぱい。NGNG
作者って、問題がある人なの?
0120名無しさん@お腹いっぱい。NGNG
人はだれでも問題を抱えているものさ。
0121名無しさん@お腹いっぱい。NGNG
>>119
日本人は日本人をけなすのが大好き。それだけだろ。
0122名無しさん@お腹いっぱい。NGNG
>>111-121
工作員乙
0123名無しさん@お腹いっぱい。NGNG
mew-nmz で使えまつか?
0124名無しさん@お腹いっぱい。NGNG
>>123
使える。
0125名無しさん@お腹いっぱい。NGNG
ちなみに、BSDライセンスだから公開する気はない。
0126名無しさん@お腹いっぱい。NGNG
>>125
何の話?
0127名無しさん@お腹いっぱい。NGNG
>>126
mew-nmz ぱっち
0128名無しさん@お腹いっぱい。NGNG
>>119
バッドノウハウ等の頭の悪い文書を書いた人
0129名無しさん@お腹いっぱい。NGNG
嫉み、乙
0130名無しさん@お腹いっぱい。NGNG
>>125
くれよ。ケチすんなよ。
0131名無しさん@お腹いっぱい。NGNG
GPLでも自分だけで使ってるぶんには公開する必要ないよ。
0132名無しさん@お腹いっぱい。NGNG
同じ指摘が繰り返されてる罠
0133名無しさん@お腹いっぱい。NGNG
商品にするわけでもないだろうから、公開したって損はないだろうに。
0134名無しさん@お腹いっぱい。NGNG
存在しないものは公開できないよな。
0135名無しさん@お腹いっぱい。NGNG
FreeBSDのportsの今日のアップデートで、
qdbmにiconvサポートが入り、
そしてest*のmecabサポートがFreeBSD5.*以上で
のみ指定可能なオプションに格下げ。
注意されたし。
0136名無しさん@お腹いっぱい。NGNG
デフォルトの属性として title や author はあるのですが
オリジナルの属性の定義って出来ますか?
0137名無しさん@お腹いっぱい。NGNG
authorにCSVかなんか適当に突っ込んで、表示する時に切り分ければ?
0138名無しさん@お腹いっぱい。NGNG
CygwinでないWin版は出ねーの?
0139名無しさん@お腹いっぱい。NGNG
>>138
誰かがパッチ書けばね。QDBMの方はNative Win32に対応してるべ。
0140名無しさん@お腹いっぱい。NGNG
未踏採択キタ━━━━━━━━(゚∀゚)━━━━━━━━!!
ttp://www.ipa.go.jp/jinzai/esp/2004mito2/koubokekka.html

> 1 平林 幹雄 共同体的P2P全文検索システムの開発
0141名無しさん@お腹いっぱい。05/02/07 11:51:07
1.2.26リリースage
0142名無しさん@お腹いっぱい。05/02/07 15:06:12
namazu に比べてはやっていない気がするけど、なんでだろう?
0143名無しさん@お腹いっぱい。05/02/07 15:20:36
Namazuの方が何年も前に出ているし、当時は他に強力な競合ソフトがほとんど
なかったから。
0144名無しさん@お腹いっぱい。05/02/09 16:29:28
作者のblogによると、
時期バージョンはN-gram式になるらしい。
0145名無しさん@お腹いっぱい。05/02/16 20:53:06
動詞っぽいからエストレエ(-er動詞のrは発音しない)だと思っていた。
0146名無しさん@お腹いっぱい。05/03/13 19:40:53
第2回検索エンジンアンケート実施中!

http://hp6.0zero.jp/anq/anq.php?uid=1696&dir=84
0147名無しさん@お腹いっぱい。05/03/13 20:41:17
s/E// するとセントレアみたい。
0148名無しさん@お腹いっぱい。2005/03/29(火) 19:58:11ID:
なんか変な風に煮詰まってないか? 作者氏。
0149名無しさん@お腹いっぱい。UNIX時間(+0900)35/04/02(土) 10:12:19
将来的にはどうか知らんけど、
とりあえずソフトはちゃんと
動くんだから良しとする。
Namazu にも頑張ってもらいたい。
選択肢が複数あるいうのは大切。
0150名無しさん@お腹いっぱい。2005/04/07(木) 13:46:13
HyperEstraierのデモキター
http://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11127983650744523988&focus=1
0151名無しさん@お腹いっぱい。2005/04/07(木) 22:49:32
凄く良い!
namazuのindexをコンバートできないかな・・・
それと、googleみたいなページ切り替えにしたいな
  前へ 123・・・ 戻る
こんな感じで。。
0152名無しさん@お腹いっぱい。2005/04/08(金) 00:14:34
ライブラリだし、スクリプト言語のバインディングも提供されるようだから
そのへんは好きにできるだろう。

インデックスのコンバートはどうか知らないが、多分難しいとおもう。
namazuは出現位置の情報はもってないんじゃなかったっけ。あと隣接チェックとかも。
0153名無しさん@お腹いっぱい。2005/04/08(金) 00:17:17
欲を出すとgoogleキャッシュみたいにヒットしたキーワードを
反転させて表示するリンクも欲しい。
0154名無しさん@お腹いっぱい。2005/04/08(金) 03:34:30
namazuの様にINDEXをパラメータで変更出来ないのですか?

<input type="hidden" name="idxname" value="XXX">

マニュアル見た感じCGIではパラメータがないようです。
Serverはindexname(だったかな)パラメータ持ってました。
0155名無しさん@お腹いっぱい。2005/04/08(金) 08:43:39
>>154
estmerge.cgi 使えばイイんでない?
0156名無しさん@お腹いっぱい。2005/04/08(金) 08:54:20
>>155
名前がマージなんで結合してしまうので。。
serverを動かすしかないのか。

ソースに手を入れるか・・・
0157名無しさん@お腹いっぱい。2005/04/08(金) 14:20:16
>>155
メタ検索の対象となるestsearch.cgiをチェックボックスで
選択できるから、それは個々のestsearch.cgiが担っているインデックスを
選択しているのと同じことだろう、ってことでしょ?
0158名無しさん@お腹いっぱい。2005/04/08(金) 14:39:54
>>157
ありがとうございます。
マニュアルに書いてます??
相当読んだんですが気付かなかったです。

結論
 estmerge.cgi
を使う。
01591572005/04/08(金) 15:43:07
あまり詳しくは書いてないみたいですね。
試しに動かしてみたら意外に便利だったという感じ。
0160名無しさん@お腹いっぱい。2005/04/08(金) 16:34:16
recipientやauthorで検索ってどうすればいいんだろう?
0161名無しさん@お腹いっぱい。2005/04/09(土) 05:29:41
どのエンジンも一長一短でやはりエンジンを一つ決めて自作するしかないな。
0162名無しさん@お腹いっぱい。2005/04/09(土) 06:04:38
エンジンは鯰よりも早くて良いな。

IF(単純なHTML)の自由度がないのが惜しい。
0163名無しさん@お腹いっぱい。2005/04/09(土) 16:35:42
>>160
estindex register -tattr recipient -tattr author ...
とかやればいんじゃね?
0164名無しさん@お腹いっぱい。2005/04/10(日) 19:20:31
subversionのレポジトリの中身を、ワーキングコピーに取り出さずに
うまいことsvn cat とかsvn lsとかだけ使ってestindexに食わせるこ
とはできるでしょうか。
0165名無しさん@お腹いっぱい。2005/04/10(日) 21:15:47
>>164
gonzui
0166名無しさん@お腹いっぱい。2005/04/13(水) 19:24:58
短い識別子でないとダメって今時珍しい人だな。
0167名無しさん@お腹いっぱい。2005/04/16(土) 14:28:33
Hyper estraier がリリースされたね。
さて、APIをながめてみるか。
0168名無しさん@お腹いっぱい。2005/04/16(土) 15:22:52
>>167
リンクはどこ?
0169名無しさん@お腹いっぱい。2005/04/16(土) 15:52:31
ttp://hyperestraier.sourceforge.net/

APIはヘッダファイルを見た限りでは取っつきやすそう。
01701682005/04/16(土) 16:06:38
>>169 thx。
んで、estraierとhyper-eでのindexは全く別モノ?
共存さすのは無問題?
0171名無しさん@お腹いっぱい。2005/04/16(土) 17:48:55
インデックスは別物だろう。
共存は別にできるんでないの。
0172名無しさん@お腹いっぱい。2005/04/16(土) 19:05:10
デふぉだとindexは同じcasketつう名前の
フォルダの中にできるわけだが。
0173名無しさん@お腹いっぱい。2005/04/17(日) 18:53:45
デフォっつーか、インデックス名は引数で指定してるだけじゃん。
違う名前にすればOK。
0174名無しさん@お腹いっぱい。2005/04/17(日) 20:06:05
hyper-eいいね。対応フォーマットを増やしてくれるともっといい。
0175名無しさん@お腹いっぱい。2005/04/17(日) 20:23:18
フィルタは簡単に書けるんじゃない?

rastと違ってDB作成時に属性を決める必要がないみたいで便利そう。
0176名無しさん@お腹いっぱい。2005/04/17(日) 20:47:15
フィルタ増やすというよりLuceneみたいにいろんなアプリに組み込めると面白そう。
0177名無しさん@お腹いっぱい。2005/04/17(日) 21:28:31
>>176
libestraier.so は飾りじゃありませんよ。
APIドキュメントが早く欲しいところ。
0178名無しさん@お腹いっぱい。2005/04/17(日) 23:40:28
つ【doxygen,gtk-doc】
0179名無しさん@お腹いっぱい。2005/04/18(月) 00:07:36
え、引数の意味を自分で調べてその上でわざわざDoxygenタグを自分で書けと?


ドキュメントを待つか、ヘッダファイルだけでぶっつけ本番でやった方が
いいとおもうけど。
0180名無しさん@お腹いっぱい。2005/04/18(月) 00:15:56
ドキュメントはAPI freezeしてからでいいかも。
しかしautomakeもlibtoolも使ってないのか。
0181名無しさん@お腹いっぱい。2005/04/18(月) 03:56:06
そいつぁいいや
0182名無しさん@お腹いっぱい。2005/04/18(月) 06:23:55
autoconfすら使ってないzlibみたいなのもあるんだし、別にいいんじゃない?
0183名無しさん@お腹いっぱい。2005/04/18(月) 07:52:57
コンパイルするときは便利だと思うが自分で書こうとすると
嫌になる。

バッドノウハウのかたまりだもんな。>autoconf一味

0184名無しさん@お腹いっぱい。2005/04/18(月) 11:22:50
コンパイルするときも邪魔だと思うが、
バッドノウハウとかいう人はもっとウザい。
0185名無しさん@お腹いっぱい。2005/04/19(火) 10:08:12
APIドキュメントも出たね。rastより簡単そうかな。
0186名無しさん@お腹いっぱい。2005/04/19(火) 11:19:35
そう? rastよりもずいぶんと低レベルで複雑じゃない?とおもったら意図的にやってたのか、、バインディングを書いてもいいと思ってたけど、ノードAPIが出るまで待つか、、
0187名無しさん@お腹いっぱい。2005/04/19(火) 21:27:33
全文検索のようにスケールに敏感な機能の場合、ある程度低水準の方が使いやすいことない?
内部で勝手にMutex使われていると性能が出なかったりして、API自体をいじらないといけなくなる。
本家にパッチ送って反映待ちになるのも面倒いから、自分で好きにいじれる方が、、、
0188名無しさん@お腹いっぱい。2005/04/20(水) 15:06:10
rastとsennaの話題はここですか?
0189名無しさん@お腹いっぱい。2005/04/20(水) 17:02:10
>>188
つ【http://pc8.2ch.net/test/read.cgi/linux/1036088927/
0190名無しさん@お腹いっぱい。2005/04/20(水) 17:44:09
>>187
スケーラビリティの点から見るとたしかに日記に書いてあるような
サーバークライアント方式の導入は正しいように思えるね。
mnogosearch見たいな感じになるのかしらん。

やっぱノードAPI待ちかな。それともTigerが出たらSpotlightとSearchKitに
浮気しようかな。正直迷うな
0191名無しさん@お腹いっぱい。2005/04/20(水) 18:15:04
すげー、Windows版が出とる。
0192名無しさん@お腹いっぱい。2005/04/24(日) 02:24:32
>>190
サーバ方式にしてもスケーラビリティは上がらないんじゃない?
検索速度は上がるかもしれないけど、ネットワークの負荷を考えると微妙。
0193名無しさん@お腹いっぱい。2005/04/25(月) 04:38:56
ネットワーク遅延はデータベース検索においてそれほど大きな問題じゃない
と思うよ。そもそもデータベースのスケールによらず一定だし。

コアAPIの守備範囲であるローカルホストならなおさらじゃない?
0194名無しさん@お腹いっぱい。2005/04/25(月) 10:24:35
確かにそうかも。
それと、DBとは別のマシンでアプリケーションを動かせだろうから、フィルタと登録を
パイプライン的にやれば効率いいかもね。
秒速104文書登録ってのをどこまで維持できるかが見もの。
0195名無しさん@お腹いっぱい。2005/05/02(月) 10:13:17
rast 0.1.0キター
0196名無しさん@お腹いっぱい。2005/05/02(月) 20:03:29
Estraier と HyperestraierとCGIの検索スピード比べると、
大体Hyper...のほうが倍くらい早いかなて感じだ(当社比)。
0197名無しさん@お腹いっぱい。2005/05/02(月) 20:23:55
唐突に出てきた「CGI」という謎の実体について。
0198名無しさん@お腹いっぱい。2005/05/02(月) 20:54:06
HyperestraierをCGIとして使った場合の速度>Estraier をCGIとして使った場合の速度
ってことでわ?
0199名無しさん@お腹いっぱい。2005/05/03(火) 11:59:48
検索インターフェイスってwebしかないの?
コンソールとXで動くやつもあると嬉しいんだが。
0200名無しさん@お腹いっぱい。2005/05/03(火) 12:35:57
ライブラリ使ってなんとかしろ。
0201名無しさん@お腹いっぱい。2005/05/03(火) 12:37:35
インクリメンタルな全文検索インターフェースを頼む。
0202名無しさん@お腹いっぱい。2005/05/03(火) 13:09:05
Hyperestraierでestcmd gatherするとき、
sym link をdereferenceしないようにお願い
したいんだが、どうすれば良い?
0203名無しさん@お腹いっぱい。2005/05/04(水) 16:46:01
中の人に言えば?
02042022005/05/04(水) 20:12:26
static const char *pathtourl() のなかで
realpath()を呼んでるからだ、つうとこまでは分かった
んだが、絶対パスに展開するのやめさすと各方面に
色々面倒が起きそうな希ガス。
>>203の言うとおり、作者に頼むしかないかな。
0205名無しさん@お腹いっぱい。2005/05/04(水) 21:30:07
APIの呼び方さえ変えなければ特に問題ないと思うけど。
MLに投げれば対応してくれるかも。
0206名無しさん@お腹いっぱい。2005/05/08(日) 11:02:50
mboxファイル用のフィルタはないですか?
0207名無しさん@お腹いっぱい。2005/05/08(日) 18:34:26
>>201
高林さんとかの JavaScript を参考に組めば出来ると思うけど、
たぶんめっちゃおもくなるとおもわれ。
0208名無しさん@お腹いっぱい。2005/05/08(日) 20:54:44
>>207
>>201 は Ajax なインターフェースのことを言ってると思われ。
0209名無しさん@お腹いっぱい。2005/05/08(日) 20:59:06
>>208
> >>201 は Ajax なインターフェースのことを言ってると思われ。

ちがう。
0210名無しさん@お腹いっぱい。2005/05/08(日) 21:01:23
>>207
> 高林さんとかの JavaScript を参考に組めば出来ると思うけど、
> たぶんめっちゃおもくなるとおもわれ。

migemoのアイデアって、1990年ころに、プライベートな
研究会で見たことがあるよ。いや、べつにそっちの方が
先だとか言いたいわけではない。みんな同じことを考え
ていたんだということ。で、「たぶんめっちゃおもくな
るとおもわれ」とコメントされ、それで終わっていた。
0211名無しさん@お腹いっぱい。2005/05/08(日) 21:46:12
>>209
ありゃ、違うのか。 >>208 で合ってたのかな。
■ このスレッドは過去ログ倉庫に格納されています