トップページunix
987コメント301KB

全文検索エンジンEstraier

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。NGNG
個人用途向けの全文検索エンジンEstraierに関する話題を扱う
スレッドです。

http://estraier.sourceforge.net/
006968NGNG
ふむ

以前、

>% estindex register test
>
>としてみると
>
>:
>estindex: INFO: ./rfc3675.txt: registered: id=138 wnum=0
>estindex: INFO: test: database closing: fsiz=755995 dnum=35 wnum=0 bnum=114667
>estindex: INFO: test: writing meta information: fsiz=755995 dnum=35 wnum=0 bnum=114667
>estindex: INFO: test: registration completed successfully
>
>となるのは、これはどこか変なんだよな?

とポストした者だが、その後1.2.15にバージョンアップしたところ

>estindex: QDBM does not feature iconv
>と言い出して動かなくなってしまった。

ということのようだ。同様の人はいませんか?
どこが壊れてるんだろう??
0070名無しさん@お腹いっぱい。NGNG
>>68
メッセージ通りだと思われ。

configure のオプションはどうしてる?
qdbm は estraier 付属のもの使ってる? 別途入れてる?

うちは FreeBSD の ports で入れたら同じこと言われたんで、
確認したら別途インスコされた qdbm に --enable-iconv が
入ってなかったんで直したよ。
0071名無しさん@お腹いっぱい。NGNG
じゃあ、改名しなくてもいいから作者は読み方を決めろ。
0072名無しさん@お腹いっぱい。NGNG
Senと書いてChihiroと読むように
Estraierと書いてSnatcherと読む。
0073名無しさん@お腹いっぱい。NGNG
>>72
良いね、スナッチャー。響きも良いし、軽快に動くイメージとも相性よさげ。
「えすとれいや〜」はナンだか変形メカみたいなイメージが…。

ガシ、ガシ、シャキーン!ってカンジ<次世代検索メカ・エストレイヤー
007468NGNG
>>70
情報ありがとう。

est*もqdbmも消してest*から依存性で両方インストールしなおしたり
してもだめだから、libiconvまわりを疑っていた。

あれこれやってみて、

# portupgrade -f -m 'CONFIGURE_ARGS+=--enable-iconv CONFIGURE_ARGS+=--enable-zlib databases/qdbm

したらあっさり動いたなり。

要するに、FreeBSDのportsのestraierは、動く状態になっていないと
いうことで最終解答?
0075名無しさん@お腹いっぱい。NGNG
JavaScriptなしでアンカーにtarget指定できないもんでしょうか?
decanc: target="_blank"
みたいな。
0076名無しさん@お腹いっぱい。NGNG
>>75 ソースいじるしかないと思う。
0077名無しさん@お腹いっぱい。NGNG
SnatcherってEstraierの昔の名前だよね?
コナミっぽくてアレだけど。
0078名無しさん@お腹いっぱい。NGNG
OSXに入れてみた。+kakasi, +mecab ともに問題なく動いた。(最初、mecabの
辞書をUTF8にしてしまってはまったのは内緒だ。)序でに、 darwinportsの
Portfileも書いた。茶筅は昔、試したときにコンパイル出きんかったんで手を
つけてない。

0079名無しさん@お腹いっぱい。NGNG
これからは慧須都霊留とよんでください。
0080名無しさん@お腹いっぱい。NGNG
>>78
乙カレー。

漏れもPBに入れてみるかのぉ。
0081名無しさん@お腹いっぱい。NGNG
OpenOfficeのファイルを検索対象にするにはどうすればいいですか?
0082名無しさん@お腹いっぱい。NGNG
>>81
unzipとperl5.8以上かlvあたりありゃ出来るんじゃない?
0083名無しさん@お腹いっぱい。NGNG
>>82
81じゃないけど、感動した。
gzipじゃないので、zcatができないのが辛いけど。
0084名無しさん@お腹いっぱい。NGNG
> 要するに、FreeBSDのportsのestraierは、動く状態になっていないと
> いうことで最終解答?

どうもそうらしい。QDBMのportsの作りなおし希望!
0085名無しさん@お腹いっぱい。NGNG
windowsに入れてみたかったけれどよくわからなかったので、
Google DeskTop Searchにしてしまいました。
# UNIX系のツールは敷居が高くて難しいよ。
0086名無しさん@お腹いっぱい。NGNG
Google Desktop Search が Unixで動いても
よいんだがそうじゃないわけで。
0087名無しさん@お腹いっぱい。NGNG
メールボックス(Sylpheed)の検索に使っているのですが、新しくメールが届いた
時に、新着の分だけインデックスに登録することってできますか?
今のところcronでやってるのですが、やっぱりすぐ反映された方が便利なわけで、、、
0088名無しさん@お腹いっぱい。NGNG
ポーリングすりゃいいじゃん。
0089名無しさん@お腹いっぱい。NGNG
>>88はロートル

0090名無しさん@お腹いっぱい。NGNG
受信箱直下にある状態でインデックスしても、すぐ移動されてしまうので意味がない。
どうせなら、フォルダに振り分けたのをトリガーにしてestindexが発動してほしいな。
0091名無しさん@お腹いっぱい。NGNG
fetchmailで取りこむときにインデクサ動かせばいいんじゃなーい?
0092名無しさん@お腹いっぱい。NGNG
そんなんでインデクサ?
0093名無しさん@お腹いっぱい。NGNG
ライブラリベースでメーラーに組み込めるようになっていたらいいのになあ。
Matzさんが作ってるメールオーガナイザーはQDBMを直接使っているんだっけ。
0094名無しさん@お腹いっぱい。NGNG
メールオーガナイザーはなんで公開されないんだ?
0095名無しさん@お腹いっぱい。NGNG
>>94
GPLじゃないから
0096名無しさん@お腹いっぱい。NGNG
estはGPLじゃなかったっけ?
0097名無しさん@お腹いっぱい。NGNG
>>96
>>94
0098名無しさん@お腹いっぱい。NGNG
というかGPL=何でも公開という誤った認識はさっさと捨てろ。
バイナリを頒布しない限りはソースの入手可能性を保証する義務は生じないぞ。
そうでないとプライバシーの権利を損ねることになるからだ。
0099名無しさん@お腹いっぱい。NGNG
一見さんお断りのお店みたいなもんだな。
馴染み客に紹介してもらえば出入りできるようになる。
ただ一見さんお断りの場合は紹介者の信用が担保となるので
でたらめな新しい客は入ってこないんだが、
GPLのバイナリ頒布は再配布にリスクが伴わないのが問題だな。

0100名無しさん@お腹いっぱい。NGNG
binary頒布しても、ハンドアセンブルして 16進ダンプを
打ち込んだと主張すれば source開示しなくていいですか?
0101名無しさん@お腹いっぱい。NGNG
Namazuじゃなくてこれを使う意味ってなにかあるの?
0102名無しさん@お腹いっぱい。NGNG
>>100
ライセンスあれこれ
http://pc5.2ch.net/test/read.cgi/unix/1032702590/
0103名無しさん@お腹いっぱい。NGNG
>>101
多分こっちの方がよくできている。
Namazuのアドバンテージはフィルタが豊富なことぐらいかな。
0104名無しさん@お腹いっぱい。NGNG
googleのPageRankみたいな機能は特許でいれられないの?
0105名無しさん@お腹いっぱい。NGNG
>>104
ttp://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/srchnum.htm&r=1&f=G&l=50&s1=6285999.WKU.&OS=PN/6285999&RS=PN/6285999
0106名無しさん@お腹いっぱい。NGNG
>>105
orz
貼るなら
ttp://patft.uspto.gov/netacgi/nph-Parser?patentnumber=6285999
にしとけばよかった。
0107名無しさん@お腹いっぱい。NGNG
>>101 つーかもはやNamazuを使う理由がないよな。
0108名無しさん@お腹いっぱい。NGNG
>>101
開発力が消えていない。
0109名無しさん@お腹いっぱい。NGNG
以前両方入れてみたけど、結局namazuを使ってるな...
0110名無しさん@お腹いっぱい。NGNG
多少の性能差よりも枯れ慣れノウハウ蓄積の方が
価値を持つ傾向のある世界だからね。
0111名無しさん@お腹いっぱい。NGNG
あの憶えにくい独自の命名に、作者のわがまま……っていうのは
言いすぎか……ええと、まわりを見ずにわが道を行きそうという
不安感を憶えるので、躊躇してしまうんだよな。
0112名無しさん@お腹いっぱい。NGNG
我が道を行った方がいいんじゃねえの?
他と同じだったら存在価値ないし。
0113名無しさん@お腹いっぱい。NGNG
>>111
Namazuのことかestraierのことかどっち?
0114名無しさん@お腹いっぱい。NGNG
作者が我が道を見失ったらお終いだろ
0115名無しさん@お腹いっぱい。NGNG
アイデンティティを失ったらおしまい。
周りが見えなくなったら地下に埋もれる。
0116名無しさん@お腹いっぱい。NGNG
>>111
一時期のリリース速度がはんぱじゃなかったから、安定してない気はしてしまうよな。
最近は落ち着いてきたみたいだけど。
あと、仕様書にある
>Estraierのバージョンが上がる際には、古いバージョンで作成した転置インデッ
>クスの互換性は保証されない。
ってあたりも、つっ走り感を漂わせてるかも。
0117名無しさん@お腹いっぱい。NGNG
作者の気まぐれでオタオタするのはもうごめんだしなあ。
0118名無しさん@お腹いっぱい。NGNG
作者がBAKAなんだっけ
0119名無しさん@お腹いっぱい。NGNG
作者って、問題がある人なの?
0120名無しさん@お腹いっぱい。NGNG
人はだれでも問題を抱えているものさ。
0121名無しさん@お腹いっぱい。NGNG
>>119
日本人は日本人をけなすのが大好き。それだけだろ。
0122名無しさん@お腹いっぱい。NGNG
>>111-121
工作員乙
0123名無しさん@お腹いっぱい。NGNG
mew-nmz で使えまつか?
0124名無しさん@お腹いっぱい。NGNG
>>123
使える。
0125名無しさん@お腹いっぱい。NGNG
ちなみに、BSDライセンスだから公開する気はない。
0126名無しさん@お腹いっぱい。NGNG
>>125
何の話?
0127名無しさん@お腹いっぱい。NGNG
>>126
mew-nmz ぱっち
0128名無しさん@お腹いっぱい。NGNG
>>119
バッドノウハウ等の頭の悪い文書を書いた人
0129名無しさん@お腹いっぱい。NGNG
嫉み、乙
0130名無しさん@お腹いっぱい。NGNG
>>125
くれよ。ケチすんなよ。
0131名無しさん@お腹いっぱい。NGNG
GPLでも自分だけで使ってるぶんには公開する必要ないよ。
0132名無しさん@お腹いっぱい。NGNG
同じ指摘が繰り返されてる罠
0133名無しさん@お腹いっぱい。NGNG
商品にするわけでもないだろうから、公開したって損はないだろうに。
0134名無しさん@お腹いっぱい。NGNG
存在しないものは公開できないよな。
0135名無しさん@お腹いっぱい。NGNG
FreeBSDのportsの今日のアップデートで、
qdbmにiconvサポートが入り、
そしてest*のmecabサポートがFreeBSD5.*以上で
のみ指定可能なオプションに格下げ。
注意されたし。
0136名無しさん@お腹いっぱい。NGNG
デフォルトの属性として title や author はあるのですが
オリジナルの属性の定義って出来ますか?
0137名無しさん@お腹いっぱい。NGNG
authorにCSVかなんか適当に突っ込んで、表示する時に切り分ければ?
0138名無しさん@お腹いっぱい。NGNG
CygwinでないWin版は出ねーの?
0139名無しさん@お腹いっぱい。NGNG
>>138
誰かがパッチ書けばね。QDBMの方はNative Win32に対応してるべ。
0140名無しさん@お腹いっぱい。NGNG
未踏採択キタ━━━━━━━━(゚∀゚)━━━━━━━━!!
ttp://www.ipa.go.jp/jinzai/esp/2004mito2/koubokekka.html

> 1 平林 幹雄 共同体的P2P全文検索システムの開発
0141名無しさん@お腹いっぱい。05/02/07 11:51:07
1.2.26リリースage
0142名無しさん@お腹いっぱい。05/02/07 15:06:12
namazu に比べてはやっていない気がするけど、なんでだろう?
0143名無しさん@お腹いっぱい。05/02/07 15:20:36
Namazuの方が何年も前に出ているし、当時は他に強力な競合ソフトがほとんど
なかったから。
0144名無しさん@お腹いっぱい。05/02/09 16:29:28
作者のblogによると、
時期バージョンはN-gram式になるらしい。
0145名無しさん@お腹いっぱい。05/02/16 20:53:06
動詞っぽいからエストレエ(-er動詞のrは発音しない)だと思っていた。
0146名無しさん@お腹いっぱい。05/03/13 19:40:53
第2回検索エンジンアンケート実施中!

http://hp6.0zero.jp/anq/anq.php?uid=1696&dir=84
0147名無しさん@お腹いっぱい。05/03/13 20:41:17
s/E// するとセントレアみたい。
0148名無しさん@お腹いっぱい。2005/03/29(火) 19:58:11ID:
なんか変な風に煮詰まってないか? 作者氏。
0149名無しさん@お腹いっぱい。UNIX時間(+0900)35/04/02(土) 10:12:19
将来的にはどうか知らんけど、
とりあえずソフトはちゃんと
動くんだから良しとする。
Namazu にも頑張ってもらいたい。
選択肢が複数あるいうのは大切。
0150名無しさん@お腹いっぱい。2005/04/07(木) 13:46:13
HyperEstraierのデモキター
http://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11127983650744523988&focus=1
0151名無しさん@お腹いっぱい。2005/04/07(木) 22:49:32
凄く良い!
namazuのindexをコンバートできないかな・・・
それと、googleみたいなページ切り替えにしたいな
  前へ 123・・・ 戻る
こんな感じで。。
0152名無しさん@お腹いっぱい。2005/04/08(金) 00:14:34
ライブラリだし、スクリプト言語のバインディングも提供されるようだから
そのへんは好きにできるだろう。

インデックスのコンバートはどうか知らないが、多分難しいとおもう。
namazuは出現位置の情報はもってないんじゃなかったっけ。あと隣接チェックとかも。
0153名無しさん@お腹いっぱい。2005/04/08(金) 00:17:17
欲を出すとgoogleキャッシュみたいにヒットしたキーワードを
反転させて表示するリンクも欲しい。
0154名無しさん@お腹いっぱい。2005/04/08(金) 03:34:30
namazuの様にINDEXをパラメータで変更出来ないのですか?

<input type="hidden" name="idxname" value="XXX">

マニュアル見た感じCGIではパラメータがないようです。
Serverはindexname(だったかな)パラメータ持ってました。
0155名無しさん@お腹いっぱい。2005/04/08(金) 08:43:39
>>154
estmerge.cgi 使えばイイんでない?
0156名無しさん@お腹いっぱい。2005/04/08(金) 08:54:20
>>155
名前がマージなんで結合してしまうので。。
serverを動かすしかないのか。

ソースに手を入れるか・・・
0157名無しさん@お腹いっぱい。2005/04/08(金) 14:20:16
>>155
メタ検索の対象となるestsearch.cgiをチェックボックスで
選択できるから、それは個々のestsearch.cgiが担っているインデックスを
選択しているのと同じことだろう、ってことでしょ?
0158名無しさん@お腹いっぱい。2005/04/08(金) 14:39:54
>>157
ありがとうございます。
マニュアルに書いてます??
相当読んだんですが気付かなかったです。

結論
 estmerge.cgi
を使う。
01591572005/04/08(金) 15:43:07
あまり詳しくは書いてないみたいですね。
試しに動かしてみたら意外に便利だったという感じ。
0160名無しさん@お腹いっぱい。2005/04/08(金) 16:34:16
recipientやauthorで検索ってどうすればいいんだろう?
0161名無しさん@お腹いっぱい。2005/04/09(土) 05:29:41
どのエンジンも一長一短でやはりエンジンを一つ決めて自作するしかないな。
0162名無しさん@お腹いっぱい。2005/04/09(土) 06:04:38
エンジンは鯰よりも早くて良いな。

IF(単純なHTML)の自由度がないのが惜しい。
0163名無しさん@お腹いっぱい。2005/04/09(土) 16:35:42
>>160
estindex register -tattr recipient -tattr author ...
とかやればいんじゃね?
0164名無しさん@お腹いっぱい。2005/04/10(日) 19:20:31
subversionのレポジトリの中身を、ワーキングコピーに取り出さずに
うまいことsvn cat とかsvn lsとかだけ使ってestindexに食わせるこ
とはできるでしょうか。
0165名無しさん@お腹いっぱい。2005/04/10(日) 21:15:47
>>164
gonzui
0166名無しさん@お腹いっぱい。2005/04/13(水) 19:24:58
短い識別子でないとダメって今時珍しい人だな。
0167名無しさん@お腹いっぱい。2005/04/16(土) 14:28:33
Hyper estraier がリリースされたね。
さて、APIをながめてみるか。
0168名無しさん@お腹いっぱい。2005/04/16(土) 15:22:52
>>167
リンクはどこ?
■ このスレッドは過去ログ倉庫に格納されています