全文検索エンジンEstraier
レス数が950を超えています。1000を超えると書き込みができなくなります。
0001名無しさん@お腹いっぱい。
NGNGスレッドです。
http://estraier.sourceforge.net/
0002名無しさん@お腹いっぱい。
NGNG.|"" . .|| >3(´・ω・`)知らんがな
. ;;| VIP連合 .|| >4おっぱい!おっぱい!
:: .;;| ...|| >5ピザでも食ってろデブw
.:::::;:;| ,ノ""""|| >6僕は、神山満月ちゃん!
.:::::;;:| ,/""" 人 ;n|| >7夢がひろがりんぐwwwwwww
"" (__)./ ) >8だから個人宛てって言ってんじゃよ
(____./ /|| 人 >9そんなことロスでは日常茶飯事だぜ(´・ω・`)y─┛~~~~
V・I・P>∩(・∀/ / (__) >10-1000それが、VIPクオリティ
\ ( と) (__) >1001イヤッッホォォォオオォオウ!
〈 〈 ヽ )\(´∀` ) n
(_)(ノ, \ ( E)
| VIP /ヽ ヽ_//
0003名無しさん@お腹いっぱい。
NGNG>>4
4様禁止
0004名無しさん@お腹いっぱい。
NGNG0005名無しさん@お腹いっぱい。
NGNG0006名無しさん@お腹いっぱい。
NGNG0007名無しさん@お腹いっぱい。
NGNG0008名無しさん@お腹いっぱい。
NGNGで Namazu と比べてどこがどうなの? 使ってる人教えてプリーズ。
0009名無しさん@お腹いっぱい。
NGNG0010名無しさん@お腹いっぱい。
NGNG性能や検索精度はいっしょぐらいかな。あと、関連検索がちょっと面白い。
0011名無しさん@お腹いっぱい。
NGNGNamazuは単語の出現位置をインデックスに記録しないからね。
ランキングはよくわからん。ちなみにNamazuにはPageRankハックが
あったけど、特許申請されているという理由(その後特許になっている)
で採用は見送られている。
0012名無しさん@お腹いっぱい。
NGNG0013名無しさん@お腹いっぱい。
NGNGくらべて複合語検索にずいぶん強いすね、「拡散接合」とか
「絶縁限界」とか。indexingもだいぶ早いような希ガスます。
かなーり良さげなんで、しばらく使ってみることにします。
0014名無しさん@お腹いっぱい。
NGNG0015名無しさん@お腹いっぱい。
NGNGほほう、さすが評判になってるだけによさげっすね〜。
自分も乗り換えてみたいけど、gnus-namazu と Namazu の自作フィルタがある
からかなり気合いがいるなあ…(´・ω・`)
0016名無しさん@お腹いっぱい。
NGNG改造するとしたらどれくらい手間かかりますかねぇ。
0017名無しさん@お腹いっぱい。
NGNG検索速度は同じぐらいかな。
まぁ単純には比較できないか。
namazuは自作フィルタで重み付けをやっているので
その部分を何とかできればなぁ。
みんな乗り換えたの?
0018名無しさん@お腹いっぱい。
NGNG0019名無しさん@お腹いっぱい。
NGNG一方、Namazuは二分木だっけ。
0020名無しさん@お腹いっぱい。
NGNG0021名無しさん@お腹いっぱい。
NGNGNamazuのフィルタ部分だけを使えるみたいだから
なんとかできるのでないかな。
http://www.namazu.org/pipermail/namazu-devel-ja/2004-September/000111.html
0022名無しさん@お腹いっぱい。
NGNGサンクスコ。なんかいけそうな予感。
0023名無しさん@お腹いっぱい。
NGNGNamazuから乗り換えよっと。
0024名無しさん@お腹いっぱい。
NGNGあと sourforge の ML アーカイブもなんか
文字コードおかしくね?
0025名無しさん@お腹いっぱい。
NGNG0026名無しさん@お腹いっぱい。
NGNG> あと sourforge の ML アーカイブもなんか
> 文字コードおかしくね?
それは周知の事実。わざわざMailmanの改悪版を作っておきながら
直す気もないので、SF.netで日本語のMLを立てるべからず。
0027名無しさん@お腹いっぱい。
NGNG> Estraier て読み方わからん。これ何語よ。
Q. : 「Estraier」はどう発音するのか。
A. : 「estraier」は昔のフランス語で「さまよう」もしくは「はぐれる」という意
味の言葉だそうだが、作者はそれをどう発音すべきか未だに知らない。
0028名無しさん@お腹いっぱい。
NGNGこれ見た初め、2バイトコードなんか全然知らない
フランス野郎がつくったソフトかと思たーぜぃ。
0029名無しさん@お腹いっぱい。
NGNGフランス野郎が作ったのはこっち。
http://www.gnu.org/software/mifluz/
0030名無し象は鼻がウナギだよもん!
NGNGe(離れて) + traire(引く) → estraire(v) → extraire
→ estraier(adj) → etrange, etranger
0031名無しさん@お腹いっぱい。
NGNGとしてみると
:
estindex: INFO: ./rfc3675.txt: registered: id=138 wnum=0
estindex: INFO: test: database closing: fsiz=755995 dnum=35 wnum=0 bnum=114667
estindex: INFO: test: writing meta information: fsiz=755995 dnum=35 wnum=0 bnum=114667
estindex: INFO: test: registration completed successfully
となるのは、これはどこか変なんだよな?
0032名無しさん@お腹いっぱい。
NGNGちゃんと全文検索エンジンで。
漏れも時間できたらNamazuから乗り換えてみよう。
0033名無しさん@お腹いっぱい。
NGNGregistration completed successfullyって言うてるやん。
0034名無しさん@お腹いっぱい。
NGNGwnum=0 ってなってるから、単語が抽出できてないんでないの?
ファイルが空か、パーミッションがないとか。
だったらsuccessfullyってのも変だが。
0035名無しさん@お腹いっぱい。
NGNG0036名無しさん@お腹いっぱい。
NGNG0037名無しさん@お腹いっぱい。
NGNG0038名無しさん@お腹いっぱい。
NGNG俺も乗り換えてみるか。
0039名無しさん@お腹いっぱい。
NGNG今のフランス語と違って、ほぼローマ字読みだったはずだけど
「エ(ス)トライエル」ぐらいか(ラ行は巻き舌音)
0040名無しさん@お腹いっぱい。
NGNG0041名無しさん@お腹いっぱい。
NGNG0042名無しさん@お腹いっぱい。
NGNG語尾がerになった時には既にaiは単母音化していただろう。
0043名無しさん@お腹いっぱい。
NGNGaier は現代仏語としてはありえん綴りだが
無理に読めばエストレー(ル)かのお。
末尾のrを発音するかどうかはまちまちだろう。
が、仏人は当然学校で古仏語を習ってるので
よほどのdqnでない限りは古仏語読みを試みると思われ
32の英語読みが爽やかだ
0044名無しさん@お腹いっぱい。
NGNG0045名無しさん@お腹いっぱい。
NGNG0046名無しさん@お腹いっぱい。
NGNG0047名無しさん@お腹いっぱい。
NGNG0048名無しさん@お腹いっぱい。
NGNG0049名無しさん@お腹いっぱい。
NGNGじゃあエストライエルかエストレイェルだな。
0050名無しさん@お腹いっぱい。
NGNGNamazuの EXCLUDE_PATHに相当するオプションってあるのでしょうか?
0051名無しさん@お腹いっぱい。
NGNG0052名無しさん@お腹いっぱい。
NGNG今のところ無いように見える。
indexingさす dir を明示して
とりあえずしのげ、つうことでわ。
0053名無しさん@お腹いっぱい。
NGNG005450
NGNG-ipreは、無視するファイル名を書くようですね?。このディレクトリー以下全部除外。ってのは無理?
やはり、一個一個ディレクトリー指定していくほか無いようですね。
いやほら 403で見れなくしてても、namazuもそうだけど、お構いなしに database作って
大漏洩になっちゃうから・・
0055名無しさん@お腹いっぱい。
NGNG0056名無しさん@お腹いっぱい。
NGNGprefixのpreだと思われる。だから、前方一致でヒットすれば無視されるはず。
0057名無しさん@お腹いっぱい。
NGNGたいに find でファイルリスト作っといてそれを食わせるとかできないの?
0058名無しさん@お腹いっぱい。
NGNG0060名無しさん@お腹いっぱい。
NGNGそうすりゃ変なミスはしなくなる。ついでに全部URLで指定することにして、
file:///home/hoge/public_html/abc.html
file:///home/hoge/public_html/def.html
とか
http://www.yahoo.com/foo.html
http://www.yahoo.com/bar.html
みたいに指定できれば、ローカルとリモートを区別しないで登録できてよくない?
0061名無しさん@お腹いっぱい。
NGNG0062名無しさん@お腹いっぱい。
NGNG0063名無しさん@お腹いっぱい。
NGNGhttp://pc5.2ch.net/test/read.cgi/unix/1001358861/
0064名無しさん@お腹いっぱい。
NGNG儂の妄想:〜いろんな名称・呼び方で紛糾。最終的に「Nanashi」で定着〜
0065名無しさん@お腹いっぱい。
NGNG0066名無しさん@お腹いっぱい。
NGNG0067名無しさん@お腹いっぱい。
NGNG0068名無しさん@お腹いっぱい。
NGNGと言い出して動かなくなってしまった。
006968
NGNG以前、
>% estindex register test
>
>としてみると
>
>:
>estindex: INFO: ./rfc3675.txt: registered: id=138 wnum=0
>estindex: INFO: test: database closing: fsiz=755995 dnum=35 wnum=0 bnum=114667
>estindex: INFO: test: writing meta information: fsiz=755995 dnum=35 wnum=0 bnum=114667
>estindex: INFO: test: registration completed successfully
>
>となるのは、これはどこか変なんだよな?
とポストした者だが、その後1.2.15にバージョンアップしたところ
>estindex: QDBM does not feature iconv
>と言い出して動かなくなってしまった。
ということのようだ。同様の人はいませんか?
どこが壊れてるんだろう??
0070名無しさん@お腹いっぱい。
NGNGメッセージ通りだと思われ。
configure のオプションはどうしてる?
qdbm は estraier 付属のもの使ってる? 別途入れてる?
うちは FreeBSD の ports で入れたら同じこと言われたんで、
確認したら別途インスコされた qdbm に --enable-iconv が
入ってなかったんで直したよ。
0071名無しさん@お腹いっぱい。
NGNG0072名無しさん@お腹いっぱい。
NGNGEstraierと書いてSnatcherと読む。
0073名無しさん@お腹いっぱい。
NGNG良いね、スナッチャー。響きも良いし、軽快に動くイメージとも相性よさげ。
「えすとれいや〜」はナンだか変形メカみたいなイメージが…。
ガシ、ガシ、シャキーン!ってカンジ<次世代検索メカ・エストレイヤー
007468
NGNG情報ありがとう。
est*もqdbmも消してest*から依存性で両方インストールしなおしたり
してもだめだから、libiconvまわりを疑っていた。
あれこれやってみて、
# portupgrade -f -m 'CONFIGURE_ARGS+=--enable-iconv CONFIGURE_ARGS+=--enable-zlib databases/qdbm
したらあっさり動いたなり。
要するに、FreeBSDのportsのestraierは、動く状態になっていないと
いうことで最終解答?
0075名無しさん@お腹いっぱい。
NGNGdecanc: target="_blank"
みたいな。
0076名無しさん@お腹いっぱい。
NGNG0077名無しさん@お腹いっぱい。
NGNGコナミっぽくてアレだけど。
0078名無しさん@お腹いっぱい。
NGNG辞書をUTF8にしてしまってはまったのは内緒だ。)序でに、 darwinportsの
Portfileも書いた。茶筅は昔、試したときにコンパイル出きんかったんで手を
つけてない。
0079名無しさん@お腹いっぱい。
NGNG0080名無しさん@お腹いっぱい。
NGNG乙カレー。
漏れもPBに入れてみるかのぉ。
0081名無しさん@お腹いっぱい。
NGNG0082名無しさん@お腹いっぱい。
NGNGunzipとperl5.8以上かlvあたりありゃ出来るんじゃない?
0083名無しさん@お腹いっぱい。
NGNG81じゃないけど、感動した。
gzipじゃないので、zcatができないのが辛いけど。
0084名無しさん@お腹いっぱい。
NGNG> いうことで最終解答?
どうもそうらしい。QDBMのportsの作りなおし希望!
0085名無しさん@お腹いっぱい。
NGNGGoogle DeskTop Searchにしてしまいました。
# UNIX系のツールは敷居が高くて難しいよ。
0086名無しさん@お腹いっぱい。
NGNGよいんだがそうじゃないわけで。
0087名無しさん@お腹いっぱい。
NGNG時に、新着の分だけインデックスに登録することってできますか?
今のところcronでやってるのですが、やっぱりすぐ反映された方が便利なわけで、、、
0088名無しさん@お腹いっぱい。
NGNG0089名無しさん@お腹いっぱい。
NGNG0090名無しさん@お腹いっぱい。
NGNGどうせなら、フォルダに振り分けたのをトリガーにしてestindexが発動してほしいな。
0091名無しさん@お腹いっぱい。
NGNG0092名無しさん@お腹いっぱい。
NGNG0093名無しさん@お腹いっぱい。
NGNGMatzさんが作ってるメールオーガナイザーはQDBMを直接使っているんだっけ。
0094名無しさん@お腹いっぱい。
NGNG0095名無しさん@お腹いっぱい。
NGNGGPLじゃないから
0096名無しさん@お腹いっぱい。
NGNG0097名無しさん@お腹いっぱい。
NGNG>>94
0098名無しさん@お腹いっぱい。
NGNGバイナリを頒布しない限りはソースの入手可能性を保証する義務は生じないぞ。
そうでないとプライバシーの権利を損ねることになるからだ。
0099名無しさん@お腹いっぱい。
NGNG馴染み客に紹介してもらえば出入りできるようになる。
ただ一見さんお断りの場合は紹介者の信用が担保となるので
でたらめな新しい客は入ってこないんだが、
GPLのバイナリ頒布は再配布にリスクが伴わないのが問題だな。
0100名無しさん@お腹いっぱい。
NGNG打ち込んだと主張すれば source開示しなくていいですか?
0101名無しさん@お腹いっぱい。
NGNG0102名無しさん@お腹いっぱい。
NGNGライセンスあれこれ
http://pc5.2ch.net/test/read.cgi/unix/1032702590/
0103名無しさん@お腹いっぱい。
NGNG多分こっちの方がよくできている。
Namazuのアドバンテージはフィルタが豊富なことぐらいかな。
0104名無しさん@お腹いっぱい。
NGNG0105名無しさん@お腹いっぱい。
NGNGttp://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/srchnum.htm&r=1&f=G&l=50&s1=6285999.WKU.&OS=PN/6285999&RS=PN/6285999
0106名無しさん@お腹いっぱい。
NGNGorz
貼るなら
ttp://patft.uspto.gov/netacgi/nph-Parser?patentnumber=6285999
にしとけばよかった。
0107名無しさん@お腹いっぱい。
NGNG0108名無しさん@お腹いっぱい。
NGNG開発力が消えていない。
0109名無しさん@お腹いっぱい。
NGNG0110名無しさん@お腹いっぱい。
NGNG価値を持つ傾向のある世界だからね。
0111名無しさん@お腹いっぱい。
NGNG言いすぎか……ええと、まわりを見ずにわが道を行きそうという
不安感を憶えるので、躊躇してしまうんだよな。
0112名無しさん@お腹いっぱい。
NGNG他と同じだったら存在価値ないし。
0113名無しさん@お腹いっぱい。
NGNGNamazuのことかestraierのことかどっち?
0114名無しさん@お腹いっぱい。
NGNG0115名無しさん@お腹いっぱい。
NGNG周りが見えなくなったら地下に埋もれる。
0116名無しさん@お腹いっぱい。
NGNG一時期のリリース速度がはんぱじゃなかったから、安定してない気はしてしまうよな。
最近は落ち着いてきたみたいだけど。
あと、仕様書にある
>Estraierのバージョンが上がる際には、古いバージョンで作成した転置インデッ
>クスの互換性は保証されない。
ってあたりも、つっ走り感を漂わせてるかも。
0117名無しさん@お腹いっぱい。
NGNG0118名無しさん@お腹いっぱい。
NGNG0119名無しさん@お腹いっぱい。
NGNG0120名無しさん@お腹いっぱい。
NGNG0121名無しさん@お腹いっぱい。
NGNG日本人は日本人をけなすのが大好き。それだけだろ。
0122名無しさん@お腹いっぱい。
NGNG工作員乙
0123名無しさん@お腹いっぱい。
NGNG0124名無しさん@お腹いっぱい。
NGNG使える。
0125名無しさん@お腹いっぱい。
NGNG0126名無しさん@お腹いっぱい。
NGNG何の話?
0127名無しさん@お腹いっぱい。
NGNGmew-nmz ぱっち
0128名無しさん@お腹いっぱい。
NGNGバッドノウハウ等の頭の悪い文書を書いた人
0129名無しさん@お腹いっぱい。
NGNG0130名無しさん@お腹いっぱい。
NGNGくれよ。ケチすんなよ。
0131名無しさん@お腹いっぱい。
NGNG0132名無しさん@お腹いっぱい。
NGNG0133名無しさん@お腹いっぱい。
NGNG0134名無しさん@お腹いっぱい。
NGNG0135名無しさん@お腹いっぱい。
NGNGqdbmにiconvサポートが入り、
そしてest*のmecabサポートがFreeBSD5.*以上で
のみ指定可能なオプションに格下げ。
注意されたし。
0136名無しさん@お腹いっぱい。
NGNGオリジナルの属性の定義って出来ますか?
0137名無しさん@お腹いっぱい。
NGNG0138名無しさん@お腹いっぱい。
NGNG0139名無しさん@お腹いっぱい。
NGNG誰かがパッチ書けばね。QDBMの方はNative Win32に対応してるべ。
0140名無しさん@お腹いっぱい。
NGNGttp://www.ipa.go.jp/jinzai/esp/2004mito2/koubokekka.html
> 1 平林 幹雄 共同体的P2P全文検索システムの開発
0141名無しさん@お腹いっぱい。
05/02/07 11:51:070142名無しさん@お腹いっぱい。
05/02/07 15:06:120143名無しさん@お腹いっぱい。
05/02/07 15:20:36なかったから。
0144名無しさん@お腹いっぱい。
05/02/09 16:29:28時期バージョンはN-gram式になるらしい。
0145名無しさん@お腹いっぱい。
05/02/16 20:53:060146名無しさん@お腹いっぱい。
05/03/13 19:40:53http://hp6.0zero.jp/anq/anq.php?uid=1696&dir=84
0147名無しさん@お腹いっぱい。
05/03/13 20:41:170148名無しさん@お腹いっぱい。
2005/03/29(火) 19:58:11ID:0149名無しさん@お腹いっぱい。
UNIX時間(+0900)35/04/02(土) 10:12:19とりあえずソフトはちゃんと
動くんだから良しとする。
Namazu にも頑張ってもらいたい。
選択肢が複数あるいうのは大切。
0150名無しさん@お腹いっぱい。
2005/04/07(木) 13:46:13http://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11127983650744523988&focus=1
0151名無しさん@お腹いっぱい。
2005/04/07(木) 22:49:32namazuのindexをコンバートできないかな・・・
それと、googleみたいなページ切り替えにしたいな
前へ 123・・・ 戻る
こんな感じで。。
0152名無しさん@お腹いっぱい。
2005/04/08(金) 00:14:34そのへんは好きにできるだろう。
インデックスのコンバートはどうか知らないが、多分難しいとおもう。
namazuは出現位置の情報はもってないんじゃなかったっけ。あと隣接チェックとかも。
0153名無しさん@お腹いっぱい。
2005/04/08(金) 00:17:17反転させて表示するリンクも欲しい。
0154名無しさん@お腹いっぱい。
2005/04/08(金) 03:34:30<input type="hidden" name="idxname" value="XXX">
マニュアル見た感じCGIではパラメータがないようです。
Serverはindexname(だったかな)パラメータ持ってました。
0155名無しさん@お腹いっぱい。
2005/04/08(金) 08:43:39estmerge.cgi 使えばイイんでない?
0156名無しさん@お腹いっぱい。
2005/04/08(金) 08:54:20名前がマージなんで結合してしまうので。。
serverを動かすしかないのか。
ソースに手を入れるか・・・
0157名無しさん@お腹いっぱい。
2005/04/08(金) 14:20:16メタ検索の対象となるestsearch.cgiをチェックボックスで
選択できるから、それは個々のestsearch.cgiが担っているインデックスを
選択しているのと同じことだろう、ってことでしょ?
0158名無しさん@お腹いっぱい。
2005/04/08(金) 14:39:54ありがとうございます。
マニュアルに書いてます??
相当読んだんですが気付かなかったです。
結論
estmerge.cgi
を使う。
0159157
2005/04/08(金) 15:43:07試しに動かしてみたら意外に便利だったという感じ。
0160名無しさん@お腹いっぱい。
2005/04/08(金) 16:34:160161名無しさん@お腹いっぱい。
2005/04/09(土) 05:29:410162名無しさん@お腹いっぱい。
2005/04/09(土) 06:04:38IF(単純なHTML)の自由度がないのが惜しい。
0163名無しさん@お腹いっぱい。
2005/04/09(土) 16:35:42estindex register -tattr recipient -tattr author ...
とかやればいんじゃね?
0164名無しさん@お腹いっぱい。
2005/04/10(日) 19:20:31うまいことsvn cat とかsvn lsとかだけ使ってestindexに食わせるこ
とはできるでしょうか。
0165名無しさん@お腹いっぱい。
2005/04/10(日) 21:15:47gonzui
0166名無しさん@お腹いっぱい。
2005/04/13(水) 19:24:580167名無しさん@お腹いっぱい。
2005/04/16(土) 14:28:33さて、APIをながめてみるか。
0168名無しさん@お腹いっぱい。
2005/04/16(土) 15:22:52リンクはどこ?
0169名無しさん@お腹いっぱい。
2005/04/16(土) 15:52:31APIはヘッダファイルを見た限りでは取っつきやすそう。
0171名無しさん@お腹いっぱい。
2005/04/16(土) 17:48:55共存は別にできるんでないの。
0172名無しさん@お腹いっぱい。
2005/04/16(土) 19:05:10フォルダの中にできるわけだが。
0173名無しさん@お腹いっぱい。
2005/04/17(日) 18:53:45違う名前にすればOK。
0174名無しさん@お腹いっぱい。
2005/04/17(日) 20:06:050175名無しさん@お腹いっぱい。
2005/04/17(日) 20:23:18rastと違ってDB作成時に属性を決める必要がないみたいで便利そう。
0176名無しさん@お腹いっぱい。
2005/04/17(日) 20:47:150177名無しさん@お腹いっぱい。
2005/04/17(日) 21:28:31libestraier.so は飾りじゃありませんよ。
APIドキュメントが早く欲しいところ。
0178名無しさん@お腹いっぱい。
2005/04/17(日) 23:40:280179名無しさん@お腹いっぱい。
2005/04/18(月) 00:07:36ドキュメントを待つか、ヘッダファイルだけでぶっつけ本番でやった方が
いいとおもうけど。
0180名無しさん@お腹いっぱい。
2005/04/18(月) 00:15:56しかしautomakeもlibtoolも使ってないのか。
0181名無しさん@お腹いっぱい。
2005/04/18(月) 03:56:060182名無しさん@お腹いっぱい。
2005/04/18(月) 06:23:550183名無しさん@お腹いっぱい。
2005/04/18(月) 07:52:57嫌になる。
バッドノウハウのかたまりだもんな。>autoconf一味
0184名無しさん@お腹いっぱい。
2005/04/18(月) 11:22:50バッドノウハウとかいう人はもっとウザい。
0185名無しさん@お腹いっぱい。
2005/04/19(火) 10:08:120186名無しさん@お腹いっぱい。
2005/04/19(火) 11:19:350187名無しさん@お腹いっぱい。
2005/04/19(火) 21:27:33内部で勝手にMutex使われていると性能が出なかったりして、API自体をいじらないといけなくなる。
本家にパッチ送って反映待ちになるのも面倒いから、自分で好きにいじれる方が、、、
0188名無しさん@お腹いっぱい。
2005/04/20(水) 15:06:100189名無しさん@お腹いっぱい。
2005/04/20(水) 17:02:10つ【http://pc8.2ch.net/test/read.cgi/linux/1036088927/】
0190名無しさん@お腹いっぱい。
2005/04/20(水) 17:44:09スケーラビリティの点から見るとたしかに日記に書いてあるような
サーバークライアント方式の導入は正しいように思えるね。
mnogosearch見たいな感じになるのかしらん。
やっぱノードAPI待ちかな。それともTigerが出たらSpotlightとSearchKitに
浮気しようかな。正直迷うな
0191名無しさん@お腹いっぱい。
2005/04/20(水) 18:15:040192名無しさん@お腹いっぱい。
2005/04/24(日) 02:24:32サーバ方式にしてもスケーラビリティは上がらないんじゃない?
検索速度は上がるかもしれないけど、ネットワークの負荷を考えると微妙。
0193名無しさん@お腹いっぱい。
2005/04/25(月) 04:38:56と思うよ。そもそもデータベースのスケールによらず一定だし。
コアAPIの守備範囲であるローカルホストならなおさらじゃない?
0194名無しさん@お腹いっぱい。
2005/04/25(月) 10:24:35それと、DBとは別のマシンでアプリケーションを動かせだろうから、フィルタと登録を
パイプライン的にやれば効率いいかもね。
秒速104文書登録ってのをどこまで維持できるかが見もの。
0195名無しさん@お腹いっぱい。
2005/05/02(月) 10:13:170196名無しさん@お腹いっぱい。
2005/05/02(月) 20:03:29大体Hyper...のほうが倍くらい早いかなて感じだ(当社比)。
0197名無しさん@お腹いっぱい。
2005/05/02(月) 20:23:550198名無しさん@お腹いっぱい。
2005/05/02(月) 20:54:06ってことでわ?
0199名無しさん@お腹いっぱい。
2005/05/03(火) 11:59:48コンソールとXで動くやつもあると嬉しいんだが。
0200名無しさん@お腹いっぱい。
2005/05/03(火) 12:35:570201名無しさん@お腹いっぱい。
2005/05/03(火) 12:37:350202名無しさん@お腹いっぱい。
2005/05/03(火) 13:09:05sym link をdereferenceしないようにお願い
したいんだが、どうすれば良い?
0203名無しさん@お腹いっぱい。
2005/05/04(水) 16:46:010204202
2005/05/04(水) 20:12:26realpath()を呼んでるからだ、つうとこまでは分かった
んだが、絶対パスに展開するのやめさすと各方面に
色々面倒が起きそうな希ガス。
>>203の言うとおり、作者に頼むしかないかな。
0205名無しさん@お腹いっぱい。
2005/05/04(水) 21:30:07MLに投げれば対応してくれるかも。
0206名無しさん@お腹いっぱい。
2005/05/08(日) 11:02:500207名無しさん@お腹いっぱい。
2005/05/08(日) 18:34:26高林さんとかの JavaScript を参考に組めば出来ると思うけど、
たぶんめっちゃおもくなるとおもわれ。
0208名無しさん@お腹いっぱい。
2005/05/08(日) 20:54:44>>201 は Ajax なインターフェースのことを言ってると思われ。
0210名無しさん@お腹いっぱい。
2005/05/08(日) 21:01:23> 高林さんとかの JavaScript を参考に組めば出来ると思うけど、
> たぶんめっちゃおもくなるとおもわれ。
migemoのアイデアって、1990年ころに、プライベートな
研究会で見たことがあるよ。いや、べつにそっちの方が
先だとか言いたいわけではない。みんな同じことを考え
ていたんだということ。で、「たぶんめっちゃおもくな
るとおもわれ」とコメントされ、それで終わっていた。
0211名無しさん@お腹いっぱい。
2005/05/08(日) 21:46:12ありゃ、違うのか。 >>208 で合ってたのかな。
0212名無しさん@お腹いっぱい。
2005/05/08(日) 22:30:05onChangeイベントでsubmitするだけでしょ?
たぶんめっちゃおもくなるとおもわれるけど。
0213名無しさん@お腹いっぱい。
2005/05/08(日) 22:34:28ただ、インクリメンタルにする意義が感じられなくて結局使ってないけど。
0214名無しさん@お腹いっぱい。
2005/05/08(日) 22:42:49エディタで使うみたいに、一個のファイルの中をインクリメンタル検索するのは便利
なんだけど、不特定多数の文書をファイルを対象にた場合は意味がない。
インクリメンタルである利点は、前後関係が確定している場合にのみ享受できる。
0215名無しさん@お腹いっぱい。
2005/05/08(日) 23:39:230216名無しさん@お腹いっぱい。
2005/05/08(日) 23:41:20あれは単なるけばけばしい包装、はなばなしいだけの
ファンファーレ。
そんなものをほしがるやつには、UNIXを使う資格はない。
0217名無しさん@お腹いっぱい。
2005/05/08(日) 23:50:04と思うんだけど、みんなは違うの?
0218名無しさん@お腹いっぱい。
2005/05/08(日) 23:58:20俺の言う事を最後まで聞け(ゴルァ と思う事多し
動的なインターフェイスは使用者に掛かる負荷が大きいんだよね
何も考えずにインクリメンタルサーチ使える人は正直感心する
0219名無しさん@お腹いっぱい。
2005/05/09(月) 00:14:290220名無しさん@お腹いっぱい。
2005/05/09(月) 01:27:21チュートリアルにそれに関した記述が見当たらなかったんだけどやっぱり無いのかな。
0221名無しさん@お腹いっぱい。
2005/05/09(月) 01:55:120222名無しさん@お腹いっぱい。
2005/05/10(火) 11:37:13してその分だけ更新するようにできないかな。
0223名無しさん@お腹いっぱい。
2005/05/10(火) 12:03:00もちろんできるでしょ。
0224名無しさん@お腹いっぱい。
2005/05/10(火) 12:38:460225名無しさん@お腹いっぱい。
2005/05/10(火) 13:04:17そう思うなら、口を閉じて引っ込んでろ。
0226名無しさん@お腹いっぱい。
2005/05/10(火) 13:34:10FAM:http://techpubs.sgi.com/library/tpl/cgi-bin/getdoc.cgi?coll=0650&db=bks&fname=/SGI_Developer/books/IIDsktp_IG/sgi_html/ch08.html
gamin:http://www.gnome.org/~veillard/gamin/
いずれにせよOS依存なので、自分の環境にかなり精通していないと難しいだろう。
Google Desktop Searchはどうやってるのか知ってる?
0227名無しさん@お腹いっぱい。
2005/05/10(火) 13:51:17なにそんなカリカリしてるの?
0228222
2005/05/10(火) 14:26:13どうもです。でもプログラミングしないといけないのは辛いですね。
過去1時間に更新された更新ファイルのパスのリストがどっかのファイル
に記録されているような仕様だったら嬉しいのですが。
あ、ちなみに225は私じゃないですよ。
0229名無しさん@お腹いっぱい。
2005/05/10(火) 14:41:52それどうやるの?
0230名無しさん@お腹いっぱい。
2005/05/10(火) 15:02:09Beagleは使える環境の場合はInotifyを使うみたい。
0231名無しさん@お腹いっぱい。
2005/05/10(火) 16:15:10inotifyでもそこんとこは変わってないよね?
監視対象を再帰的に広げるよりは、定期的にfindした方が負荷が小さいような。
0232名無しさん@お腹いっぱい。
2005/05/10(火) 16:32:35そう思うなら、口を閉じて引っ込んでろ。
0233名無しさん@お腹いっぱい。
2005/05/10(火) 16:40:20軽量高速な更新検出手段の探求/実現が必要ですねッ!!
0234名無しさん@お腹いっぱい。
2005/05/10(火) 16:47:45ガンバレー!!
0235名無しさん@お腹いっぱい。
2005/05/10(火) 17:44:25明示的に更新を通知する手段と、更新頻度が高い場所は巡回頻度も高めると
いった工夫を併用すればかなり使いやすくなるんじゃない?
0236名無しさん@お腹いっぱい。
2005/05/10(火) 17:54:10そうカリカリすんなよ。歯痛にでもなったか?
0237名無しさん@お腹いっぱい。
2005/05/10(火) 23:44:55仕組みになってたと思う。
0238名無しさん@お腹いっぱい。
2005/05/11(水) 18:00:030239名無しさん@お腹いっぱい。
2005/05/11(水) 18:20:12わかった。全部お前にまかすわ。あとはよろしくな。
0240名無しさん@お腹いっぱい。
2005/05/11(水) 18:24:58ハンドリングするプラグインを扱う枠組みだな。
0241名無しさん@お腹いっぱい。
2005/05/11(水) 18:29:16わかった。そっちはお前にまかすわ。あとはよろしくな。
0242名無しさん@お腹いっぱい。
2005/05/11(水) 18:53:11プラグイン機構は不要だと思われる。
それよりPerlかRubyのバインディングを早く出してほしい。
0243名無しさん@お腹いっぱい。
2005/05/11(水) 19:57:37いや、じゃなくて、新しい文書扱いシステムを作った側が、
検索エンジンがそれを効率良く扱えるように
一連の設定やプログラミングを行なう枠組みが
いるのではないかという話だ。
0244242
2005/05/11(水) 22:48:38更新処理をトリガとして関数が呼ばれる仕組みが大抵のDBには備わっているけど、
一般的な文書扱いシステムではどうなんだろう。
0245名無しさん@お腹いっぱい。
2005/05/12(木) 11:45:47select() かけることで対応できないかなあ。
0246名無しさん@お腹いっぱい。
2005/05/12(木) 12:18:150247名無しさん@お腹いっぱい。
2005/05/14(土) 02:55:39Rast: A full-text search system
ttp://www.netlab.jp/rast/
●検索対象となる文書の分野や言語を選ばない
テキストデータを n 個の文字の並びである N-gram に分割して検索を行うため,「検索漏れが生じない」,「辞書の整備が必要ない」という特徴がある N-gram 方式を選べます.
これにより,検索対象となる文書の分野や言語を選ばずに広く利用することができます.
●多様なファイル形式への対応
HTML や Microsoft Word といった多様なファイル形式の文書からテキストデータやタイトルや作成日などの属性情報を抽出し,検索対象にできます.
●全文検索ライブラリの提供
C 言語と Ruby で利用可能な全文検索ライブラリを提供することにより,本ソフトウェアを利用した全文検索を行うアプリケーションを開発することができます.
さらに,ライブラリの利用例として,過去のメールを全文検索できる電子メールソフトを開発します.
●インクリメンタルな文書の追加登録
作成したデータベースに対して,インクリメンタルに文書の追加登録ができます.このため,一度作成したデータベースを作成し直す必要がありません.
誰か試して
0248名無しさん@お腹いっぱい。
2005/05/14(土) 03:58:31C APIを提供してるわりにクライアントライブラリまでGPLなのはちょっと痛い。
せめてXMLRPCの仕様を公開してほしいが、だったらEstraierのノードAPIを
待った方が幸せになれそう。
Matzのお膝元のnetlabで開発してるので、Rubyを使ったアプリケーションが
いろいろ出回ってきたら面白くなるのかもしれない。
0249名無しさん@お腹いっぱい。
2005/05/14(土) 17:02:09とか言われた時点でもう、センスつうか趣味
つうか合わないを思いますわ、パスですわ
>>247
0250名無しさん@お腹いっぱい。
2005/05/14(土) 17:18:490251名無しさん@お腹いっぱい。
2005/05/14(土) 19:50:070252名無しさん@お腹いっぱい。
2005/05/14(土) 20:45:230253名無しさん@お腹いっぱい。
2005/05/14(土) 22:58:21ML archive も落ちてる。
0254名無しさん@お腹いっぱい。
2005/05/14(土) 23:58:140256254
2005/05/17(火) 00:09:150257名無しさん@お腹いっぱい。
2005/05/25(水) 10:37:35http://hyperestraier.sourceforge.net/
0258名無しさん@お腹いっぱい。
2005/05/25(水) 16:35:210259名無しさん@お腹いっぱい。
2005/05/25(水) 22:28:14SUGEEEEEEEEEEE!!!!!!!
0260名無しさん@お腹いっぱい。
2005/05/27(金) 18:44:350261名無しさん@お腹いっぱい。
2005/05/31(火) 23:04:020262名無しさん@お腹いっぱい。
2005/06/01(水) 11:26:516/2 13:00〜 「全文検索システム Rast の設計と実装」
6/3 10:00〜 「全文検索 BOF」
などという企画をやってる。
0263名無しさん@お腹いっぱい。
2005/06/04(土) 22:50:240264名無しさん@お腹いっぱい。
2005/06/04(土) 23:10:40(□←ばかり)どうしてか教えてください。
0265名無しさん@お腹いっぱい。
2005/06/05(日) 00:05:250266名無しさん@お腹いっぱい。
2005/06/05(日) 00:20:490267名無しさん@お腹いっぱい。
2005/06/05(日) 00:54:33「電車男」という映画を見に行くとなにかヒントが得られるかもしれません。
0268名無しさん@お腹いっぱい。
2005/06/05(日) 18:28:53並列化できればGoogleとかに匹敵するんじゃないか?
0269名無しさん@お腹いっぱい。
2005/06/06(月) 10:22:14全文検索BOFでは、NAMAZU開発者とRast開発者とHyper Estraierの開発者が
一堂に会して、開発思想とかを語ってくれた。
ただ、2時間もあった割には突っ込んだ話ができず、薄かった感じがする。
0270名無しさん@お腹いっぱい。
2005/06/10(金) 22:35:21http://tokuhirom.dnsalias.org/~tokuhirom/tokulog/1193.html
0271名無しさん@お腹いっぱい。
2005/06/10(金) 23:07:46Rastと違ってAPIがリモートとローカルで違うらしいから、
やっぱノードAPIを待った方がいいんじゃないかと思う。
0272名無しさん@お腹いっぱい。
2005/06/10(金) 23:27:57RubyとかだとHTTPサーバのツールキットもあるわけだし。
0273名無しさん@お腹いっぱい。
2005/06/11(土) 10:40:11バインディングをわざわざ選ぶかなぁ?
むしろスクリプトで書いたプログラムにいちいちサーバ立てるのやってらんないという
面倒くさがり向きなんじゃないの。
0274名無しさん@お腹いっぱい。
2005/06/11(土) 16:42:53Cでなんてやってられない。
0275名無しさん@お腹いっぱい。
2005/06/12(日) 03:31:38ちょうどいいから rast のソースでも読んでみなよ。
といいながらも ruby が楽しくなりつつある今日この頃です。
0276名無しさん@お腹いっぱい。
2005/06/12(日) 09:49:52WEBrick+HyperEstraierとかWEBrick+Rastってのが強力かつ簡単でよさげ。
0277名無しさん@お腹いっぱい。
2005/06/12(日) 15:35:53ライセンス問題?
0278名無しさん@お腹いっぱい。
2005/06/12(日) 23:07:120279名無しさん@お腹いっぱい。
2005/06/24(金) 07:37:52まだ作りこみが甘い感じだけど、今後に期待age。
http://www.mitsuki.no-ip.com/~seagull/software-archives/hyperestraier/gdestraier.html
0280名無しさん@お腹いっぱい。
2005/06/24(金) 09:56:050281名無しさん@お腹いっぱい。
2005/07/04(月) 01:40:52open/closeシステムコールをを監視してスポットライト風にインクリメンタルアップデートが
できると面白そう。ガンガレ。
まずは更新があったファイルを指定するとその情報のみをアップデートする機能が
必要だな。既存のものだと全部を指定してアップデートする方法しか用意されてないからな。
0282名無しさん@お腹いっぱい。
2005/07/04(月) 18:08:11いちお、estcmdに-sd -cm 付けてるです。
だから全更新してもタイムスタンプの新しいやつ以外はスキップされるですよ。
0283名無しさん@お腹いっぱい。
2005/07/06(水) 00:48:17namazuにしろなんにしろ従来のは全更新しかなかったと思うんだよね。
だから、逆に一部更新はできるのかと。
編集した利用者ならどこを編集したかわかっているわけだから全更新して
全部のディレクトリをなめる時間待たされるよりも更新した箇所を指定して
updateできたほうがよくない?
んで、その上でシステムコールを監視してスポットライト風アップデートですよ。
0284名無しさん@お腹いっぱい。
2005/07/06(水) 03:03:16しないと難しいんじゃない? いずれにしても、オーバーヘッドがでかくなってしまう。
移植性の問題もあるし。
よく更新されるディレクトリの監視頻度を上げるのと、ユーザが明示的に更新を指示
をするのを併用すれば実用上は十分だと思うけど。メールボックスとかだったら、アプ
リケーションのプラグインかなんかで更新ロジックを組み込めるといいね。
0285名無しさん@お腹いっぱい。
2005/07/06(水) 10:40:58Windowsじゃ無理だけど、UNIX系ならそのへん独立してるし。
WinFSには全文検索っぽい機能が組み込まれているというウワサも聞いたけど、
どうなんでしょ。
0286名無しさん@お腹いっぱい。
2005/07/06(水) 10:49:45Hyper Estraierは、ディレクトリでなくファイルそのものを指定して
インデックスに登録できるよ。
>>284
famを使い、特に指定されたディレクトリだけ監視。
移植性と監視コストの問題はfamに丸投げして、各プラットフォームに最適
なアルゴリズムで監視できる事を期待。
更新された時に即座に更新だと確かにオーバヘッドが大きすぎなんで、
遅延してある程度のまとめ更新するデーモンをniceしておけば実用的な
範囲に収まるっぽくね?
いくらなんでも、数分前に更新した文書くらい探さなくても判るだろ。
それより問題は、インデックスをユーザ毎に持つと重複が多すぎるって
事だな。サイズもそうだけど、オーバーヘッドも整数倍になる。
業務の書類とかmanページを探したい時なんか完全に重複だね。
インデックス中の文書データに対するパーミッションをなんとかして、
システムグローバルなインデックス&検索機能のデーモン化をしないと
現実的でないような気がしてきた。
0287名無しさん@お腹いっぱい。
2005/07/06(水) 11:04:33ファイルシステムオーバーライドするのは面白そうなんで、
LUFS使って簡単に実装しようと思ったけど、
/usr をすげかえる気にならないし、対象ディレクトリが増えた時に
fstabの構成変えるのも馬鹿らしいので廃棄処分にしますた。
0288名無しさん@お腹いっぱい。
2005/07/06(水) 15:04:04事実、どっかからダウンロードしてきた文書をすぐに全文検索したくなる
ことは多い。それを考えると、やっぱり手動更新指示の機能もほしいよね?
Hyper Estraierの更新処理は異常に速いから、検索窓の横に「更新」ボタンを
つけておいて、結構気軽に更新をかけさせても実用になると思う。
ラジカセのメタファを使って、「再生(右向きの三角)」で検索をして、
「録音(丸)」で更新をして、「停止(四角)」で検索や更新の停止をして、
負荷状態を音圧っぽく表現するというのも面白いかもね。
0289名無しさん@お腹いっぱい。
2005/07/06(水) 16:25:21...目的のファイルが判ってるなら、grepした方が早いような気がする...
でもまぁ、同時ログインしてる別ユーザもいるから、確かに遅延はかなり小さく
しないと厳しい状況がありうるだろうね。
更新ボタンを置くのはいい考えなので、Quick build機能付けるよ。
0290名無しさん@お腹いっぱい。
2005/07/06(水) 19:04:30デスクトップ検索アプリを目指すなら、マルチユーザのインデックスの共有はそれほど考え
なくてもいいんじゃね?
自分のホームディレクトリを対象にしたインデックスさえ作れればほとんどのユーザは満足
でしょ。デーモン走らせないと使えないのは初心者向けでないような気がするよ。
副次的な機能として、他人のインデックスをリードオンリーで開けるようにして、チェック
ボックスをオンにすればそこの結果もマージして表示できるといいかも。
つまり他人のインデックスを更新できる必要はないってこと。
manとかの共有物のインデックスはrootで最初に作っておいて、/var 以下においておけば
いいんじゃない? その更新もわざわざデーモンにしないで、cron実行で十分でしょ。
0291名無しさん@お腹いっぱい。
2005/07/06(水) 20:47:50基本的にはそうなんだけどさ。
manなら問題ないけど。rootで作ると、本来ユーザに読み込み権限の無いファイルも検索
できて、要約も見えちゃうわけじゃん。
かといって、権限単位にインデックス作るというのも現実的でないし。
業務用の、たとえ共有ディレクトリに入っている技術経歴書とか、仕様書とかを対象と考えた時、
細かい制限ができないと問題だと思ったわけ。
つーわけで、ホームユーザには間違いなく十分だけど、職場で活用となると問題があるわけよ。
試してないけど、
> 副次的な機能として、他人のインデックスをリードオンリーで開けるようにして、チェック
> ボックスをオンにすればそこの結果もマージして表示できるといいかも。
これは現段階でできるような気がする。
今現在、検索用にはDBをリードオンリーで開いてるし、マージもデフォルトだし。
Hyper Estraierはリードオンリーで複数プロセスがオープンしても平気だし。
ってか、みんなのところでちゃんとビルドできてる?、、、って、だれも試してませんか、そうですか。
0292名無しさん@お腹いっぱい。
2005/07/07(木) 00:53:57一般ユーザの読み込み権限(S_IROTH)がついているファイルだけ読み込むように
すれば大抵は大丈夫だと思うけど。
0293名無しさん@お腹いっぱい。
2005/07/07(木) 13:16:11> Hyper Estraierは、ディレクトリでなくファイルそのものを指定して
>インデックスに登録できるよ。
・・・できないんですけど?
>第3引数としてファイル名を指定すると、そのファイルから処理対象のパスのリストを読み込みます。
って書いてあるし・・・
0294名無しさん@お腹いっぱい。
2005/07/07(木) 13:43:20そのリストにファイル名書くんだよ。
find . -name '*.txt' | estcmd gather オプション インデックス -
0295名無しさん@お腹いっぱい。
2005/07/12(火) 00:26:37Cygwinを使えるし。
0296名無しさん@お腹いっぱい。
2005/07/12(火) 16:15:12Cygwinでも動くのかなぁ。
0297名無しさん@お腹いっぱい。
2005/07/16(土) 23:16:11そうだったのカー (AA略
0298名無しさん@お腹いっぱい。
2005/07/17(日) 03:20:260299名無しさん@お腹いっぱい。
2005/07/17(日) 20:23:17プログラムってどうすればいいかわかりますか??
調べてもわかんないです。本でもなんでも教えてほしいです。。。
0300名無しさん@お腹いっぱい。
2005/07/17(日) 21:44:470302名無しさん@お腹いっぱい。
2005/07/19(火) 13:36:110303名無しさん@お腹いっぱい。
2005/07/19(火) 21:32:110304名無しさん@お腹いっぱい。
2005/07/20(水) 10:11:12アドバイスどうも。libsocketはソケットの抽象化ライブラリみたいだね。
ふつーのglibcソケットだけでも大丈夫みたいだけど。
起動はするが、ポートを叩いてもうんともすんとも言わないという状況だから、
ダイナミックロード関係じゃなさそう。ちなみにOSX(panther)の話ね。
Debianならあっさり動いたからDebianホストでestmasterを動かす事にするよ。
0305名無しさん@お腹いっぱい。
2005/07/22(金) 22:32:56ttp://www.mitsuki.no-ip.com/~seagull/software-archives/hyperestraier/gdestraier.html
誰も気にもかけて無いらしいけど。
0306名無しさん@お腹いっぱい。
2005/07/23(土) 11:27:34FreshMeatとかSourceForgeに登録したら?
0307名無しさん@お腹いっぱい。
2005/07/24(日) 01:19:46新しすぎで無理だった。>gdestraier
0308名無しさん@お腹いっぱい。
2005/07/25(月) 20:23:32デスクトップ検索もJavaで作った方がいいんじゃねの?
クライアントは多少重くても問題ない。その上でさらにアプレット
みたいなプラグインを動作させられるようにすれば、Spotlightに対抗でき
るかもよ。
0309名無しさん@お腹いっぱい。
2005/07/25(月) 20:29:10> java版APIも出たねぇ。
> デスクトップ検索もJavaで作った方がいいんじゃねの?
そんな事したら、死に体になってしまう。
0310名無しさん@お腹いっぱい。
2005/07/25(月) 21:18:43下げても大丈夫だと思う。
とりあえず、sarge準備して試してみますわ。
>>308
重いにも限度があると思う。
起動がトロかったり、フットプリントが許容できても、サクサク間がでないと。
もっとも、いま現在は単一スレッドで要約まで出してるから、サクサクとは言いがたいけど。
目標は、nautilusでディレクトリたどるより手軽に絞りこみ検索できる事。
0311名無しさん@お腹いっぱい。
2005/07/26(火) 11:37:21つーか移植性が確保できる(LinuxでもWindowsでもMacでも動く)のが重要だろ。
sargeやら何やらのレベルで非互換がでてるようじゃ流行らないと思われ。
0312名無しさん@お腹いっぱい。
2005/07/26(火) 20:29:41実際に試せばわかると思うが「サクサク動かない」よ。
0313名無しさん@お腹いっぱい。
2005/07/26(火) 21:40:39意味不明。Javaって、必要なランタイムライブラリがインストールされてなかったり、
バージョンが適合しなくても問題無いって?
0314名無しさん@お腹いっぱい。
2005/07/27(水) 03:19:30実装テクニックの問題だったりしないか?
0315名無しさん@お腹いっぱい。
2005/07/27(水) 07:41:42もしかして最近は違うの?(><)
0316315
2005/07/27(水) 07:42:590317名無しさん@お腹いっぱい。
2005/07/27(水) 09:18:230318名無しさん@お腹いっぱい。
2005/07/27(水) 09:47:33抵抗なくやってくれるでしょ。J2SEのコアライブラリ以外に必要なランタイムが
あったとしても、それも同梱してしまえばいい。
別にJavaマンセーと言うつもりはないけど、GNOMEやGTK+のバージョンの違いに
悩まされるのは普通のユーザには耐え難いことだよ。依存関係が連鎖している
から、作業途中で嫌になってやめてしまう人が多いと思う。かくいう俺もそれで
gdestraierの利用を断念した。
もしもDegianやVineなどのディストリビューションに標準採用されたとしたら、
そういう苦労はほとんどなくなるかもしれないが。
0319名無しさん@お腹いっぱい。
2005/07/27(水) 10:20:17えるようにしてくれないと不便だにゃぁ.cgi から叩きたい時もあるし.
0320名無しさん@お腹いっぱい。
2005/07/27(水) 10:25:320321名無しさん@お腹いっぱい。
2005/07/27(水) 10:35:270322名無しさん@お腹いっぱい。
2005/07/27(水) 11:11:020323名無しさん@お腹いっぱい。
2005/07/27(水) 16:43:19作者がコミュニティを小さく保ちたいとは考えていないとか、
windows進出でgoogledesktopなどと張り合う事を考えている
という前提はそもそも正しいの?
ところで、>>304 の問題は0.5.1で解決した。
いまはest_free_net_env()してからest_init_net_env()するとSEGVるので
悩んでいる。
0325あうたん
2005/07/28(木) 18:09:01みなさまはじめまして
最近「Estraier」なるものの存在に気づき社内のデータの検索エンジンをWindows
ベースで構築できないかと考えているものでございます。
ここ最近Windowsバイナリが公開されまして早速つかってみました。検索スピード
に驚くばかりでこれはかなりイケてるなと思ったのですが、やはりn-gram検索の
スコアでは検索時にTOPに出てほしいものがでてきてくれません。
そこでインデックスを何とかして指定したもののスコアをあげたいのですが、やはり
そういうことは難しいのでしょうか?スコアをいじること自体がn-gramの検索の精神
に反していることは理解しているのですが、なんとかしてスコアを補正して特定の
ものを検索の最初にヒットさせたいのです。
これは「Estraier」の問題ではないと思いますが 特定のファイルをスコアの重みを
調整する術はないものでしょうか?(たとえばたくさんのアクセスがあったファイル
は最初の方に表示したいというものです)
皆様のお知恵をお貸しいただければ幸いです
WindowsXP+Apache1系+estraier-1.2.28-win32
0326名無しさん@お腹いっぱい。
2005/07/28(木) 18:57:55文章にキーワードを設定しておいて、それと一致するものは
Estraierによる検索結果「よりも先に」表示させるとか。
0327名無しさん@お腹いっぱい。
2005/07/28(木) 19:23:57スピードが遅くなってもいいのなら、実際いろんな方法があると思うけど。
内部に手を入れてスコア計算をいじくるのもいいし、hyperのAPIで出力結果をバッファして
なんらかのヒューリスティックなソートを掛けるのもいいと思う。
特定のキーワードにだけ高く反応してほしいなら、hiddenテキストに
そのキーワードをたくさん書いておけばtf/idfスコアは当然高くなるよね.
ああ、estraierに隠しテキストはあったっけ?
0328名無しさん@お腹いっぱい。
2005/07/28(木) 20:03:18既にあるか、自前で作るんだよね。
ならば、アクセス数をDBでカウントして、10アクセスとか100アクセス毎にその文
書の更新をかけて、その際にアクセス数を属性としてつければいい。検索する際に
は、アクセス数をソート条件にすればいい。
0329あうたん
2005/07/29(金) 17:17:49皆様ご回答ありがとうございます。
アクセスログを取る仕組みに関してはログからなんとかいけそうな気配なんですが
理解力がなくアクセス数を属性としてつける部分がよくわかっていないのです。
ドキュメントには
estcmd gatherで特定ディレクトリのインデックスをつくるところまでは理解できたの
ですが、そこから特定なファイルにのみ属性情報をつける方法が分からないのです。
前身のEstraierではestindex registerでできるようなことが見受けられるのですが、
今回のHyperEstraierでは特定ファイルに対する属性情報(アクセスの頻度による
表示の重み)はどうやってつければいいのでしょうか?
例えば重みを数値(一番先に表示したいものは1000とかその次は999とか)で表現
できると表示順を制御しやすいのですが
またその際にソートは「属性情報(表示の重み)」・「n-gramによるスコア」という順序
でソートがかかるのでしょうか?
教えて君で申し訳ありませんが皆様のお知恵をお貸しいただければ幸いです。
0330名無しさん@お腹いっぱい。
2005/07/29(金) 18:16:550331名無しさん@お腹いっぱい。
2005/08/01(月) 05:30:520.5.3のestcmdならいちいちドラフト形式にしたりせずにできるんじゃないの。
あとn-gramはスコアの計算方法じゃないよ。
スコア計算はtf/idfで、namazuなんかと基本的にいっしょ。
0332あうたん
2005/08/01(月) 10:22:43> 0.5.3のestcmdならいちいちドラフト形式にしたりせずにできるんじゃないの。
使用しているのは0.5.1のWindowsバイナリ版でした。
そのドキュメントには
estcmd put [-cl] db [file]
となっていて属性を指定するようなオプションがないようなのです。(T_T
0.5.3では330さんがおっしゃるようにできるのでしょうか・・・
> あとn-gramはスコアの計算方法じゃないよ。
よく読むとそうでした。よく理解しないで用語をつかっていました。(^^;
0333名無しさん@お腹いっぱい。
2005/08/01(月) 12:40:01対象のファイルに対して、拡張子に応じてestcmd draftとかestxfilt.batで
テキストを抽出するとともに、先頭に「title=あいうえお」というような属性定義
をするその一部として、「myscore=10000」みたいにスコアを属性としてつければ
いいと思う。検索する時には順序の指定で「myscore NUMD」にすればmyscoreの大き
い順番で並べられると思うよ。
331の言うように、0.5.3からは、estcmd gather(-pxオプション?)を使えばドラ
フト形式を使わなくても属性の指定ができるようになったような希ガス。
0334あうたん
2005/08/01(月) 14:37:43とんちんかんな質問をしているのに、詳しくご教授いただきありがとうございます。m(_ _)m
なんとなくですがわかったような気がします。(^^;
一括登録では属性を「myscore=0」などにしておいてestcmd gather -px で一括登録
し、その後、上位に表示させたい特定ファイルのみオリジナルファイルを「@myscore=1000」
などをつけたドラフト形式に変換しestcmd putで1件づつ登録という流れになるということですね。
まだ、いまいちドラフト形式にするところがよく分かっていないのですが、ドキュメントに指定され
ているようなドラフト形式
@uri=http://www.hogehoge.jp/hogehoge.html
@title=hogetest
@cdate=2005-08-01T00:00:00+09:00
@mdate=2005-08-01T00:00:00+09:00
@myscore=1000
上記のような形式をファイルのどの部分に記載すればいいのでしょうか?
文字コードはUTF8で、ファイルの末尾にアペンドするということでいいのでしょうか?
そもそもドラフト文書への変換用としてestcmd draftがあるみたいに記載があるのですが、
WEBから取得してきたHTMLファイルなどをこのコマンドで変換した場合は、単に文字コードを
自動で判別してUTF8に変換して出力するだけ?の機能なのでしょうか
コマンドの引数では属性を指定したりはできないのでいまいち使い方がわかりません(^^;
estcmd putで属性登録に関する部分もサポートしてもらえるといいかんじになりそうなんですが・・・
いま最新のバイナリみたらWindows版も0.5.3があがってました。最近、勢力的に開発を
されているようで今後に期待です。調べてみたらおっしゃるような(-px)オプションが
追加されていました。
0335名無しさん@お腹いっぱい。
2005/08/01(月) 15:11:09書くみたいです。
@uri=http://www.hogehoge.jp/hogehoge.html
@title=hogetest
@myscore=1000
近所のラーメン屋さんを探してみませんか?
Google ローカルでお試しください
estcmd draftはHTMLのタグを外してから、タイトルなどの属性も抽出したドラフトを作って
くれます。文字コードもUTF-8にしてくれるみたいです。
estcmd putを使わなくても、estcmd gatherにファイルのリストを読み込ませれば登録できる
と思いますよ。estcmd gather abc list.txt を実行すると list.txt からファイル名と属性
のリストを読み込んでくれるはずです。
私はメーリングリストの過去記事の検索システムをHyper Estraierで作って使っているのです
が、属性をいくつかつけたいので、全部の記事の文書ドラフトをいったん作ってから読み込ま
せています。-pxオプションがあればその苦労をしないで済むようになりそうです。
0336あうたん
2005/08/01(月) 15:49:31> estcmd putを使わなくても、estcmd gatherにファイルのリストを読み込ませれば登録できる
> と思いますよ。estcmd gather abc list.txt を実行すると list.txt からファイル名と属性
> のリストを読み込んでくれるはずです。
迅速なレスありがとうございます。なるほどです。1件の登録であってもリストをつくって登録すれば
estcmd putに機能をもたせなくてもいいということですね。(^^;
ちなみにそのリストファイルの書式ってどんな感じになりますでしょうか?
ドキュメントの読み方があまいかもしれませんが、このあたりの情報はどちらにありますでしょうか?
ほんと教えて君ですいません。m(_ _L
0337名無しさん@お腹いっぱい。
2005/08/01(月) 16:35:38C:\data\000001.txtを登録する際に、@uriがfile://C|/data/000001.txtで、
@titleがABCDEで、myscoreが1000なら、
C:\data\000001.txt file://C|/data/hogehoge ABCDE 1000
というリストになると思います。空白の部分はタブ1個であけてください。
これを list.txt として保存したなら、
estcmd gather -ft -px @uri -px @title -px myscore casket list.txt
を実行すれば登録できると思います。登録対象がテキストでなくWordなどの場合は -ft のかわりに
-fx でフィルタを指定することになると思います。
0338あうたん
2005/08/03(水) 08:23:43ありがとうございます。さっそくやってみます。
この辺の情報も付属のドキュメントに記載があるのでしょうか?
ドキュメントの読みが浅くてみなさまにご迷惑をおかけしているようで(^^;
0339名無しさん@お腹いっぱい。
2005/08/03(水) 11:50:56> にすることができ、第1フィールドは対象文書のパス名、第2フィールド以降は
> 属性値の定義として扱われます。-pxによって第2フィールド以降に対応する属
> 性名を定義します。このオプションは複数回指定できます。
って書いてあるよ。この説明から337の用法まで思い付くのは大変だと思うが。
Windows版のインストール方法も含めて詳しく説明した解説サイトがあればいい
のにね。
ついでに良スレage
0340名無しさん@お腹いっぱい。
2005/08/03(水) 13:05:41> Windows版のインストール方法も含めて詳しく説明した解説サイトがあればいい
> のにね。
いいだしっぺの法則 ズサー
0341あうたん
2005/08/03(水) 15:05:53ありがとうございました。このあたりを中心にもう一度熟読?(^^;
してみようと思います。
導入に関してWindows版のサイトや導入した際の備忘録ページなどががあると
訴求力が大きく違うかもしれませんね。
現在メーリングリストに入っていますがほかにもEstraierのことがやり取りされて
いるところってあるのでしょうか?
メーリングリスト
hyperestraier-users-ja mailing list
http://sourceforge.net/mailarchive/forum.php?forum=hyperestraier-users-ja
で過去のログがみたかったんですけど、私の環境では文字化けしてしまい
どうもうまくよめませんでした。(T_T
0342名無しさん@お腹いっぱい。
2005/08/03(水) 16:41:27日本語MLの文字化けはsf.jpの仕様なので、こっちを見るといいよ。
ttp://hyperestraier.sourceforge.net/sfmltoj.cgi
まぁ、それでもUTF-8な人のヘッダは化けてる訳ですが...
0344名無しさん@お腹いっぱい。
2005/08/15(月) 02:07:130345名無しさん@お腹いっぱい。
2005/08/15(月) 10:55:460346名無しさん@お腹いっぱい。
2005/08/15(月) 12:12:440347名無しさん@お腹いっぱい。
2005/08/15(月) 12:32:160348名無しさん@お腹いっぱい。
2005/08/15(月) 13:43:00どっかに転がってるんぢゃね?
Gentoo Portageにはある。DarwinPortsには、鹿版がある。
0349名無しさん@お腹いっぱい。
2005/08/15(月) 16:24:57ESTCONDUSUってUSUALのことだったのかYo!
0350名無しさん@お腹いっぱい。
2005/09/22(木) 00:17:430351名無しさん@お腹いっぱい。
2005/09/22(木) 00:20:410352名無しさん@お腹いっぱい。
2005/09/22(木) 09:10:49でも win32 バイナリ来てないよ、(´・ω・`)ショボーン
0353名無しさん@お腹いっぱい。
2005/09/26(月) 02:51:570354名無しさん@お腹いっぱい。
2005/09/26(月) 04:21:11検索するディレクトリ書いたファイル読み込ませて
index作成ってのがどうしてもできないのヨ。
どなたか、オレはこれでできとるがな、という
コマンドラインの書式をイッパツ晒してくれませんでしょうか。
0355名無しさん@お腹いっぱい。
2005/09/26(月) 07:11:36うちは出来てるヨ(オプションはてけとー)
> estcmd.exe gather -cl -ft -ic euc-jp -il ja -sd -cm casket filelist.lst
「検索するディレクトリ書いた」というより「検索するファイルリスト自体」じゃないとダメなのかも
0356名無しさん@お腹いっぱい。
2005/09/27(火) 11:10:16htmlファイルの<TITLE></TITLE>を表示したいのですが
どのようにしたら良いでしょうか。
0357名無しさん@お腹いっぱい。
2005/09/27(火) 11:29:59さんくすこ。おいらもできたよ。
0358名無しさん@お腹いっぱい。
2005/09/27(火) 16:48:16estcmd out ってちゃんと使えてますか?
dbの部分でどうしてもエラーが出ます。
C:\cygwin\home\ore>estcmd out casket file:///C:/cygwin/home/ore/html/2004.5.3.html
estcmd: INFO: status: name=casket dnum=74 wnum=31721 fsiz=4617468 crnum=0 csiz=0
dknum=0
estcmd: ERROR: casket: no such item
estcmd: INFO: closing: name=casket dnum=74 wnum=31721 fsiz=4617468 crnum=0 csiz=
0 dknum=0
casketが作成したindexのディレクトリ。同じ場所で
estcmd search ごにょごにょ casket "検索文字"ならちゃんと動くし
エラーメッセージ一行目では認識しときながら二行目では
no such itemになってるのがよくわからないんですが。
0359名無しさん@お腹いっぱい。
2005/09/27(火) 17:12:43out はあまりテストしてみたくないので、
> estcmd list casket
で ID 取ってみて URI の代わりに ID でやってみては?
purge とかはふつーにうごいてるけどなあ。
0360358
2005/09/28(水) 11:29:19file:///C:/cygwin/home/ore/html/..
ではだめで
"file:///C|/cygwin/home/ore/html.."
の方式でやればいいだけだったorz。
まさに板違い質問にて大変失礼。IDでもイケましたよ。
0361名無しさん@お腹いっぱい。
2005/09/28(水) 16:50:25標準で表示されるような気がするんだけど。
0362名無しさん@お腹いっぱい。
2005/09/29(木) 14:13:060363名無しさん@お腹いっぱい。
2005/09/29(木) 14:39:21週末は遊べそう…
0364名無しさん@お腹いっぱい。
2005/10/02(日) 07:05:41そういうもの?Win32のバイナリっす
0365名無しさん@お腹いっぱい。
2005/10/02(日) 14:59:43ホントやね。うちも泣く泣く作り直した。
以前も 0.3.x から 0.5.x に変わった時に更新したらおかしくなったなあ。
0366名無しさん@お腹いっぱい。
2005/10/02(日) 17:58:40うう、うちだけじゃないのか…。
こればっかりはなんとかならんかねー
0367名無しさん@お腹いっぱい。
2005/10/02(日) 19:48:040.9.0っていうことはベータ的位置づけということなのだと思うけど...
リリース計画がはっきりしてないから予想できないけどね。
0368名無しさん@お腹いっぱい。
2005/10/02(日) 19:58:29作者のブログではそろそろ1.0を出すって書いてあるけど、いつになるやら。
0369名無しさん@お腹いっぱい。
2005/10/02(日) 20:21:56まだ新機能追加はありそう。なんだかんだで正式版はまだ先になりそうだね...
いや、分割パッケージでだすのかなぁ?
開発日記よんでると長期計画なさそうだから本人も知らなさそうだ(w
0370名無しさん@お腹いっぱい。
2005/10/02(日) 22:25:40一般的なOSSの場合、開発完了はプロジェクトが生きているうちはないんじゃない?
0371名無しさん@お腹いっぱい。
2005/10/02(日) 23:13:25くらいは公開してくれるとありがたいな。本人にも役に立つだろうし、貢献もしやすい。
0372名無しさん@お腹いっぱい。
2005/10/02(日) 23:21:510373名無しさん@お腹いっぱい。
2005/10/03(月) 02:27:440374名無しさん@お腹いっぱい。
2005/10/03(月) 10:31:37なんの GUI?
0375名無しさん@お腹いっぱい。
2005/10/03(月) 13:43:29estcmdのGUI
0376名無しさん@お腹いっぱい。
2005/10/03(月) 16:25:45http://hyperestraier.sourceforge.net/intro-ja.html#deployment
「更新作業の自動化」の
/usr/local/bin/estcmd gather -cl -il ja -sd -cm /home/www/casket
/usr/local/bin/estcmd purge -cl /home/www/casket
これって、最後にインデックス対象のディレクトリ入れないとダメだよな。
findで一気に登録してる人ってまたfindしなおして更新してるの?
0377名無しさん@お腹いっぱい。
2005/10/03(月) 16:59:17本当だね。指摘しとこう。
>findで一気に登録してる人ってまたfindしなおして更新してるの?
漏れはディレクトリ毎に更新頻度が全然違うから、よく更新するとこだけ1日1回のcron
にして、他は手動でやってる。
0378名無しさん@お腹いっぱい。
2005/10/07(金) 03:38:160379名無しさん@お腹いっぱい。
2005/10/07(金) 09:38:03そこに何でも放り込んどきゃオッケーみたいな使い方は手軽で便利かもしれない。
んで、ノードAPI経由でローカルなデスクトップ検索なんかとP2Pでシームレスに検索
できますよ、ということじゃないのかな。
自信ないけどWinもWebDAVを共有ディスクとして見えたよねぇ?
0380名無しさん@お腹いっぱい。
2005/10/07(金) 09:51:11> 自信ないけどWinもWebDAVを共有ディスクとして見えたよねぇ?
うむ、マイ ネットワークから "ネットワークプレイスの追加" で。
んでも、WebDAV のファイルサーバー利用って、samba でやるより
運用が面倒なのよね。
(ファイル名文字コード云々の話とか)
ACL も掛けにくいし、パフォーマンスが悪い。
0381名無しさん@お腹いっぱい。
2005/10/11(火) 20:30:07もうすぐ1.0.0出そうだね。
0382名無しさん@お腹いっぱい。
2005/10/12(水) 09:21:10> Hyper Estraierによる共有プロクシ検索の公開実験中です。
>
> あなたのWebブラウザのプロクシに「athlon64.fsij.org」の「8080」番を設定してください。
> そうすると、一度見たページを検索できるようになります。
>
> 検索するには、「http://athlon64.fsij.org:1978/node/test/search_ui」にアクセスしてください。
0383およよ
2005/10/15(土) 14:58:48(detail画面ではなく検索結果画面で)そのリンクタグを表示することって
できないでしょうか?
つまりその文書にURIとは別に関連するURIを設定できるか?ってこと
なんすけど(^^; リンクタグ自体を属性としてつけたいわけではないの
ですが似たことを実現できると幅がひろがりそうなんですけど・・・
およよ
0384名無しさん@お腹いっぱい。
2005/10/15(土) 16:41:15その属性名を書いておけば表示されるよね。
リンクにしたいんだったら、estseek.tmplにJavaScript書いて、onloadで適当にHTML
をいじればできそう。
0385名無しさん@お腹いっぱい。
2005/10/17(月) 00:17:400386名無しさん@お腹いっぱい。
2005/10/17(月) 01:32:320387名無しさん@お腹いっぱい。
2005/10/17(月) 02:29:35もう移行して大丈夫なんだろうか。
indexが使えなくなるのはもうやーよ。
0388名無しさん@お腹いっぱい。
2005/10/17(月) 03:48:230389名無しさん@お腹いっぱい。
2005/10/17(月) 04:00:230390名無しさん@お腹いっぱい。
2005/10/17(月) 09:45:45http://slashdot.jp/developers/article.pl?sid=05/10/16/2244215
0391名無しさん@お腹いっぱい。
2005/10/17(月) 13:43:59開いてみたら相変わらず「まあ/.-Jだしな」な内容だったな。
0392名無しさん@お腹いっぱい。
2005/10/17(月) 15:50:230393名無しさん@お腹いっぱい。
2005/10/17(月) 16:04:180394名無しさん@お腹いっぱい。
2005/10/17(月) 22:41:150395名無しさん@お腹いっぱい。
2005/10/18(火) 00:19:120396名無しさん@お腹いっぱい。
2005/10/18(火) 00:24:130397名無しさん@お腹いっぱい。
2005/10/18(火) 01:52:070398名無しさん@お腹いっぱい。
2005/10/19(水) 00:57:460399およよ
2005/10/19(水) 11:23:39> 関連するURIは適当な属性として登録しておいて、estseek.confのextattrのところに
> その属性名を書いておけば表示されるよね。
> リンクにしたいんだったら、estseek.tmplにJavaScript書いて、onloadで適当にHTML
> をいじればできそう。
ありがとうございました。属性名の表示はできました。
だめもとでリンクを属性情報としてリンクタグを含んだ形で登録したのですがやっぱしだ
めでした。
> リンクにしたいんだったら、estseek.tmplにJavaScript書いて、onloadで適当にHTML
> をいじればできそう。
ってのがどうも (^^:;;
具体的にはどんなことをすればいんでしょうか?
なんかぜんぜん分かってなくてすいません。m(_ _)m
0400名無しさん@お腹いっぱい。
2005/10/19(水) 11:33:04どうしても動かない。linux上では動かせたのに〜orz
estseek.confが間違っていそうなんだが...
インデックスはD:\indexに作成。対象ファイルはD:\testとすると、
indexname: D:/index
lprefix: file:///D|/test
でアカンのか?
0401名無しさん@お腹いっぱい。
2005/10/19(水) 11:59:34そこらへんのカスタマイズって、
namazu よりもまだとっつきにくいと言うか難しいよね。
>>400
conf のなかみのミスだと、index not found だとかなんかなはず。
だから、たぶん dll がらみ。.
cgi と同じディレクトリに .dll を全部コピーしてみて。
0402名無しさん@お腹いっぱい。
2005/10/19(水) 12:40:09レスサンクス。
まさにおっしゃる通りでした。
dllを%systemroot%system32に移動したら、問題なく動きました。
hyperestraierのバイナリの置いてあるディレクトリにはパスは
ちゃんと通してあったんですが、それではダメなようですね。
(付属のドキュメントにも、.exeや.dllのディレクトリにパス通せと
書いてあるだけですし。)
0403名無しさん@お腹いっぱい。
2005/10/19(水) 12:49:07Apacheの実行ユーザとPathを設定したユーザが違うから、
パスが通ってなかったんじゃないの?
0404名無しさん@お腹いっぱい。
2005/10/19(水) 12:49:56<script type="text/javascript">function startup(){
var elem = document.getElementById('phrase');
if(elem){
elem.focus();
}
var elems = document.getElementsByTagName('span');
for(var i = 0; i < elems.length; i++){
var cname = elems[i].getAttribute('class');
if(!cname || cname != 'doc_val') continue;
var text = elems[i].firstChild.nodeValue;
if(text.indexOf('http://') != 0) continue;
elems[i].innerHTML = '<a href="' + text + '">' + text + '</a>';
}
}
</script>
0405名無しさん@お腹いっぱい。
2005/10/19(水) 12:51:07(その場合、属性値に「<a>」は不要)
0406およよ
2005/10/19(水) 13:35:55さっそくのレスありがとうございます。 estseek.tmplのほうでいんですよね(^^;
属性名「Link」で設定してインデックスを作り直してestseek.tmplに追加後検索結果ソースをみてみると
<dd class="doc_attr">Link: <span class="doc_val">http://www.hogehoge.jp/</span></dd>
という部分が出力されていました。ご掲載いただいたソースはclassが「doc_val」で「http://」で始まる部分
をみつけたらそのテキスト部分を書き換えるってことだと思うんですがどうもうまくいかないんです。
本当は
<dd class="doc_attr">Link: <span class="doc_val"><a href ="http://www.hogehoge.jp/">http://www.hogehoge.jp/</a></span></dd>
と出力されるということでよろしいでしょうか?
0407およよ
2005/10/19(水) 13:48:00すいません。追記ですが <script type="text/javascript">function startup(){ をいれる位置は
<script type="text/javascript">function startup(){
var elem = document.getElementById('phrase');
if(elem){
elem.focus();
}
var elems = document.getElementsByTagName('span');
for(var i = 0; i < elems.length; i++){
var cname = elems[i].getAttribute('class');
if(!cname || cname != 'doc_val') continue;
var text = elems[i].firstChild.nodeValue;
if(text.indexOf('http://') != 0) continue;
elems[i].innerHTML = '<a href="' + text + '">' + text + '</a>';
}
}
</script>
</head>
<body onload="startup();">
<!--ESTFORM-->
<!--ESTRESULT-->
</body>
</html>
です。
0408404
2005/10/19(水) 14:04:47><dd class="doc_attr">Link: <span class="doc_val"><a href ="http://www.hogehoge.jp/">http://www.hogehoge.jp/</a></span></dd>
>と出力されるということでよろしいでしょうか?
そのつもりだったのだけど、動かないですか。
Firefoxでしかテストしてないんで、もしかしたらIEだとうまくいかないのかな。
もうちょっと調べてみますね。
0409名無しさん@お腹いっぱい。
2005/10/19(水) 16:26:50> (qでヌケます)
ちょと ワロタ
0410名無しさん@お腹いっぱい。
2005/10/19(水) 17:17:270411およよ
2005/10/20(木) 09:25:31板違いスンマソン
こちらでも調べてみたんですが やはり火狐ではうまく表示されるんですがIEだとうまくいかないようです。
スクリプトタグをを入れる位置など調整してしてるんですが・・・(^^;
IEで読み込み時にでるスクリプトにエラーがある際の左下のエラーメッセージは表示されていないので
スクリプトの文法エラーは考えにくいですね。
0412名無しさん@お腹いっぱい。
2005/10/20(木) 10:36:54http://freemind.s57.xrea.com/desktophe/
0413名無しさん@お腹いっぱい。
2005/10/20(木) 11:21:04var cname = elems[i].getAttribute('class');
IE だとこれが null 。 elems[i].className を使用すれば解決
0414およよ
2005/10/20(木) 11:49:03ご指摘のとおりですた。 \^^/
うー jscript・javascriptの違いってことなのでしょうか
このへんもWEB共通仕様でなくていろんな開発者がないている部分なんでしょうね。
いろいろ 板の方々ありがとうございました。
0415名無しさん@お腹いっぱい。
2005/10/21(金) 00:28:53http://pgestraier.projects.postgresql.org/
0416名無しさん@お腹いっぱい。
2005/10/21(金) 00:30:46http://pgfoundry.org/projects/pgestraier/
0417名無しさん@お腹いっぱい。
2005/10/21(金) 01:57:00ただ Hyper Estraier と Rast の間には IPA の期間中にそれなりの結果を出し、
その後になるけど正式版もリリースできたという越えられない壁が。
0418名無しさん@お腹いっぱい。
2005/10/21(金) 08:18:480419名無しさん@お腹いっぱい。
2005/10/21(金) 15:09:06qdbmを再インストールしようとして失敗するのでqdbmを再インストールしてみても、
やっぱり再インストールしようとして失敗する。
0420名無しさん@お腹いっぱい。
2005/10/21(金) 15:52:210421名無しさん@お腹いっぱい。
2005/10/21(金) 16:32:080422名無しさん@お腹いっぱい。
2005/10/21(金) 19:09:00うちはおかしくないけど (FreeBSD 4.8) 。
0423名無しさん@お腹いっぱい。
2005/10/23(日) 13:13:44盛り上がってまいりました(・∀・)
0424名無しさん@お腹いっぱい。
2005/10/23(日) 15:40:07GDS も入れてみたけど、目的の文書が効率よく見つかったってことが、
全然無くて、結局消しちゃったよ。
0425名無しさん@お腹いっぱい。
2005/10/23(日) 18:33:420426名無しさん@お腹いっぱい。
2005/10/23(日) 20:34:13> デスクトップ検索ってホントに流行ってるの?
> GDS も入れてみたけど、目的の文書が効率よく見つかったってことが、
> 全然無くて、結局消しちゃったよ。
原因あっての結果、準備あっての成果なんだと思う。
デスクトップ検索が可能であることを前提に情報の配置、すなわち
ローカルマシンへの情報の蓄積を行なうようになってしばらく経った後、
その威力が次第に明らかになっていくのだと思う。
0427名無しさん@お腹いっぱい。
2005/10/24(月) 01:44:41P2Pのファイル共有ソフトに検索機能をつけるとかそのくらい?
まあGoogleのような大富豪な検索サービスにFLOSSの検索エンジンで対抗するなら
分散型にするしかないんだろうけど。
0428名無しさん@お腹いっぱい。
2005/10/24(月) 02:20:33対応している世界中のwikiを一発で検索できる、とか?
で、検索にはestmasterと通信できる好みのUIを使えばよろしい、と。
あとはwikiにつよいリンクの張り方しているノードとか、blogにつよいノードとか、
または公開されている文書なら何でもかんでもリンク張ってるノードとか
緩やかな文書内容によるクラスタを形成して、気分で変えれるようになるといいね。
どっちゃにしても、管理する文書が多くないと夢は広がらんが。
ここは一丁、アプリ書く?
0429名無しさん@お腹いっぱい。
2005/10/24(月) 02:35:020430名無しさん@お腹いっぱい。
2005/10/24(月) 03:00:49minixのコピーをしこしこ作っていたフィンランドのnerd大学院生にも言ってやればよかったのに。
きっと君の先見の明に感銘を受けたはずだ。
0431名無しさん@お腹いっぱい。
2005/10/24(月) 03:00:580432名無しさん@お腹いっぱい。
2005/10/24(月) 03:10:13共有できるようになるってことでんがな。
図書館の蔵書検索みたいなもんだべ。
0433名無しさん@お腹いっぱい。
2005/10/24(月) 03:19:33こんなとこ来たよ。
0434名無しさん@お腹いっぱい。
2005/10/24(月) 03:21:46反対。Yahoo!も活用すべき。
0435名無しさん@お腹いっぱい。
2005/10/24(月) 03:24:51賛成。平林さんも Google に任せておけばいいんだよ。
0436名無しさん@お腹いっぱい。
2005/10/24(月) 03:26:33ときどき接続の自宅マシンでできるの?
0437名無しさん@お腹いっぱい。
2005/10/24(月) 03:27:350438名無しさん@お腹いっぱい。
2005/10/24(月) 03:33:31それで出来なくはないけど、リンクは静的に設定するから常時立ち上げておかないと意味なさげ。
検索だけならべつにかまわないけど。
0439名無しさん@お腹いっぱい。
2005/10/24(月) 04:19:47スラドで騒ぐのはマカー。Googleマンセーよりさらに質の悪い連中。
0440名無しさん@お腹いっぱい。
2005/10/24(月) 08:29:16P2Pノードを自分で立てたら、既存の別のノードか中央のサーバに自分のアドレスとポートを
通知する仕組みが必要だろうね。estの作者がそこまで考えてるかどうかは知らないけど。
0441名無しさん@お腹いっぱい。
2005/10/24(月) 11:37:47いいかげんドキュメント嫁
ホスト同士の通信のしくみもつくらずP2Pなわけねーだろ>>440
0442名無しさん@お腹いっぱい。
2005/10/24(月) 14:24:02自分のノードにESTDOCをコピーするようにすればブックマークはいらんようになるかもしれんね。
そういう使い方ならかならずしも常時立ち上げる必要は無いし。
でも、いまでもGoogleがあるからブックマークは使わないという人もいるから、
それ以上のメリットがあるかどうかは不明。自分で順位を操作できたり、属性を加えられるのが
どれくらい嬉しいのかどうかわからん。
0443およよ
2005/10/25(火) 19:39:23estcmd gather -ft -px @uri -px @title -px point -px link casket c:\list.txt
みたいに設定した場合で 「@title」や別の属性名例えば「comment」などに日本語を設定して
estseek.cgiで検索すると文字化けしてしまうんですが、なんか指定が足りないのでしょうか?
この場合インデックスに追加しているファイル群の文字コードはばらばらなのですが
それが原因なのでしょうか?
0444名無しさん@お腹いっぱい。
2005/10/25(火) 19:45:55UTF-8 で保存し直してやってみたらどうでしょう。
0445sage
2005/10/25(火) 22:24:480446sage
2005/10/25(火) 22:25:280447およよ
2005/10/26(水) 11:56:25ご指摘のとおりですた。UTFにしたらいけますたー。 (^^;
list.txtのウィンドウズマシンのVBでプログラムをつくっていたので文字コードが原因ですた。
お騒がせしました。m(_ _
0448名無しさん@お腹いっぱい。
2005/10/26(水) 14:08:16ttp://japan.internet.com/webtech/20051026/6.html
0449名無しさん@お腹いっぱい。
2005/10/26(水) 17:41:34ファイル名も検索できるようにしたいと思うのですが、%ESTORIGFILE%環境変数を利用して、
filenamefilt.bat
echo off
echo %ESTORIGFILE%
として、
カレントディレクトリにあるmogeディレクトリに含まれる拡張子が.hogeの全てのファイル名を、
カレントディレクトリのcasketへ、次のコマンドでインデックスさせようとしているのですが
うまく行きません。
estcmd gather -cl -fx .hoge T@filenamefilt -fz -fo ^ -pc CP932 -sd -cm casket moge
インデックスはされているようなのですが、やはりファイル名では検索できません。
どのようにすればよいのでしょうか?
0450およよ
2005/10/26(水) 18:33:11すませんです。もひとつにたような話なのですが
estseek.confに今回属性として表示したかった「link」という項目名「extattr」を追加し、
下記のように記述したのですが、追加した属性自体は出力されているのですが、表示名
とした日本語がうまく表示されないのです。「リンク先がこちら」の部分は文字化けしてし
まいます。上の経緯もありましたので 小躍りしながら設定ファイルをUTF8で保存したの
ですが追加するとapacheから内部エラー500で呼び出せなくなってしまいました(^^;
設定部分
extattr: link|リンク先はこちら
属性名の表示名称に日本語は難しいのでしょうか?
extattr: link|LinkHere
などはちゃんと表示されているんですが・・・
0451名無しさん@お腹いっぱい。
2005/10/28(金) 15:11:280452名無しさん@お腹いっぱい。
2005/10/28(金) 15:49:19メジャーになればなるほど攻撃される可能性が増えてしまう。
0453名無しさん@お腹いっぱい。
2005/10/28(金) 16:05:030454名無しさん@お腹いっぱい。
2005/10/28(金) 16:12:510455名無しさん@お腹いっぱい。
2005/10/29(土) 01:06:49"(666) YaCy P2P Web-Search"というのが出ていた。で、思ったんだけど
P2Pの検索エンジンは結構需要あるんじゃまいか?
0456名無しさん@お腹いっぱい。
2005/10/29(土) 01:09:48P2P検索エンジンがビジネスサイドの方で話題になった頃に
どういう議論がなされて、どういう経過を辿って、そして
消え去ったのか調べてみると良いのではないかな?
0457名無しさん@お腹いっぱい。
2005/10/29(土) 01:27:45分散処理の形態としては、P2Pというより、バス型ネットワークのトポロジーで運用
するのが流行りそうな予感。
0458名無しさん@お腹いっぱい。
2005/10/30(日) 00:56:03誰かできた人いませんか?
ttp://fruit.dnsalias.org/hyperestraier/index.html
0459名無しさん@お腹いっぱい。
2005/10/31(月) 02:03:15Hyperがあるのと無いのってどう違うの?
P2P対応か否か?
0460名無しさん@お腹いっぱい。
2005/10/31(月) 02:22:27でもやっぱり最大の違いがノードAPIであるのは間違いない。
HTTP ベースで管理できるということは コアAPI または コアAPIを使った言語バインディング を使わなくても
簡単に全文検索機能を持ったアプリケーションを開発できるということで、これは素晴らしいと思う。
もともとは P2P のために作られたのかもしれないけど、P2P で利用しなくても全文検索サーバだけを別に立てて運用できるし
コンソール、GUI、Webアプリ等々、異なるフロントエンドから同じインデックスを利用できたりと、かなり面白い。
0461名無しさん@お腹いっぱい。
2005/10/31(月) 02:45:09分けたindexを取りまとめて扱うのにはestmasterを使わなきゃいけないのは
ちょっと残念。
サーバープロセスとしてはメモリ食いすぎてないか?> estmaster
0462名無しさん@お腹いっぱい。
2005/10/31(月) 03:27:170463名無しさん@お腹いっぱい。
2005/10/31(月) 16:41:19mikioタソの日記を見ると形態素解析の価値も認めているから、tokenizerはLucene同様
入れ替え可能になったりして。つか、N-gramはCJKではそこそこ使えるけど、タイ語とか
インド諸言語などの場合はどうなんだろ?
0464名無しさん@お腹いっぱい。
2005/10/31(月) 16:43:220465名無しさん@お腹いっぱい。
2005/10/31(月) 18:28:01Unicodeに文字が入ってるなら問題はないんじゃない?
NグラムのNをいくつにするかは言語ごとに最適値があると思うけど、
性能(速度とDBのサイズ)がちょっと違うだけで、精度はいずれにしても一緒。
0466名無しさん@お腹いっぱい。
2005/10/31(月) 18:38:49なると思うが……。
0467名無しさん@お腹いっぱい。
2005/10/31(月) 19:23:380468名無しさん@お腹いっぱい。
2005/10/31(月) 19:49:39N-gramの時点で再現率(= 実際に検索された文書数 / 論理的な適合文書数 )は100%だし、
Nを変えても精度(= 検索結果中の適合文書数 / 実際に検索された文書数 )は変わらんやろ。
0469463
2005/10/31(月) 21:44:390470名無しさん@お腹いっぱい。
2005/11/01(火) 00:55:06それが真なら欧米言語でstemmingやっても効果がゼロの筈だよな。
0471名無しさん@お腹いっぱい。
2005/11/01(火) 01:47:18N-gramでやる必要はあんまりない。語幹だけ入力すれば検索できるから。
0472名無しさん@お腹いっぱい。
2005/11/01(火) 02:15:130473名無しさん@お腹いっぱい。
2005/11/01(火) 02:30:080474名無しさん@お腹いっぱい。
2005/11/01(火) 21:08:070475名無しさん@お腹いっぱい。
2005/11/02(水) 09:11:56>>468 とか。
情報検索の適合文書というのはクエリの本来の目的に対して定められるので
n-gramの時点で再現率が100%とかいってる時点でおかしい。
世の中にはブーリアン検索しか検索モデルが存在しないとでも思っていないと
468が満たされるような適合文書の定義にはならない。
0476名無しさん@お腹いっぱい。
2005/11/02(水) 18:30:39ブーリアン検索が最もポピュラーなモデルであることは真だろ。
特に断りがなければブーリアン検索を前提として議論しているって事態
別におかしいことでも何でもない。
0477名無しさん@お腹いっぱい。
2005/11/02(水) 18:48:56たとえそうだとしても検索モデルと独立に意味を定義された指標の定義を
変えるのは全くおかしいと思うが。
0478名無しさん@お腹いっぱい。
2005/11/07(月) 10:46:430479名無しさん@お腹いっぱい。
2005/11/07(月) 10:58:110480名無しさん@お腹いっぱい。
2005/11/07(月) 13:33:510481名無しさん@お腹いっぱい。
2005/11/08(火) 14:18:35Javaで書かれてるなら、ちょっといじればUNIXでも動きそうだな。
ソース公開してくれればいいのに。
0482名無しさん@お腹いっぱい。
2005/11/10(木) 01:07:31ローカルの文書って似たのがたくさんヒットして結果が見づらかったけど、
これならきちんと整理して表示されるから非常に見やすい。
0483名無しさん@お腹いっぱい。
2005/11/12(土) 01:04:440484名無しさん@お腹いっぱい。
2005/11/12(土) 02:16:350485名無しさん@お腹いっぱい。
2005/11/12(土) 21:48:400486名無しさん@お腹いっぱい。
2005/11/13(日) 17:41:50詳しく
0487名無しさん@お腹いっぱい。
2005/11/14(月) 01:06:07優れたオープンソース開発者を表彰する「2005年度日本OSS貢献者賞」
http://internet.watch.impress.co.jp/cda/news/2005/08/23/8876.html
この記事が最初出たときには
> 全文検索エンジン「Namazu」などの開発者である高林悟氏(グーグル)
と他の3人もそうだけど所属先が出ていたんだわ。その後間もなく所属先が
文章から削られて、しばらく後に名前の誤字が訂正された。
ちなみに高林氏の友人でもあるPRIME作者の小松弘幸氏もGoogleで
インターンやっていたらしい。あとNAISTの先輩であるchalow作者の
山下達雄氏は現在Yahoo! Japanに在籍している。
0488名無しさん@お腹いっぱい。
2005/11/14(月) 01:24:38> ちなみに高林氏の友人でもあるPRIME作者の小松弘幸氏もGoogleで
> インターンやっていたらしい。
アメリカ留学時にインターンやって、帰国してGoogle入りしたんでしょ。
0489名無しさん@お腹いっぱい。
2005/11/18(金) 01:53:59正規表現サポートの模様
0490名無しさん@お腹いっぱい。
2005/11/18(金) 02:33:40今 ML で話題になってるけど(つかこんな時間に流れてくるとわ…)
またちょっと互換性問題があるみたいね。
0491名無しさん@お腹いっぱい。
2005/11/18(金) 02:55:40QDBM http://qdbm.sourceforge.net/
の中に入ってるコマンドのことかー
0492名無しさん@お腹いっぱい。
2005/11/21(月) 00:03:550493名無しさん@お腹いっぱい。
2005/11/21(月) 03:47:180494名無しさん@お腹いっぱい。
2005/11/25(金) 10:23:52本当に10倍速くなったらすごいな。
0495名無しさん@お腹いっぱい。
2005/11/29(火) 11:07:550496名無しさん@お腹いっぱい。
2005/11/29(火) 18:07:39まず、HyperEstraierのドキュメントを読み、書いてある手順にしたがってインストールする。
それから、ナマズが対象にしていたファイルのインデックスをHyperEstraierで作りなおす。
0497名無しさん@お腹いっぱい。
2005/11/30(水) 22:35:59replaceの正規表現による置換で,前方参照の書き方がわかりません.
replace: ^file:///home/hoge/diary/html/([0-9]{4})/([0-9]{\
4})\.html{{!}}http://hoge.example/diary/\1\2.html
のような置換が書きたいです.
どのように書けばよいでしょうか.
なにか良い方法がありましたら,よろしくお願いします.
0498名無しさん@お腹いっぱい。
2005/11/30(水) 23:22:44ほんとだ。出来ると思って試してみたら \1 とかだめだね。
mod_rewrite で誤魔化すしかなさそう。
replace: は(たぶん)上から評価されていくから、お馬鹿な方法なんだけれども
replace: ^file:///home/hoge/diary/html/{{!}}http://hoge.example/diary/
replace: 1999/{{!}}1999
replace: 2000/{{!}}2000
replace: 2001/{{!}}2001
…
って延々やっていくとか。
regex 使える前はこれしか実際出来なかったし。
0499名無しさん@お腹いっぱい。
2005/11/30(水) 23:50:02他に$1なども試しては見たのですが無理でした.
とりあえず,>>498さんの方法を使わせていただき,
前方参照の方法に対応したら,そちらを使うことにします.
ありがとうございました.
0500名無しさん@お腹いっぱい。
2005/12/01(木) 00:00:50find /home/hoge/diary/html -type -f -name '*.html' -print |
perl -e '
while(<>){
chomp($_);
printf("%s", $_);
$_ =~ s/([0-9]+)\/([0-9]+)\.html$/\1\2.html/;
print $_;
}' |
estcmd gather -il ja -fh -px @uri casket -
0501名無しさん@お腹いっぱい。
2005/12/01(木) 00:20:24ほぅ、@uri に格納すればできたのかー
知らなかった。
0502名無しさん@お腹いっぱい。
2005/12/01(木) 00:26:49ありがとうございます.
もとの属性を変えてしまう,という方法ですね.
勉強になります.
0503名無しさん@お腹いっぱい。
2005/12/01(木) 00:42:20着手した人はいますか?
0504名無しさん@お腹いっぱい。
2005/12/01(木) 06:18:35estcmdじか打ちのスクリプト組んでgnome-terminalみたいなURIをリンクとして
読んでくれるターミナル使ったほうがよさげだし
UNIX環境ならelispアプリにする必要性を感じなかったな
0505名無しさん@お腹いっぱい。
2005/12/01(木) 09:31:190506名無しさん@お腹いっぱい。
2005/12/01(木) 09:32:29Firefoxの検索機能も今はミニバッファになったでしょ。
思考停止時間を最小にするのが目的だと思われ。
結果表示画面もEmacsならではの操作性にできるなら最高だ。
Mewとかと連携することもできるかもね。
0507名無しさん@お腹いっぱい。
2005/12/01(木) 10:31:41ファイル全体を文書にするんでなくて、個々のエントリを文書として扱ってほしい。
セーブする時に古いファイルとdiffとればどこのエントリが更新されたかわかるはずだから、
更新されたエントリだけを登録するようにできそう。
0508754
2005/12/01(木) 10:37:52オレはこれで満足してるけど。
0509名無しさん@お腹いっぱい。
2005/12/01(木) 16:06:270510名無しさん@お腹いっぱい。
2005/12/01(木) 19:41:33「Emacsインターフェイスのアイデア」
http://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11333263561092714358
M-x est-search-migemoって、ものすごい数のOR検索をすることになるけど、
実用的速度で動くのかね。
一致文章絞り込み段階での論理演算の順番の変更による最適化なんかの問題も
あったね。
0511名無しさん@お腹いっぱい。
2005/12/11(日) 02:34:190512名無しさん@お腹いっぱい。
2005/12/11(日) 02:38:14インデックスの互換性がぬぁい orz
0513名無しさん@お腹いっぱい。
2005/12/11(日) 02:56:37WEBにはまとまった履歴があがってないし,
ChangeLogにはソースコードの変更が書かれているだけ.
普通の人が意味のわかるChangeLogならまだしも,
これは作った人以外には理解不能でしょう.
0514名無しさん@お腹いっぱい。
2005/12/11(日) 04:18:24そこがいつもネックなのだがねぇ。
ver1.1.1 の変更点みたいなものは作者ブログ?で・・・
ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11342311101232356139
0515名無しさん@お腹いっぱい。
2005/12/11(日) 04:24:12確かにね。でも例えば Apache と比較しても、
http://www.apache.org/dist/httpd/CHANGES_2.2
それはたいして変わらないんじゃない?
httpd.conf を 2.0.5x から書き換える必要があるとか、
増えたディレクティヴが分かるわけではない。
0516名無しさん@お腹いっぱい。
2005/12/11(日) 09:30:29Webから参照できるだけど大違いだし、ソースレベルではない変更が書かれているし、
アップグレードに関することは別の文書としてまとまっているし。
0517名無しさん@お腹いっぱい。
2005/12/11(日) 11:00:40何から何まで真似する必要はないけど。
0518名無しさん@お腹いっぱい。
2005/12/11(日) 11:44:31普通の人むけのChangeLogはあまり重要と考えていないんじゃないかな。
ああいうChangeLogはソースのdiffと一緒に読んでねっていうノリだからね。
なんつーかオープンソースならではってことでおおらかに構えるか、
またはMLで情報の集積場所が欲しいとか訴えてみれば? 手伝うっていえば喜ぶでしょ
しかしApache Projectと比べてサポートが劣っているていうはかわいそうだよ...
0519名無しさん@お腹いっぱい。
2005/12/11(日) 11:48:24機能説明をするものではない。必要十分な情報を簡潔に書くのがよいとされる。
エンドユーザにわかるようにだらだら書くのはむしろ間違いだろ。
0520名無しさん@お腹いっぱい。
2005/12/11(日) 12:25:43作者の意欲が減退したりポンと消失したりすることがあることである。
まわりの人がサポートするケースのように思える。
メーリングリストとやらのメンバーたちは何をやっているのか?
クレクレ君の集まりなのか?
0521名無しさん@お腹いっぱい。
2005/12/11(日) 12:28:48形式は問わず、もう少し上のレベルの更新履歴が欲しいと言ってるだけ
それがChangeLogの形式で提供されててもいいかね、という程度
ChangeLogにしろ、という話ではない
0522名無しさん@お腹いっぱい。
2005/12/11(日) 12:29:180523名無しさん@お腹いっぱい。
2005/12/11(日) 13:49:250524名無しさん@お腹いっぱい。
2005/12/11(日) 14:24:520525名無しさん@お腹いっぱい。
2005/12/11(日) 14:28:51はデータベースを更新するたびに呼んだほうがいいのかな?
0526名無しさん@お腹いっぱい。
2005/12/11(日) 14:47:282回目以降は更新のあったものだけが処理される風味.
0527名無しさん@お腹いっぱい。
2005/12/11(日) 14:50:26多分そう。
ほとんどの項目は passed になるからそんなに時間かからないっぽ。
0528527
2005/12/11(日) 14:51:070529名無しさん@お腹いっぱい。
2005/12/11(日) 17:24:05ブログにしか書いてなく、しかもそれがWebサイトからでは
容易には辿り着けないことを問題としてるんだろう。
情報があっても、そこへの誘導が皆無であれば無いのと同じこと。
0530名無しさん@お腹いっぱい。
2005/12/11(日) 17:56:02いってほしい気がするけど。
0531名無しさん@お腹いっぱい。
2005/12/11(日) 18:02:41なぜそこで履歴に力を入れることになってるのか疑問。
0532名無しさん@お腹いっぱい。
2005/12/11(日) 18:12:180533名無しさん@お腹いっぱい。
2005/12/11(日) 18:15:30対応するのが一般的な方法論だって。
0534名無しさん@お腹いっぱい。
2005/12/11(日) 19:10:04キタコレ
0535名無しさん@お腹いっぱい。
2005/12/11(日) 19:19:49なんでそうやって論点をズラそうとするんだか
0536名無しさん@お腹いっぱい。
2005/12/11(日) 19:20:24そういう奴がウザいと思ったらきっとだれかが更新履歴とか、ブログの記事をまとめ始めるでしょ。
自分でやるのが嫌でも、そのくらいならできるでしょ。
煽りのつもりじゃないぞ
0537名無しさん@お腹いっぱい。
2005/12/11(日) 19:54:23てか、なんでそこまで履歴を分かりやすくすることに否定的なのか意味が分からん。
0538名無しさん@お腹いっぱい。
2005/12/11(日) 19:59:320539名無しさん@お腹いっぱい。
2005/12/11(日) 20:48:270540名無しさん@お腹いっぱい。
2005/12/11(日) 21:43:11とりあえず更新のたびに関連するブログのエントリへのリンクのリストを並べるだけでいいじゃん。
おれも個人的にはなぜそこまでくわしい履歴が欲しいのかCとRuby経由からしか
使ってないからよくわからん。
だがアプリケーションとして普及させるならサポートは厚い方がいいに決まってるよね。
しかし、作者は全文検索アプリのためのAPIとして見てほしくて、インターフェイスは単なるデモ
みたいな発言をしていたよ。
それが不満なら...作者に直接声の届くmlか、直接メールするかして、
その上で作者が乗り気でないなら乗り換えるしかない気がするが。
ああ、いやもちろんプロジェクトをフォークする自由は常にある。LGPLだからね。
0541名無しさん@お腹いっぱい。
2005/12/11(日) 22:25:45どこがどう変わったのか知りたいと思うのは普通じゃないの?
その変更点がWebから簡単に参照できればよいね、ってだけの話でしょ。
0542GNU coding standardのChangeLogの説明
2005/12/11(日) 22:52:40変更についての説明が必要だと思うこともあるでしょう. その場合,おそらくその通りでしょう.
大いに説明を書いてください. ただし,その説明は,プログラム中にコメント文として書いてください.
そうすれば,プログラムを読む人は必ずそのコメント文を見ることになるからです. 例えば,関数を
一個追加したとき,変更履歴には "New function" と書けば充分です.その関数が何をする関数かの
説明はソースコード中で, その関数の定義の前にコメントとして書かれているはずだからです.
0543名無しさん@お腹いっぱい。
2005/12/11(日) 22:55:05ソースを読まずにChangeLogだけ読んで、「こんなんじゃ書いた本人しか分からん」
というのは筋違いだし、クレクレ君の典型だ。541の要求はもっともだが、そういう
書き出しから始まっているあたりが反感を買ったんだろう。
0544名無しさん@お腹いっぱい。
2005/12/11(日) 23:15:340545名無しさん@お腹いっぱい。
2005/12/11(日) 23:30:390546名無しさん@お腹いっぱい。
2005/12/11(日) 23:42:03ChangeLogと違ってユーザ向けのNEWSは更新を確実にするチャンスがないから。
粒度もChangeLogとは合致しないし、開発中はユーザにとっての変更が出る筈で
はなくても後からみてNEWSに書くべきことが発生していたというのもあり得る。
blogなら、ここに書いてなかったのに変わっとるのは怪しからん! という奴は
いないが、NEWSにしたら絶対そういう奴が出てくるだろうから、開発者が
無理なくそういう変更を拾って記述できるようなアイデアをセットで提案しないと。
0547名無しさん@お腹いっぱい。
2005/12/12(月) 00:34:02それを誰がやるのかっていうのはこれは大問題だよね。
マジで言い出しっぺがやってくださいよ。お願いしますよ。
たしかにその要求はもっともだからさ。
あと>>544 == >>541 だったならば、>>542は
論点へいたる前提を論じてるのだと思うよ。
0548名無しさん@お腹いっぱい。
2005/12/12(月) 01:51:500549名無しさん@お腹いっぱい。
2005/12/12(月) 03:54:390550名無しさん@お腹いっぱい。
2005/12/12(月) 04:29:19> メーリングリストとやらのメンバーたちは何をやっているのか?
> クレクレ君の集まりなのか?
> だからこういうパターンでは、周辺がサポートすることで
> 対応するのが一般的な方法論だって。
周辺とかまわりのひとってなんなのかね?
発言してる本人はどれにも該当しない第三者なの?
>>549
ML には
> なお、Windows版バイナリではMeCabのサポートはしていません。
となってる。
0551名無しさん@お腹いっぱい。
2005/12/12(月) 13:11:08> 周辺とかまわりのひとってなんなのかね?
> 発言してる本人はどれにも該当しない第三者なの?
そうだろうな。開発に参加していないくせに指示だけ出すやつだろ。
こういうやつは相手にしちゃいけない。コードを書かないやつは無視。
0552名無しさん@お腹いっぱい。
2005/12/12(月) 13:25:19「発言してる本人」が
「サポート」が必要だと感じてるとは限らんでしょ。
0553名無しさん@お腹いっぱい。
2005/12/12(月) 13:28:160554名無しさん@お腹いっぱい。
2005/12/12(月) 14:20:51そんなこと言ってたら、ユーザは何も要望を出せなくなるだろ。
OSSはユーザのフィードバックがあってナンボなんだから、そんな偏狭な
姿勢ではプロジェクトは盛り上がってこないでしょ。
いろんな提案が出されることは歓迎すべきで、それを採用するかどうかは開発者の自由。
0555名無しさん@お腹いっぱい。
2005/12/12(月) 15:54:28要望ならいいんじゃね?
0556名無しさん@お腹いっぱい。
2005/12/12(月) 16:06:16> OSSはユーザのフィードバックがあってナンボなんだから、そんな偏狭な
そんな事はない。ユーザなど何の役にもたたないことがほとんど。
> 姿勢ではプロジェクトは盛り上がってこないでしょ。
ユーザゼロでも盛り上がる。
> いろんな提案が出されることは歓迎すべきで、それを採用するかどうかは開発者の自由。
いろんな提案が出されることを歓迎するかどうかは開発者の自由。
0557名無しさん@お腹いっぱい。
2005/12/12(月) 16:19:37キミがOSSの開発者だったとしたら、普通の人の反応としては、
その製品は使いたくないし、開発に貢献したいとも思わないってなるんじゃないかな。
ユーザがいなくていいならそもそも公開なんてしないっしょ。
0558名無しさん@お腹いっぱい。
2005/12/12(月) 16:25:36お前のような傲慢なやつは、ユーザにそっぽ向かれて消えるだけ。
オープンソースはユーザに使っていただいているものなのだから、
ユーザに対する謙虚な姿勢を忘れたら存在する意味は無い。
消えな。
0559名無しさん@お腹いっぱい。
2005/12/12(月) 16:32:15ユーザゼロで盛り上がった例を知りたい.
もちろん,ゼロっていうんだから,
コード書いてる人も使ってない状況でね.
0560名無しさん@お腹いっぱい。
2005/12/12(月) 16:41:42さあ、fj臭が漂ってまいりました!
0561名無しさん@お腹いっぱい。
2005/12/12(月) 16:45:05オープンソースとして盛り上がってるとは言わないだろ.
0562名無しさん@お腹いっぱい。
2005/12/12(月) 16:46:580563名無しさん@お腹いっぱい。
2005/12/12(月) 18:15:10これだからUNIX板の住人は…('A`)
0564名無しさん@お腹いっぱい。
2005/12/12(月) 21:48:40おなぬーですな。
0565名無しさん@お腹いっぱい。
2005/12/12(月) 23:03:400566名無しさん@お腹いっぱい。
2005/12/13(火) 19:08:290567名無しさん@お腹いっぱい。
2005/12/14(水) 19:03:580568名無しさん@お腹いっぱい。
2005/12/14(水) 19:37:150569名無しさん@お腹いっぱい。
2005/12/14(水) 22:55:400570名無しさん@お腹いっぱい。
2005/12/15(木) 12:49:51Luceneって、キーワードハイライト機能ありますか?
0571名無しさん@お腹いっぱい。
2005/12/15(木) 13:08:55表示部分は自分で作る必要がある。したがって、ハイライト機能も自分で作れば
どうとでもなる。
0572名無しさん@お腹いっぱい。
2005/12/15(木) 13:21:460573名無しさん@お腹いっぱい。
2005/12/15(木) 13:26:510574名無しさん@お腹いっぱい。
2005/12/15(木) 18:17:410575名無しさん@お腹いっぱい。
2005/12/16(金) 14:41:26入れればウマーくなるけど、入れなくても差し支えないよね、っていうことでつか
0576名無しさん@お腹いっぱい。
2005/12/16(金) 17:11:17あ、そうきたか。じゃあ麻婆豆腐で言えば豆腐ということで。
0577名無しさん@お腹いっぱい。
2005/12/16(金) 17:26:560578名無しさん@お腹いっぱい。
2005/12/16(金) 17:30:52水切りをサボった麻婆豆腐みたいなもんか。
0579名無しさん@お腹いっぱい。
2005/12/16(金) 17:37:070580名無しさん@お腹いっぱい。
2005/12/18(日) 23:59:45エスカレイヤーかよ!
0581名無しさん@お腹いっぱい。
2005/12/19(月) 00:38:080582名無しさん@お腹いっぱい。
2005/12/19(月) 23:57:09滝田 裕、多田好克(電通大)
これってどんなのなんだろう?
0583名無しさん@お腹いっぱい。
2005/12/20(火) 00:09:45たとえば、「/search/検索語」というディレクトリの中を見ると、その検索語を含む
ファイルがずらっと出てくる。
とかなんじゃないかな?
なにそれ、Estraierが使われてるの?
0584名無しさん@お腹いっぱい。
2005/12/20(火) 09:34:29ファイルサーバーのってことで Google アプライアンスとかが紹介されてたな。
Namazu とか Estraier は全くふれられていなかったが。
ファイルサーバーの管理やったこと在るんだけど、
導入に見合った結果が得られるとは言い難いんだよな。
0585名無しさん@お腹いっぱい。
2005/12/21(水) 19:44:28>ファイルサーバーの管理やったこと在るんだけど、
>導入に見合った結果が得られるとは言い難いんだよな。
ユーザー(社員、学生?)が全文検索の意義を理解してくれないと言う事ですか?
たんに、UIが悪くて使ってもらえないくらいの意味ですか?
ぜひ詳しく聞きたいっす。
0586名無しさん@お腹いっぱい。
2005/12/22(木) 09:12:13一般ユーザは、GoogleよりYahooの方が好きだし。
何であんなごちゃごちゃしている上に検索結果もいまいちな
インターフェイスが好きなのだ?
0587名無しさん@お腹いっぱい。
2005/12/22(木) 15:35:21このあたりに鈍感だからだろう。
0588名無しさん@お腹いっぱい。
2005/12/22(木) 16:39:31infoseekやgooはキチガイみたいに検索結果と関係ない情報がひっついてる。
0589名無しさん@お腹いっぱい。
2005/12/26(月) 11:38:030590名無しさん@お腹いっぱい。
2005/12/26(月) 22:34:58そうねYahooはよくなってると思う
googleは一時よりかなり劣化してる感が否めない
0591名無しさん@お腹いっぱい。
2005/12/28(水) 00:41:19死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ
死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ
死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ死んだ
先日会社の上司の娘が病気で死んだ、心底どうでもいい事だったが心優しい俺は葬式に出てやった。
すると会社じゃ威張り散らしてる奴が娘(だった物)にすがりついてビービー泣いてるんですよwwwwwww
必死に笑いを堪えつつ仕込んでいたネタを使う。
俺「これ・・娘さんがディズニーのキャラクター好きだって言ってましたよね。」
ミッキーのぬいぐるみセットをスッと差し出す。
俺「もたせてあげてください・・きっと喜んでもらえると思うんです・・」
上「う、う・・・す、すまない・・・ありがとう・・・・」
プププギャギャーm9^ ^
そんなこんなでご冥福をわざわざお祈りしてやったわけだが、今度会社に来たこいつにどんな言葉をかけてやったらいいと思う?
なるべく俺の利益になるよう事を運びたいんだが
コイツリアル基地外だお!(;^ω^)
おまいらの力で懲らしめてほしいお!
嫌いな上司の娘が死んだ
http://news18.2ch.net/test/read.cgi/news7/1135513179/
0592名無しさん@お腹いっぱい。
2005/12/29(木) 03:25:580593名無しさん@お腹いっぱい。
2006/01/08(日) 06:26:040594名無しさん@お腹いっぱい。
2006/02/23(木) 17:03:090595名無しさん@お腹いっぱい。
2006/02/24(金) 02:10:46なにがなんだかわからない件
0596名無しさん@お腹いっぱい。
2006/02/24(金) 09:16:160597名無しさん@お腹いっぱい。
2006/02/25(土) 08:10:240598名無しさん@お腹いっぱい。
2006/02/25(土) 10:34:470599名無しさん@お腹いっぱい。
2006/02/25(土) 12:01:35ソース見るとわかるけどアレ結構お遊び仕組まれてるぞ
0600名無しさん@お腹いっぱい。
2006/02/25(土) 16:13:55「牌破衛須都隸亜」らしい。
0601名無しさん@お腹いっぱい。
2006/02/25(土) 21:33:490602名無しさん@お腹いっぱい。
2006/03/09(木) 18:14:10また開発速度上げてきたね。
0603名無しさん@お腹いっぱい。
2006/03/11(土) 20:29:480604名無しさん@お腹いっぱい。
2006/03/11(土) 22:03:301. ふつうにDBへアクセスするだけならサーバは要らない。
2. ふつうのP2P機能なら別途専用のサーバを立てて運用する。httpだが80番は使わない。
3. apache 用の mod_estraier も開発されているので、それを使えばやっぱり apache でOK。
0605名無しさん@お腹いっぱい。
2006/03/11(土) 22:33:11とか、そういうの?
$ estcmd search -vh DB searchstring
みたいな。
0607名無しさん@お腹いっぱい。
2006/03/16(木) 05:51:080608名無しさん@お腹いっぱい。
2006/03/16(木) 08:54:160609名無しさん@お腹いっぱい。
2006/03/21(火) 13:08:160610名無しさん@お腹いっぱい。
2006/03/21(火) 14:49:270611名無しさん@お腹いっぱい。
2006/03/21(火) 18:22:480612名無しさん@お腹いっぱい。
2006/03/21(火) 19:42:18> howmのメモ検索で、hyperestraier使えるようなplug-inが出来るといいなぁ。
毎晩寝る前にお祈りすると妖精さんが作ってくれるかもしれないよっ
0613名無しさん@お腹いっぱい。
2006/03/22(水) 16:50:31http://www7a.biglobe.ne.jp/~hat/xyzzy/kamail3/readme.html
0614名無しさん@お腹いっぱい。
2006/03/25(土) 00:02:46howmにも是非!!
0615名無しさん@お腹いっぱい。
2006/03/26(日) 01:51:34仕事PCに入れてみましたが、シンプルで使いやすいです。
0616名無しさん@お腹いっぱい。
2006/03/26(日) 10:16:18howmってそもそも検索べースじゃないの?
まずはどうしたいのかはっきりさせるべし。
0617名無しさん@お腹いっぱい。
2006/03/26(日) 10:23:18ぜんぜんうまくいかない。どうだめなのでも説明できません。
だれかつくってください。
0618名無しさん@お腹いっぱい。
2006/03/26(日) 10:55:01プログラムを作る力がないとあちこちで言って回らざるを得ません。
そのことも御承知おきください。
0619名無しさん@お腹いっぱい。
2006/03/26(日) 13:25:160620名無しさん@お腹いっぱい。
2006/03/26(日) 14:22:48その検索をこのHyperEstraierで高速化できないかと。
今の手段はGNU grepか、lisp製のfake-grepのみなんです。
0621名無しさん@お腹いっぱい。
2006/03/26(日) 14:30:150622名無しさん@お腹いっぱい。
2006/03/26(日) 14:57:27フリーライダーとはまた別だろ。
0623名無しさん@お腹いっぱい。
2006/03/26(日) 18:09:48namazuだと表とかが使えなくて困ってたんですが、
これなら使えたりしますか?
0624名無しさん@お腹いっぱい。
2006/03/26(日) 20:42:10そんなもん漢字コードの問題でnamazuかどうかは
無関係
0625名無しさん@お腹いっぱい。
2006/03/26(日) 22:13:490626名無しさん@お腹いっぱい。
2006/03/26(日) 23:11:160x5cを含んでいる「ソ」や「表」などがあるとうまく扱えない。
ということで、文字コードの問題でもあり、そういった既知の問題への対処を
怠っているアプリケーションの問題であるとも言える。
ちなみにhyper estraier(estcmd)では「-pc cp932」オプションをつければ
うまくいくみたい。
0627名無しさん@お腹いっぱい。
2006/03/26(日) 23:16:04もう半分はプログラマの能力の問題。
0629名無しさん@お腹いっぱい。
2006/03/27(月) 20:09:13んだが、無いねぇ。
0630名無しさん@お腹いっぱい。
2006/03/27(月) 20:19:270631名無しさん@お腹いっぱい。
2006/03/27(月) 20:31:28どうした。タイーホされたのか?
0632名無しさん@お腹いっぱい。
2006/03/29(水) 23:07:12たまに最新版の記事に更新してくれると嬉しいのだが
0633名無しさん@お腹いっぱい。
2006/03/29(水) 23:35:230634名無しさん@お腹いっぱい。
2006/03/30(木) 14:41:48bigramを使っていますが
howm用に自動キーワード抽出をしたいのです。
0635名無しさん@お腹いっぱい。
2006/03/30(木) 21:18:150636名無しさん@お腹いっぱい。
2006/03/30(木) 21:22:19Wikipediaは一括DLできるんだからローカルでやったら
0637名無しさん@お腹いっぱい。
2006/03/31(金) 01:05:090638名無しさん@お腹いっぱい。
2006/03/31(金) 01:10:05ことを考えよう。
(考え中……)
0639名無しさん@お腹いっぱい。
2006/03/31(金) 10:10:37むしろそういう性能目的の分散処理が一般的な利用形態なんじゃね?
0640名無しさん@お腹いっぱい。
2006/03/32(土) 12:33:21こういうの?
Ajax による Wikipedia インクリメンタルサーチ:
http://tokuhirom.dnsalias.org/~tokuhirom/wpsearch/
0641名無しさん@お腹いっぱい。
2006/03/32(土) 12:45:12そう言うのでなく、まともに動いてもっと高速なの。
0642名無しさん@お腹いっぱい。
2006/03/32(土) 23:24:00そもそもローカルで動かさないと、実用的な速度のインクリメンタル検索は難しいだろ。
0643名無しさん@お腹いっぱい。
2006/03/32(土) 23:28:21もっと高速とは?
速度に特に問題はないと思うけど。
0644名無しさん@お腹いっぱい。
2006/03/32(土) 23:42:25> そもそもローカルで動かさないと、実用的な速度のインクリメンタル検索は難しいだろ。
うん。だからそういうのも含めて、
- 自動即時更新
- インクリメンタル検索
- 全文検索
- 検索語一覧
- バージョン追跡機能
まで装備したWikipediaフロントエンド。
メタデータなどを配るP2Pな分配システムに、
ローカルにギガバイト級のキャッシュを使って
快適に。
0645名無しさん@お腹いっぱい。
2006/04/02(日) 00:30:530646名無しさん@お腹いっぱい。
2006/04/02(日) 00:43:12インクリメンタル検索を切り捨てさえすれば、ローカルでなくても実現できるというか、
クラサバ型の方が実現性が高そうな要求項目だね。
わざわざ巨大なデータをP2Pで配布してまでインクリメンタル検索なんてしたくないかもー。
0647名無しさん@お腹いっぱい。
2006/04/02(日) 16:23:28>>644にそんなものを作るスキルがあるとは思えない。
うろ覚えの単語を組み合わせて文章を作ってるだけのような気がすうr。
0648名無しさん@お腹いっぱい。
2006/04/02(日) 16:44:06ればいいんだから大した規模じゃない。いいとこ数十MBだろ。
>>640をもっとまともに実装すればAjaxでやったって快適だし、
ちょろっと自前で実装しても簡単(ついでにいうとこの場合プレフィ
クスの差分だけ保管するようなデータ構造にしとけばかなり節約で
きる)。
つーかIMEの辞書に[見出し語 => URL]を入れといたって済む。
そんなんのためにP2Pとか言いだすと訳わからんことになるぞ。
0649名無しさん@お腹いっぱい。
2006/04/02(日) 17:45:10> wikipediaのインクリメンタル検索つったって見出し語にだけ使え
> ればいいんだから
そうなの? どうしてそう思うの?
0650名無しさん@お腹いっぱい。
2006/04/02(日) 18:07:16じゃお前は何を対象にしたインクリメンタル検索しようとしてるんだ?
0651名無しさん@お腹いっぱい。
2006/04/02(日) 21:20:450652名無しさん@お腹いっぱい。
2006/04/02(日) 21:30:41Googleサジェストみたいな感じにしたいってことでしょ。
それだけのためにわざわざフロントエンドが欲しいとは全く思わないけど。
0653名無しさん@お腹いっぱい。
2006/04/02(日) 21:46:06> (´-`).。oO(見出しをインクリメンタル検索して何が嬉しいんだろう。。。
見出しには本文がついているんだよ。
0654名無しさん@お腹いっぱい。
2006/04/02(日) 21:47:23思わないよね。見出しだけなら前方一致で十二分。
0655名無しさん@お腹いっぱい。
2006/04/02(日) 21:48:27そんなもの欲しがる奴はキチガイだよな。
0656名無しさん@お腹いっぱい。
2006/04/02(日) 21:52:51こーゆーののwikipedia版が欲しいとかそういう話とばかり思ってた
0657名無しさん@お腹いっぱい。
2006/04/02(日) 21:59:36rdicみたいなのじゃないの?
0658名無しさん@お腹いっぱい。
2006/04/03(月) 03:56:46estmasterで他ホストと共有可能なかたちで公開してる人っている?
LAN内ではなく、グローバルかつリンク自由なかたちで。
いたらどんな感じか教えて欲しいんだが
(リンクしてくる他ホストはいるか、回線やサーバー機への負担は体感でどんなかんじか、など)
P2Pでそこらじゅうのインデックスが共有されるようになれば、
つーのが当初の企てっぽいのに、そういうことしてるところが見当たらないんで
ためしにやってみようかと思うんだけど
0659名無しさん@お腹いっぱい。
2006/04/03(月) 10:03:48デモサイトで動いてるみたいよ
http://athlon64.fsij.org:1978/
0660名無しさん@お腹いっぱい。
2006/04/05(水) 03:05:11estmasterやApacheを止めてestcmd optimizeとかすると
database problem起こす。
estmasterやApache起動したままやると何もする形跡もないままプロンプトが戻らなくなるし。
サーバー機のスペック不足か俺の設定違いか。同じ目に会ってる人おらん?
0661名無しさん@お腹いっぱい。
2006/04/05(水) 10:47:12あと、estmasterを起動したままoptimizeできないのは、estmasterがDBをロックしている
からだと思われ。
0662名無しさん@お腹いっぱい。
2006/04/10(月) 11:12:51それにしても、KamailV3は萌えるね
0663名無しさん@お腹いっぱい。
2006/04/15(土) 15:50:49試してみるとオニのように遅いな。
estcallやプロトコル使うより遅い。
つまりノードAPIを使う場合はサーバで動いてる
estmasterのサーチャを呼ぶんでなくて
リモートのインデックスにこっちから検索をかけるだけってことなん?
0664名無しさん@お腹いっぱい。
2006/04/22(土) 00:10:27estmaster内蔵の検索UIは /node/hogehoge/search_ui
estcallを使った場合は /node/hogehoge/search に接続しているから、
たぶん処理が違っているんじゃないかな。
0665名無しさん@お腹いっぱい。
2006/04/22(土) 01:01:29一体化してくれないかな。
0666名無しさん@お腹いっぱい。
2006/04/24(月) 04:39:56この外部データベースって、estcmd extkeysしたあとは捨てて
いいのかな?
保存しておくと、なんかいいことある?
0667名無しさん@お腹いっぱい。
2006/04/24(月) 13:11:460668名無しさん@お腹いっぱい。
2006/04/24(月) 15:24:49文書が更新されたのにDFを更新しないのは
おかしくない?
0669名無しさん@お腹いっぱい。
2006/04/24(月) 16:21:17DFのデータベースも更新した方がいいと思うけど、それほど精度は変わらないっぽいね。
でも、そういった意味では、もっと大規模なコーパスでDFのデータベースを作っておいて
それを使い回した方がいい希ガス。
0670名無しさん@お腹いっぱい。
2006/04/27(木) 01:07:37CPU使用率が30%どまり(DFは外部データベース)。
効率悪いな。
gathererの速度もLuceneのIndexWriterの半分以下。
巨大データを扱うときは、メモリ・IO・同期がキモになると
思うんだが、そういうのをCで書くこと自体が辛いんじゃ
ないか。
アセンブラやらPOSIXやらに依存しまれば、Javaと互角
まではいけるかもしれない。
でも、移植性のある方法で書いたら、どう考えてもJavaのほうが
速くなるはず。
0671名無しさん@お腹いっぱい。
2006/04/27(木) 15:44:330672名無しさん@お腹いっぱい。
2006/04/27(木) 18:17:53estのgatherの速度はluceneよりは遥かに速いと思うけど、
どういう設定してる?
0673名無しさん@お腹いっぱい。
2006/04/27(木) 22:19:50LuceneのIndexWriterはsetMaxBufferedDocs(1000)にsetMergeFactor(100)
Hyper EstraierのgathererはDatabaseをDatabase.DBCREAT | Database.DBHUGE
もしかしてset_cache_sizeすればDisk IO待ちが減って速くなるの?
gathererが多少速くなってもestcmd extkeysの遅さはどうしようもないわけだが。
0674名無しさん@お腹いっぱい。
2006/04/27(木) 23:53:56set_cache_sizeするとすごく速くなるよ。というよりしないと遅い。
extkeysは-umすると多少速くなる。
0675名無しさん@お腹いっぱい。
2006/04/30(日) 00:25:37set_cache_sizeってどう設定するんですか?
0676名無しさん@お腹いっぱい。
2006/04/30(日) 02:16:59db.set_cache_size(1024*1024*256, -1, -1, -1);
0677名無しさん@お腹いっぱい。
2006/05/01(月) 05:27:51ところで -um だけど MeCab を --enable-utf8-only オプション付きでコンパイルして
デフォルトの辞書も UTF-8 で構築、かつ Hyper Estraier のソースの mymorph.c を
EUC-JP <-> UTF-8 の変換をしないように変更するとさらに速くなるよ。
--enable-utf8-only オプション付けないと和文が2バイトから3バイトになって
解析対象のデータが多くなる分だけ UTF-8 の辞書を使った方が形態素解析が遅くなるし、
付けたら付けたで UTF-8 の文字単位で解析するようになるから MeCab で
他の文字コードが使えなくなるんで、結局デフォルトのままが無難なわけですが。
0678名無しさん@お腹いっぱい。
2006/05/06(土) 19:30:12PATH=$PATH:/usr/local/share/hyperestraier/filter ;export PATH find /usr/share/man -type f |
egrep '.*/man[0-9]/.*\[0-3](.gz)*$' |
estcmd gather -cl -fx ".1,.2,.3,.1.gz,.2.gz,.3.gz" "T@estfxmantotxt" -fz -sd -cm casket
としたところ
Bad : modifier in $ (/).
と言ってます。
構文とかぜんぜんわからないバカ者なのですがどうすれば良いでしょうか
教えてくださいませ。
OS=FreeBSD-5.4R
hyperest-v1.1.6です
よろしくおねがいします
0679名無しさん@お腹いっぱい。
2006/05/06(土) 23:57:550680名無しさん@お腹いっぱい。
2006/05/07(日) 11:21:06同じでした。
なんだろう?フィルターの当て方に癖があるのかな
0681名無しさん@お腹いっぱい。
2006/05/07(日) 11:51:12PATH=...; export ...
という表現の意味はわかってるか?
まずは環境変数にそのパスを加えてふつうに実行してみろ。問題を切り分けるのはそれから。
0682名無しさん@お腹いっぱい。
2006/05/07(日) 12:55:17>PATH=...; export ...
>という表現の意味はわかってるか?
ありがとうございます。
意味が理解できました。
0683678
2006/05/08(月) 02:12:21〜:/usr/local/share/hyperestraier/filter
と表示されます。
find /usr/share/man -type f |
egrep '.*/man[0-9]/.*\[0-3](.gz)*$' |
estcmd gather -cl -fx ".1,.2,.3,.1.gz,.2.gz,.3.gz" "T@estfxmantotxt" -fz -sd -cm casket -
実行後は
estcmd:INFO:〜(XXX):redistered
ulimit: too many arguments
・・・
estcmd: INFO closing: name=casket dnum=1176 wnum=0 fsiz=7252037 crnum=0 csiz=0
dknum=0
フィルタを読み込めてないって事ですよね?どのようにすれば良いでしょうか?
パスの通し方がまずいのかな?
0684名無しさん@お腹いっぱい。
2006/05/08(月) 03:20:28manかcolかtrのどれかがパスに含まれてないことない?
0685名無しさん@お腹いっぱい。
2006/05/08(月) 16:01:35/sbin /bin /use/sbin /usr/bin /usr/games /usr/local/sbin
/usr/local/bin /usr/X11R6 /usr/local/share/hyperstraier/filter
以上が内容です。
# find /usr/share/share/man | grep -e '.*/man[0-9]' |
estcmd gather -no ft -fx"T@estfxmantotxt" -fz -sd -cm casket -
こんなのをやってみました
ulimit: too many arguments
は出力されなかったのですが、
estcmd : INFO: closing: name=casket dnum=0 wnum=0 fsiz=6898748 crnum=0
csiz=0 dknum=0
こんな表示です
0686名無しさん@お腹いっぱい。
2006/05/08(月) 16:32:27ってやって、manが使える?
which man
which col
which tr
ってやるとどうなる?
0687名無しさん@お腹いっぱい。
2006/05/08(月) 17:16:12>man man
NO manual entry for man
>which man
/usr/bin/man
>which col
/usr/bin/col
>which tr
/usr/bin/tr
以上が結果です。
パス指定で/usr/binをはずして findコマンドを/usr/bin/findにすればいいのかな?
0688名無しさん@お腹いっぱい。
2006/05/08(月) 18:37:18を実行するとどんなエラーが出る?
(/usr/share/man/man1/ls.1.gzは適当なmanのファイルのパスに読みかえて)
0689名無しさん@お腹いっぱい。
2006/05/08(月) 19:30:35なってるの?
あと、 685 で /usr/share/share/man て書いてあるけど /usr/share/man の
誤記だよね?
0690名無しさん@お腹いっぱい。
2006/05/08(月) 21:39:19# /usr/local/share/filter/estfxmantotxt /usr/share/man/ja/man1/ls.1.gz
/usr/local/share/filter/estfxmantotxt: Command not found.
# /usr/local/share/hyperestraier/filter/estfxmantotxt /usr/share/man/ja/man1/ks.1.gz
/usr/local/share/hyperestraier/estfxmantotxt ulimit: too many arguments
となります
>>689
>/usr/share/share/man て書いてあるけど /usr/share/man の〜
誤記です
# manpath
/usr/share/man:/usr/local/man:/usr/X11R6/man:/usr/share/openssl/man:
/usr/local/lib/perl5/5.8.8/man:/usr/local/lib/perl5/5.8.8/perl/man
以上です
0691名無しさん@お腹いっぱい。
2006/05/08(月) 22:00:14ulimitの行を消せばいいんでない?
0692名無しさん@お腹いっぱい。
2006/05/08(月) 22:56:10>/usr/local/share/hyperestraier/filter/estfxmantotxtをエディタで開いて、
>ulimitの行を消せばいいんでない?
メッセージは表示されませんでしたが、結果はかわりません
0693名無しさん@お腹いっぱい。
2006/05/09(火) 00:34:12はどうでしょ。
0694名無しさん@お腹いっぱい。
2006/05/09(火) 01:05:50No manual entry for /usr/share/man/ja/man1/ls.1.gz
以上です。
ちなみに/usr/share/man/ja/man1/ls.1.gzは存在してます
0695名無しさん@お腹いっぱい。
2006/05/09(火) 11:35:46まず、 estfxmantotxt は内部で man を呼んでるから、まず
man ls
とかして見えることを確認する。
しかし、 manpath はおかしくないように見えるけれど、なんで man man が出
来なかったんだろ。
それから、 grep するだけじゃなくて、
〜 | xargs basename | perl -pe 's/(.*)\.(\d)(.gz)?/\2 \1/' | 〜
みたいな変換を噛まして /usr/share/man/man1/ls.1.gz から 1 ls を作りだす。
もしくは estfxmantotxt に「フルパスっぽかったら man コマンドではなく
nroff -man を使う」的なスクリプトを書くか。
0696名無しさん@お腹いっぱい。
2006/05/09(火) 12:05:39フィルタの中のmanの行を
nroff -man /usr/local/man/man1/cbcodec.1 | col -b | tr '\t' ' ' | output
に変えるってのはどうでしょ。
nroffは入ってるよね? which nroff
0697名無しさん@お腹いっぱい。
2006/05/09(火) 14:54:18>来なかったんだろ。
なんでなんでしょうねぇ〜?
OSのインストールで必要最小限のファイルしか選定してないからかもしれません。
只今、別PC(man manが引けるPC)をアップデート&hyperestraierインストールしてます。
0698名無しさん@お腹いっぱい。
2006/05/10(水) 11:19:54make checkでエラーが出るんだが。
./estcmd: INFO: 7 (/opt/inst/hyperestraier-1.2.4/doc/index.html): registered
./estcmd: ERROR: exhausting memory
./estcmd: ERROR: /opt/inst/hyperestraier-1.2.4/doc/index.html: no such item
./estcmd: INFO: flushing index words: name=casket dnum=5 wnum=1604 fsiz=27316309 crnum=226 csiz=12856 dknum=0
./estcmd: INFO: closing: name=casket dnum=5 wnum=1733 fsiz=27319842 crnum=0 csiz=0 dknum=0
make: *** [check] Error 1
0699名無しさん@お腹いっぱい。
2006/05/10(水) 14:28:17一応動いてますが
0700678
2006/05/10(水) 16:49:26引けるようになりました。
#whice nroff
/usr/bin/nroff
estfxmantotxt
60行目
nroff -man /usr/local/man/man1/cbcodec.1 | col -b | tr '\t' ' ' | output
#find /usr/share/man -type f |egrep !.*/man[0-3]' |
estcmd gather -no cl -fx ".gz" "T@estfxmantotxt" -fz -sd -cm casket -
〜〜
troff: fatal error: can't '/usr/local/man/man1/cdcodec.1':no such file or
directory
estcmd: INFO closing: mame=casket dnum=0 wnum=0 fsiz=68698748 crnum=0
csiz=0 dknum=0
以上です。
マシンに言語(eucJP)を設定していないのですが、関係ありますでしょうか?
PS昨日アップデート中、HDDが逝ってしまいました><
0701名無しさん@お腹いっぱい。
2006/05/10(水) 17:40:45在するの? っていうかそのパスなら中身は英語だと思うし、であれば言語は
関係ない。
cdcodec.1 が何かのシンボリックリンクになっていて、リンク先が消えている
のにこのファイルだけ消しわすれ、とかそういう事態ではないかと推測するが。
0702名無しさん@お腹いっぱい。
2006/05/10(水) 17:42:57っていうか存在するのは 〜cbcodec.1.gz じゃないの?
何をやったのかいまひとつよくわからん。estfxmantotxt の中にじかに各ファ
イルのパスが書いてあるわけじゃないよね?
0703678
2006/05/10(水) 18:07:4360行目
nroff -man /usr/local/man/man1/cbcodec.1.gz | col -b | tr '\t' ' ' | output
に書き換えて
#find /usr/share/man -type f |egrep !.*/man[0-3]' |
estcmd gather -no cl -fx ".gz" "T@estfxmantotxt" -fz -sd -cm casket
/usr/local/man/man1/cbcodec.1.gz:*: warning {p 1,****
〜
〜
こんなん言ってます
0704名無しさん@お腹いっぱい。
2006/05/10(水) 18:16:19nroff -man "$infile" | col -b | tr '\t' ' ' | output
にすれば、各々のmanファイルを読めるし、さらに、
less "$infile" | nroff -man | col -b | tr '\t' ' ' | output
とすれば、gzipの場合は適切に解凍してくれるんじゃないかな。
lessが必要だけど。
0705名無しさん@お腹いっぱい。
2006/05/10(水) 20:46:070706名無しさん@お腹いっぱい。
2006/05/10(水) 20:56:59lessなら自動判定してくれる。
0707名無しさん@お腹いっぱい。
2006/05/10(水) 22:41:54〜
〜
troff: warning [p 1,7.7i]: cannot adjust line
troff: warning [p 1,7.8i]: can't break line
こんなの言ってます。
LANGを指定しても変わりませんでした。
0708名無しさん@お腹いっぱい。
2006/05/11(木) 01:22:13っていうか、 .gz というのは gzip で圧縮したファイルだってのは大丈夫?
nroff にせよ troff にせよ、勝手に展開してくれないから、 gzcat なり
less なりで gzip を展開してやらないよね、という流れなのだが、それ理解
できてる?
っていうか何故 troff になってんの?
0709名無しさん@お腹いっぱい。
2006/05/11(木) 01:40:400710名無しさん@お腹いっぱい。
2006/05/11(木) 04:34:53manにフィルターをかけてindexに引っ掛ける話なんですが?
0711名無しさん@お腹いっぱい。
2006/05/16(火) 13:36:10〜[63]:fetching: 1:http://hpux.cs.utah.edu/hppd/cgi-bin/search?package=on&description=on&term=qdm&Search=Serach
estwaver in free():error:chunk is already free
こんな文字を吐いてフリーズするのですがどうしたらいいのでしょう?
Ctrl+Cでも解除されません
0712名無しさん@お腹いっぱい。
2006/05/16(火) 22:01:200713名無しさん@お腹いっぱい。
2006/05/17(水) 01:20:250714名無しさん@お腹いっぱい。
2006/05/17(水) 21:25:02$ estcall raw -auth oira oiranopasswd http://localhost:1978/master?action=nodeadd\&name=NewNode
みたくしても
Bad Request (the action is invalid or lack of parameters)
となってしまうです。
ユーザー名oiraとパスワードはブラウザからmaster_uiに入って設定(sつけた)したもので
おいら的には抜かりないつもりだったんですが
どこを間違ったんでしょう?
$ estcmd --version
Hyper Estraier 1.2.4 on Linux
....
な環境です。
0715714
2006/05/17(水) 21:35:40ブラウザから試したらまず
大文字node名ダメ。かつラベル省略不可。
ということのようでした。
$ estcall raw -auth oira oiranopasswd http://localhost:1978/master?action=nodeadd\&name=newnode\&label=new
でうまく行きますね。すまんこ。
0716名無しさん@お腹いっぱい。
2006/05/21(日) 13:53:26で 300 個くらい文書を登録して estcmd optimize したら返ってこない……
Windows の公式バイナリで同じデータためすと 10 秒くらいで返ってくるん
だけどなぁ。ML は文字化けしてて読めないし。
0717名無しさん@お腹いっぱい。
2006/05/21(日) 14:30:08とりあえずUSEと同じオプションでソースからmakeして、
make checkが通るかどうか試してみれ
0718名無しさん@お腹いっぱい。
2006/05/21(日) 21:32:31昔同じようなことになったけど、USE="-bzip2"にしたら正常に動くようになった。
0719名無しさん@お腹いっぱい。
2006/05/21(日) 23:14:42qdbm 1.8.56, hyperestraier 1.2.6
をとってきて configure & make したら hyperestraier の make check でエラーになりました。
orz% make check
rm -rf casket casket-*
LD_LIBRARY_PATH=.:/lib:/usr/lib:/home/orz/lib:/usr/local/lib:/home/orz/local/lib:/home/orz/local/lib ./estcmd create -tr -xl -attr '@uri' seq -attr '@title' str \
-attr '@author' str -attr '@mdate' num -attr '@size' num casket
./estcmd: INFO: status: name=casket dnum=0 wnum=0 fsiz=19924487 crnum=0 csiz=0 dknum=0
./estcmd: INFO: closing: name=casket dnum=0 wnum=0 fsiz=27265610 crnum=0 csiz=0 dknum=0
LD_LIBRARY_PATH=.:/lib:/usr/lib:/home/orz/lib:/usr/local/lib:/home/orz/local/lib:/home/orz/local/lib ./estcmd put -ws casket ./misc/test001.est
./estcmd: INFO: status: name=casket dnum=0 wnum=0 fsiz=27265610 crnum=0 csiz=0 dknum=0
./estcmd: INFO: 1 (http://hyperestraier.sourceforge.net/sample.txt): registered
./estcmd: INFO: flushing index words: name=casket dnum=1 wnum=1 fsiz=27266752 crnum=101 csiz=5715 dknum=0
./estcmd: INFO: closing: name=casket dnum=1 wnum=45 fsiz=27266752 crnum=57 csiz=3194 dknum=0
./estcmd: ERROR: casket: database problem
make: *** [check] エラー 1
orz%
>>718
情報 thx です。bzip2 を configure からはずしてもう一度やってみます。
0720719
2006/05/21(日) 23:45:07また /etc/portage/package.use に hyperestraier -bzip2 でも使えるようになりました。
0721名無しさん@お腹いっぱい。
2006/05/22(月) 00:35:05いるけど、なんでgentooのデフォルトはbzip2付きなんだろ。
0722名無しさん@お腹いっぱい。
2006/05/25(木) 23:24:02WebクローラからP2Pサーバに分散登録する機能がついた。
かなり大規模な検索エンジンもこれで簡単に作れるようになるのかな。
0723名無しさん@お腹いっぱい。
2006/06/06(火) 10:41:41estwaverのhttps対応はいつ?とても便利に使ってるので期待。
0724名無しさん@お腹いっぱい。
2006/06/12(月) 19:44:03@weightの値が同じ場合、@idでソートされてしまうようなんですが、
これをスコア順にすることってできないんでしょうか?
0725名無しさん@お腹いっぱい。
2006/07/03(月) 23:55:290726名無しさん@お腹いっぱい。
2006/07/11(火) 15:23:450727名無しさん@お腹いっぱい。
2006/07/11(火) 15:41:41ここしばらく頻繁にアップグレードしてる印象があるけど。
0728名無しさん@お腹いっぱい。
2006/07/12(水) 21:51:300729名無しさん@お腹いっぱい。
2006/07/12(水) 22:46:570730名無しさん@お腹いっぱい。
2006/07/12(水) 23:03:310731名無しさん@お腹いっぱい。
2006/07/12(水) 23:21:18なんでそんなところに……
0732名無しさん@お腹いっぱい。
2006/07/13(木) 00:10:12これ使ったことないけど、そんなに凄い技術なの?
0733名無しさん@お腹いっぱい。
2006/07/13(木) 01:03:10多少できる人材が加わったところであまり意味はないような。
それよりは、検索対象のデータをいっぱい持っているけど検索技術が
まだないところに行ってもらった方がよさげ。
0734名無しさん@お腹いっぱい。
2006/07/17(月) 22:10:130735名無しさん@お腹いっぱい。
2006/07/17(月) 22:26:40なにそれ?
Webのクロール機能なんてあるの?
0736名無しさん@お腹いっぱい。
2006/07/17(月) 22:38:540737名無しさん@お腹いっぱい。
2006/07/24(月) 02:50:08DRWRITER | DBREADERで読み書きモードでオープンしたら
やっぱりまずい?
検索結果に出てきた文書をそのままoutしてしまいたいんだけど。
試してみると30回ほどやってみてデータの破壊はなかった
0738名無しさん@お腹いっぱい。
2006/07/24(月) 08:42:580739名無しさん@お腹いっぱい。
2006/07/24(月) 21:34:04トンクス。
0740名無しさん@お腹いっぱい。
2006/07/27(木) 21:09:15検索結果を重要度が高い順に並べたりしてくれるような機能ってありますか?
msearchを使っているのですが、更新が新しいもの順とか、アルファベット順とか
そんな機能しかないのです。
0741名無しさん@お腹いっぱい。
2006/07/27(木) 21:27:27はい
0742740
2006/07/27(木) 23:13:06導入検討します
0743名無しさん@お腹いっぱい。
2006/07/31(月) 14:19:32ページの<title>タグとか<h>タグとかを見てたりするの?
0744名無しさん@お腹いっぱい。
2006/07/31(月) 17:37:11ヒント ユーザーガイド
0745名無しさん@お腹いっぱい。
2006/07/31(月) 17:49:42て、テキストをぜんぶくっつけたものとして取り込んでいると考えてさしつかえない。
0746名無しさん@お腹いっぱい。
2006/08/01(火) 00:02:130747名無しさん@お腹いっぱい。
2006/08/01(火) 02:21:59読んでる部分はある。titleと、、、あとなんだっけ?
0748名無しさん@お腹いっぱい。
2006/08/01(火) 02:50:24metaとか見てる筈。でもそれくらい。
title は @title 属性にもなるし、本文にも隠しテキストとして入っている。
という話はややっこしいので、 743 にはああ書いた方が伝わると思ったんで
あのように書いた。少なくとも h1 とかで重要度とかいうのは考えてないです
よという感じ。
そもそも 743 の考えている重要度ってのがおれにはよくわかってないんですが。
基本的には H.E. では単語の重要度には Tf-Idf を使ってるよ、てのが答えに
なっているのかな。
0749名無しさん@お腹いっぱい。
2006/08/01(火) 03:13:490750名無しさん@お腹いっぱい。
2006/08/01(火) 07:22:46estcmd gatherでもだけど。
0751名無しさん@お腹いっぱい。
2006/08/01(火) 20:36:060752名無しさん@お腹いっぱい。
2006/08/01(火) 21:22:350753名無しさん@お腹いっぱい。
2006/08/04(金) 07:36:15これは普通(マニュアル通り)に記述してインデックス作成すれば検索できるように
なるのでしょうか?
マニュアルにある「若者たち」をやってみたのですが、検索されません。
どうしたらいいでしょうか?
0754名無しさん@お腹いっぱい。
2006/08/04(金) 09:01:44インデックスを作った時の操作が間違ってるとした言えない。
せめて、実行したコマンドを張り付けるとか、ログを張り付けるとか、実行環境について書くとかしませう。
0755名無しさん@お腹いっぱい。
2006/08/04(金) 15:49:18# estcmd put casket /home/date.est
estcmd: ERROR: casket:invalid argument
# estcmd version
Hyper Estraier 1.3.4 on FreeBSD
date.estはUTF-8で記述してあります。
実行前には普通にインデックスをは作成しました。
0756名無しさん@お腹いっぱい。
2006/08/04(金) 23:34:300757名無しさん@お腹いっぱい。
2006/08/04(金) 23:46:21@urlじゃだめだよ。それでダメなら、date.estの中身を見せてみ。
0758名無しさん@お腹いっぱい。
2006/08/05(土) 04:28:10ありがとうございます。登録する事が出来ました。@uriの記述でした。
文書ドラフト形式の登録の場合、ファイル毎に登録しなければならないでしょうか?
一括で登録する方法ってありませんでしょうか?
よろしくお願いします。
0759名無しさん@お腹いっぱい。
2006/08/05(土) 04:49:51文書ドラフトであってもestcmd gatherで登録できる
0760名無しさん@お腹いっぱい。
2006/08/16(水) 10:17:260761名無しさん@お腹いっぱい。
2006/08/17(木) 20:42:06ファイル名をつけると
# 1;2c1;2c1〜
と表示します
ファイル名無しだとフリーズするのですが、どうすればいいのでしょうか?
0762名無しさん@お腹いっぱい。
2006/08/18(金) 05:22:140763名無しさん@お腹いっぱい。
2006/08/18(金) 14:43:030764名無しさん@お腹いっぱい。
2006/08/18(金) 18:17:53ありがとうございます。
標準入力ってどんなの?
普通のHTML文章じゃダメなのかな?
0765名無しさん@お腹いっぱい。
2006/08/18(金) 21:37:48お前の理解力に合わせて言うとキーボードからの入力待ち状態だと思ってさしつかえない。
っていうか勉強しろ。
ちなみに、 fh をつければ、ちゃんと HTML として解釈してくれる。
0766名無しさん@お腹いっぱい。
2006/08/18(金) 21:45:05コマンドオプションにfhをつけてるが?
0767名無しさん@お腹いっぱい。
2006/08/19(土) 20:44:11CygwinでなくてネイティブWin32版が出てる。
0768名無しさん@お腹いっぱい。
2006/08/20(日) 09:37:25WinXP以降ならば
@echo off
for %%A IN ("%ESTORIGFILE%") DO echo "%%~nA" > "%2"
0769名無しさん@お腹いっぱい。
2006/09/10(日) 00:27:530770名無しさん@お腹いっぱい。
2006/09/13(水) 18:03:110771名無しさん@お腹いっぱい。
2006/09/13(水) 18:57:120772名無しさん@お腹いっぱい。
2006/09/14(木) 01:40:58変更点とかってどうやって解るの?
0773名無しさん@お腹いっぱい。
2006/09/14(木) 10:43:16それ漏れも知りたい。
ほぼ全てのリリースでqdbmの更新が必要だからな。
0774名無しさん@お腹いっぱい。
2006/09/14(木) 11:05:50たいていの更新ではファイル形式じたいは変わってないので読み書きできると
思う。なんでそのくせ最新版を要求するのかはよくわからない。
qdbm のバージョンアップに伴い旧形式で読み書きできなくなるときは、作者
の人がそのような注意をアナウンスのときにしている気がする。
けれどそれは何も保証するものではないなあ。
0775名無しさん@お腹いっぱい。
2006/09/14(木) 11:18:150776名無しさん@お腹いっぱい。
2006/09/14(木) 13:35:46(余所で再利用することを考えて?)H.E.の外部に出しておくためのライブラリとしての側面があるからねえ。
0777名無しさん@お腹いっぱい。
2006/09/14(木) 14:47:01HyperEstraierの略だったのね^^
でも意味わからなぁ〜い
まだまだ未熟ですがご指導お願いいたします。
0778名無しさん@お腹いっぱい。
2006/09/14(木) 23:23:460779名無しさん@お腹いっぱい。
2006/09/15(金) 11:49:520780名無しさん@お腹いっぱい。
2006/09/15(金) 15:03:07H.E. 側で安定したら qdbm 側に反映するとかー。
0781名無しさん@お腹いっぱい。
2006/09/15(金) 17:46:10せいぜい最新版にしたときのコンパイルがちょびっと楽になるというくらい?
別途に qdbm が欲しい人にとってはかえって面倒なだけだし。
0782名無しさん@お腹いっぱい。
2006/09/15(金) 22:10:21それに、ダウンロードする回数も1回で済む。
デメリットに関しては>>781の言う通りだと思う。
0783名無しさん@お腹いっぱい。
2006/09/17(日) 07:52:41case 61: name = "どう見ても超迷子です本当にありがとうございました"; break;
0784名無しさん@お腹いっぱい。
2006/09/17(日) 14:32:50case 53: name = "超迷子さんのすきゃんてぃ"; break;
作者の世代がなんとなくわかるな。
0785名無しさん@お腹いっぱい。
2006/09/18(月) 11:50:160786名無しさん@お腹いっぱい。
2006/09/18(月) 16:54:120787名無しさん@お腹いっぱい。
2006/09/20(水) 17:21:39インターフェイルに接続するときに
http://localhost:1978/master_ui等でブラウザからアクセスするのですが
これはポートポート番号1978を使って接続していますよね?
nmapで見てみたら1978は表示しないのですが何ででしょう?
0788名無しさん@お腹いっぱい。
2006/09/20(水) 17:36:30nmap はデフォルトでスキャンするポートに含まれてないからじゃないの。
-p1978 すれば出てくるでしょ。
0789名無しさん@お腹いっぱい。
2006/09/20(水) 23:07:470790名無しさん@w3m
2006/09/20(水) 23:51:140791名無しさん@お腹いっぱい。
2006/09/20(水) 23:52:51ローカルCGIでもちゃんと動くよ。
0792名無しさん@お腹いっぱい。
2006/09/22(金) 02:56:412006-09-20T14:41:33ZINFO[71]: fetching: 1: http://hpux.cs.utah.edu/hppd/cgi-bin/search?package=on&description=on&term=qdbm&Search=Search
何度トライしても上記でフリーズ?するんだけど
0793名無しさん@お腹いっぱい。
2006/09/27(水) 15:37:070794名無しさん@お腹いっぱい。
2006/09/27(水) 20:00:32ユーザーガイドに
データをダンプするコマンド
estcmd search -max -1 -dd casket [UVSET]
とあるのですが「UVSET]って何をすればいいのでしょうか?
estcmd search -max -1 -dd casket
これだけだと
estcmd: ERROR: /***/casket: I/O problem
と表示されます
0795名無しさん@お腹いっぱい。
2006/09/27(水) 21:21:210796名無しさん@お腹いっぱい。
2006/09/28(木) 01:08:45estcmd: No match.
こんなん表示されます。どうしたらいいでしょう
0797名無しさん@お腹いっぱい。
2006/09/28(木) 02:31:06estcmd search -max -dd 1 casket '[UVSET]'
とするとよろし。
0798名無しさん@お腹いっぱい。
2006/09/28(木) 03:21:19しかしながら *.est のファイルが見当たらないのですがどうしたらいいのでしょう
0799名無しさん@お腹いっぱい。
2006/09/28(木) 10:04:28取得最大数を無制限にするなら-1を指定するから、
estcmd search -max -1 -dd casket '[UVSET]'
が正解のような。
0800名無しさん@お腹いっぱい。
2006/09/28(木) 11:44:25転記ミスです。
#estcmd serach -max -1 -dd casket '[UVSET]'
--------[6801AEBA0ECCC85A]--------
VERSION 1.0
NODE local
HIT 33494
HINT#1 [UVSET] 33494
TIME 0.461
DOCNUM 33494
--------[6801AEBA0ECCC85A]--------
--------[6801AEBA0ECCC85A]--------:END
0801名無しさん@お腹いっぱい。
2006/09/28(木) 14:04:100802名無しさん@お腹いっぱい。
2006/09/28(木) 17:15:52念のためにパーミッションを変更しましたが同様です。
0803名無しさん@お腹いっぱい。
2006/09/28(木) 18:24:27まあいいけど。
・適当な ID で estcmd get したらできるか
・-max 1 (とか少ない数)にしたらどうなるか、 -dd を外すとどうなるか
・作業場所はどんなところか、残り容量はどれくらいか
とかも確認よろ。
あとありえないと思うけど、 NFS 共有してる場所とか、場合によって root
でも書き込めない場所というのはあるよ。
0804名無しさん@お腹いっぱい。
2006/09/28(木) 19:38:54再度ユーザーガイドを見ながら最初からやり直したら出来ました。
rootで作業は横着したいので作業してます。
閉ざされた環境なので問題ないと思っています。
0805名無しさん@お腹いっぱい。
2006/09/28(木) 20:42:35一般的な考え方としてはよっぽどの作業(システムに変更を加えるというまさ
にそのアクションそのもの)以外の場合に root を使うのはダメゼッタイ。
環境がどうこうとか、問題がないとか関係なく、やめた方がいいよ。
0806名無しさん@お腹いっぱい。
2006/09/29(金) 04:34:08クローラの設定ファイル_conf
# text size limitation (in kilobytes)
これって取得するtextのサイズ制限でいいのかな?
0807名無しさん@お腹いっぱい。
2006/09/29(金) 10:08:440808名無しさん@お腹いっぱい。
2006/09/29(金) 11:37:11圧縮されてるから普通のedetorで見れないだけ?
sestseek.cgiも覗いて見たいです。
環境はwin、UNIXどちらでもいいです。
0809名無しさん@お腹いっぱい。
2006/09/29(金) 11:39:270810名無しさん@お腹いっぱい。
2006/09/29(金) 12:07:290811名無しさん@お腹いっぱい。
2006/09/29(金) 14:07:29コマンドで作成されたファイルというのが DB のことを指すのであれば、この
構成については基本的にはドキュメントがない。どうしても知りたければソー
スを読むか作者に聞くかするしかないんじゃない。
また、H.E. のDBは基本的には QDBM のDBファイルだろうから、 QDBM のユー
ティリティコマンドでいろいろ弄れることは弄れるはず。
0812名無しさん@お腹いっぱい。
2006/09/29(金) 14:23:300813名無しさん@お腹いっぱい。
2006/09/29(金) 14:25:590814名無しさん@お腹いっぱい。
2006/09/29(金) 15:04:39表示しないのよぉ〜
何使ってる?教えて
0815名無しさん@お腹いっぱい。
2006/09/29(金) 15:10:000816名無しさん@お腹いっぱい。
2006/10/02(月) 15:05:20INDEXをコマンドを使って作成すると文字が変換されてしまい
検索結果をリンクしても表示されません
特殊な文字を使ったファイル名を別な文字にあらかじめ置き換えておく方法が考えられますが
他に方法はありますでしょうか?
よろしくお願いします。
0817名無しさん@お腹いっぱい。
2006/10/02(月) 16:25:020818名無しさん@お腹いっぱい。
2006/10/02(月) 16:52:34RFCで定義されてるみたいだから正常だと思うんだけど
0819名無しさん@お腹いっぱい。
2006/10/02(月) 18:24:02これは、バグと言えると思うけどなぁ
0820816
2006/10/02(月) 19:39:48次に困ったら又考えよう
0821名無しさん@お腹いっぱい。
2006/10/02(月) 21:41:00にすればエスケープしてないファイル名を表示してくれるんじゃね?
0822名無しさん@お腹いっぱい。
2006/10/03(火) 16:03:20estfraud.confだけを設定したらいい?
それともestfraud.conf+_confの設定?
0823名無しさん@お腹いっぱい。
2006/10/04(水) 16:48:26全文検索ユーティリティ統一スレッド part3
ttp://pc8.2ch.net/test/read.cgi/bsoft/1120649196/
0824名無しさん@お腹いっぱい。
2006/10/05(木) 07:59:33少なくともリンクがダブルクォートで囲ってないと誤動作するようです。HTML
規格違反だとは思いますが。
あとpukiwikiのぺージにはまりこんでしまう問題もなんとかならないでしょうか。
0825名無しさん@お腹いっぱい。
2006/10/05(木) 08:39:11単なるN-gramとは事情がちょっと違うよなあ。
0826名無しさん@お腹いっぱい。
2006/10/05(木) 09:10:06ないし。
>>824
そのレベルの問題は作者に報告するのがよかろうに。
0827名無しさん@お腹いっぱい。
2006/10/05(木) 17:30:08このindexをestseek.cgiで指定して検索した場合って検索結果って表示されますか?
0828名無しさん@お腹いっぱい。
2006/10/05(木) 19:30:58estwaverやestmasterで作ったインデックスも
estcmdで作ったインデックスと全く同じように使えるよ。
0829名無しさん@お腹いっぱい。
2006/10/05(木) 21:16:190830名無しさん@お腹いっぱい。
2006/10/05(木) 23:38:040831名無しさん@お腹いっぱい。
2006/10/06(金) 14:15:53このアクセス名を変更したいときはどのようにすれば良いでしょうか?
バージョンだけでも隠匿したいです。
0832名無しさん@お腹いっぱい。
2006/10/06(金) 16:37:50estcmd extkeys -um
っつうコマンドは何のために実行するんですか?
「インデックス内の各文書のキーワードを抽出したデータベースを作成します。」となって
いますが、インデックスを形態素解析してキーワードごとに区切り直して何のメリットが?
検索速度、精度に影響あるんですか?
0833名無しさん@お腹いっぱい。
2006/10/06(金) 18:34:18> 理論通りの N-gram を実装しても、インデックスが大きくなり過ぎて結局使え
> ないし。
へ?
俺200MBくらいの日本語テキストをLuceneのN-gramでインデックス化してるよ?
類似検索とかしなければ、0.1秒で帰ってくる。
マシンはPPCのMac mini。
0834名無しさん@お腹いっぱい。
2006/10/06(金) 18:42:05類似検索ができるようになります。
0835名無しさん@お腹いっぱい。
2006/10/06(金) 20:08:53補助インデックスでヒット数が得られれば検索速度が上がる。
そうでない場合でも、検索精度が上がる。
0836名無しさん@お腹いっぱい。
2006/10/06(金) 21:24:54たとえば下記の3つの結果が 53, 27, 27 になります。
estcmd search -vu -max 10 -attr "@uri STRINC Win" casket Windows
estcmd search -vu -max 10 -sk 1 -attr "@uri STRINC Win" casket Windows
estcmd search -vu -max 50 -attr "@uri STRINC Win" casket Windows
これは仕様でしょうか?
0837名無しさん@お腹いっぱい。
2006/10/07(土) 07:41:25スレ違い
0838名無しさん@お腹いっぱい。
2006/10/07(土) 10:17:48>>836
属性インデックスを使わない場合は、ヒントの該当数表示が正確とは限らないから、
それは多分仕様。
0839836
2006/10/08(日) 10:38:47レスサンクスです。UNIX版も同じでしょうか?
余計な事調べるより速度を重視ってとこでしょうかね。
この数値を元に検索結果のページ切り替えタブを作っているのですが
2ページめ(10〜20件)を表示すると総ページ数がいきなり減ってしまうので困ってます。
もうひとつ質問です。
スコアの値を基に★3つとか表示をしたいのですが満点をいくつにすればよいのかよくわかりません。
検索語が増えればどんどん点数が上がっていくみたいなので困っています。
0840名無しさん@お腹いっぱい。
2006/10/08(日) 11:46:06ここはUNIX板だよな?居候は謙虚になりなさいw
何をやりたいのかよくわからんが、
P2Pガイドの助言の項目(ページ)にヒントがある
加点方式だから満点も何もないだろ
0841名無しさん@お腹いっぱい。
2006/10/08(日) 14:24:30840の言う通り、加点方式だから満点に意味はない。
けれど、スコアは偏差値で調整されているはずだから、
1位を満点にすればそれっぽい表示ができるかもね。
0842名無しさん@お腹いっぱい。
2006/10/08(日) 18:06:15ここまで厚顔無恥なやつは初めてだよ
他人の迷惑も少しは考えろよ
0843名無しさん@お腹いっぱい。
2006/10/08(日) 20:31:20>余計な事調べるより
余計なことなら聞かないでくれ
0844名無しさん@お腹いっぱい。
2006/10/08(日) 21:43:000845名無しさん@お腹いっぱい。
2006/10/08(日) 21:57:39教えて君が助長しないか心配
0846名無しさん@お腹いっぱい。
2006/10/08(日) 22:47:310847名無しさん@お腹いっぱい。
2006/10/08(日) 22:48:402ちゃんねるやWarez、最新アニメの話で彼女をひきつけようとしても、白けられるばかりでした。
N-gramを使ってからは全てが変わりました。
全文検索の話で盛り上がり、彼女はもう僕にめろめろです。
素敵な彼女のハートをつかむことを助けてくれたN-gramに僕は大感謝です。
0848名無しさん@お腹いっぱい。
2006/10/09(月) 00:59:16単にHがしたい!と言う質問に対しては
嫁に相手してもらえ!彼女を作れ!や風俗に行け!と言う明確な回答が出来る。
しかし、有名アイドルとHがしたい!と言う条件がつく質問には幅広い回答しか出来まい
0849名無しさん@お腹いっぱい。
2006/10/09(月) 09:48:29データから削除される?
0850836
2006/10/09(月) 23:01:54>>840-841
ご回答ありがとうございます。
P2Pの方は関係ないと思って全然読んでませんでした。
>>843
余計な事・・・っていうのは>>838さんの回答に対してではなく
(EstraierがHit数のような)余計な事調べるより(検索)速度を重視
って意味です。念のため。
それではお邪魔しました。
0851名無しさん@お腹いっぱい。
2006/10/10(火) 01:23:20replace ~file/usr/home/data/{{!}}http://domein.com/
とした場合、訪問するのは/usr/home/data/でしょうか?http://domein.com/
でしょうか?それともエラーで訪問しないのでしょうか?
0852名無しさん@お腹いっぱい。
2006/10/11(水) 19:58:16Namazuの-excludeオプションみたいな、特定のフォルダだけ検索対象から
除外するにはどうすればいいの?
あと、Namazuみたいに複数のインデックスに分けて、チェックボックスで
検索対象選ぶインターフェイスにしたいんだけど@genreで分けるしか方法はないの?
インデックス自体を物理的に分けて、横断検索できたらなぁ。。。
0853名無しさん@お腹いっぱい。
2006/10/11(水) 23:22:29>除外するにはどうすればいいの?
estcmd scandir と estcmd regex を組み合わせてゴリゴリやる.
#findとgrepでも可
>インデックス自体を物理的に分けて、横断検索できたらなぁ。。。
estmaster 使ってメタ検索を使う.
0854名無しさん@お腹いっぱい。
2006/10/12(木) 16:36:37estmasterとかマニュアル読んだけど意味全然分かんないし。
昔あったestmerge.cgiってHyper Estraierには使えないのかな?
便利な機能削ってP2Pだとかやたら取っつきにくい新機能で「すごいだろ」
って言われても一般ユーザーにはどうすることも出来ないよ。
0855名無しさん@お腹いっぱい。
2006/10/12(木) 18:39:140856名無しさん@お腹いっぱい。
2006/10/13(金) 20:27:250857名無しさん@お腹いっぱい。
2006/10/13(金) 21:37:470858名無しさん@お腹いっぱい。
2006/10/14(土) 01:05:020859名無しさん@お腹いっぱい。
2006/10/14(土) 03:46:13libmecabのpthread&mmapまわりか、libqdbmのガベコレか、どっちかが臭い(たぶん前者)
0860名無しさん@お腹いっぱい。
2006/10/14(土) 10:49:53一般ユーザ向けのソフトじゃないでしょ
いきなり何いってるんだ?
0861名無しさん@お腹いっぱい。
2006/10/14(土) 10:54:570862名無しさん@お腹いっぱい。
2006/10/16(月) 18:36:44結果のカスタマイズはできませんか?
0863名無しさん@お腹いっぱい。
2006/10/16(月) 20:03:33ユーザーガイド読めよ!
0864名無しさん@お腹いっぱい。
2006/10/17(火) 15:15:31検索すると、エラー処理部分の<title>が表示されちゃったり、キーワード「エラー」で全件ヒットしたりしてます。
こんな時はクローラー動かすしかないですかね?
フィルタは、さっぱりわかりませんし。
0865名無しさん@お腹いっぱい。
2006/10/17(火) 15:39:44質問もまもともにできないの?
0866名無しさん@お腹いっぱい。
2006/10/17(火) 16:54:35・CGIスクリプトをそのまま H.E. につっこんでいる
・しかも HTML ファイルとして処理させている
・そうするとスクリプト中の正規の処理のパートと、エラー処理などの部分と、両方とも H.E. に1つのドキュメントに入ってしまう
・クローラを使って HTTP 経由で CGI の吐いた HTML を処理するしか方法はないのだろうか?
・フィルタは理解する気がありません
これであってる?
0867名無しさん@お腹いっぱい。
2006/10/17(火) 17:45:48cgi自体をデーターとして取り込み操作してるから出来ないんだよ!
頭使え!
俺だったらestファイルで読み込む方法を取るな
0868名無しさん@お腹いっぱい。
2006/10/20(金) 00:22:40estseek.conf と estseek.tmpl でできる以上のカスタマイズは無理っぽい。
俺も PREV 1 2 3 4 NEXT とか
右下に英語で小さく表示されるのが嫌だったので変更したかったんだが、
estseek.c のソース見たらその辺はハードコーディングされてて
テンプレートとかでカスタマイズできるように見えなかった。
というわけで Perl で API 叩くフロントエンド書いたよ。
Namazu のテンプレートなんかよりずっと柔軟なカスタマイズができるようになった。
API マンセー
0869名無しさん@お腹いっぱい。
2006/10/20(金) 10:17:490870名無しさん@お腹いっぱい。
2006/10/20(金) 11:38:15それよりインデクサのAPIがあることのほうが素晴らしいとは思わんかね。
0871名無しさん@お腹いっぱい。
2006/10/20(金) 13:07:530872名無しさん@お腹いっぱい。
2006/10/20(金) 20:39:03全文検索(BODY TEXT)だけでなく,ファイル名も同時に検索できるようにするには
どのようにしたらよいのでしょうか。
formtype=fileでは,bodytextがpathのどちらかの検索となってしまううえに,
pathではand/or検索ができない(一語検索のみ)のですが。
0873名無しさん@お腹いっぱい。
2006/10/20(金) 21:15:410874名無しさん@お腹いっぱい。
2006/10/20(金) 22:43:45ではそのスタイルシートで PREV を [前へ] に変えてみてくれ。
ついでに Submit ボタンのキャプションを「検索」に、
「per page」を「件毎」に、「with」を「属性」に、
「Results of 1 - 10 of about 220 for XXX (0.010 sec.)」を
「"XXX" の検索結果 約 220 件中 1 - 10 件目 (0.010 秒)」に変えてもらえると嬉しい。
0875名無しさん@お腹いっぱい。
2006/10/20(金) 22:47:540876名無しさん@お腹いっぱい。
2006/10/20(金) 23:20:01estseek が吐く HTML がいつどう変わるかわからんからんし、
JS オフだと働かないしなあ… (それは CSS も同じだ)
綺麗な解決法とは言い難いところがあるね。
>>870
Search::Namazu のこと?
http://cvs.namazu.org/Search-Namazu/ も
http://www.namazu.org/~knok/ も死んでて
かろうじて http://www.akaneiro.jp/Search-Namazu/ にあるみたいだけど開発版のようだし、
使った事例も全然見かけないし、実際使えんの?
0877名無しさん@お腹いっぱい。
2006/10/21(土) 15:24:130878名無しさん@お腹いっぱい。
2006/10/21(土) 17:58:06Search::Namazuは
http://www.namazu.org/trac-namazu/trac.cgi/browser/
に移っているね。
CPANが正式版
http://search.cpan.org/~knok/Search-Namazu-0.96/
0879名無しさん@お腹いっぱい。
2006/10/23(月) 22:12:14873さんも書いているが、文書ドラフトの
@titleとかにファイル名を突っ込むバッチファイルを
書いてやればよいのでは?
自分は画像ファイルなどもタイトルで検索したかった
のでそうして使ってる。
0880名無しさん@お腹いっぱい。
2006/10/24(火) 00:58:52ありがとうございます。一応,自己レスしておきます。
結局,xdoc2txtに全部通すことにし,estfilt.batを
@echo off
echo %ESTORIGFILE% >%2
xdoc2txt -s -r=0 -o=0 %ESTORIGFILE% >> %2
とし,gather時に-foつけて対処してしまいました。
一番手っ取り早かったものですから。
0881名無しさん@お腹いっぱい。
2006/10/24(火) 01:06:53引っかかる検索式の書き方等,よかったら教えていただけませんか?
0882名無しさん@お腹いっぱい。
2006/10/24(火) 01:41:28ストとしてBODY につっこんでるよね。そういうことをやるしかないと思う。
0883名無しさん@お腹いっぱい。
2006/10/25(水) 21:49:39どなたか手順を教えていただけないでしょうか?
やりたいことはWebサーバ構築してキャッシュを全文検索で探せるようにしたいんで・・・
よろしくお願いします。
0884名無しさん@お腹いっぱい。
2006/10/26(木) 00:21:110885名無しさん@お腹いっぱい。
2006/10/26(木) 00:56:43ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11584247111923666502&focus=1
0887名無しさん@お腹いっぱい。
2006/11/11(土) 21:04:500888mini
2006/11/12(日) 16:24:050889名無しさん@お腹いっぱい。
2006/11/20(月) 08:02:38今は200MB以上使われてしまう。
0890名無しさん@お腹いっぱい。
2006/11/20(月) 12:10:36例えば,1.4.9のリリースのメールって来た?
俺は公式サイト見て1.4.9リリースを知ったんだけど…
0891名無しさん@お腹いっぱい。
2006/11/20(月) 20:25:03俺も1.4.9出てたの今初めて知った
0892名無しさん@お腹いっぱい。
2006/11/20(月) 22:03:41のメールがhyperestraier-users(英語)の方に出されてるので、間違えてるっぽいね。
0893名無しさん@お腹いっぱい。
2006/11/21(火) 07:46:120894名無しさん@お腹いっぱい。
2006/11/21(火) 07:47:510895名無しさん@お腹いっぱい。
2006/11/21(火) 10:52:46いまだにベータ版で飯喰ってるような会社だぜ。
0896890
2006/11/21(火) 11:55:18迷惑メールフォルダ探したり,MLに再登録しようか迷っていたんだけどそんなことしなくて良いのねw
状況が分かってイカッタ.
それと作者氏のブログのRSSを登録することにしたヨ.
0897名無しさん@お腹いっぱい。
2006/11/21(火) 22:28:510898名無しさん@お腹いっぱい。
2006/11/21(火) 23:11:51libiconvが見つからん。
iconvは、glibc-commonにあったけど、
libiconvはどこのパッケージにあるの??
0899名無しさん@お腹いっぱい。
2006/11/23(木) 17:36:23手順をある程度教えてもらえないでしょうか?
0900名無しさん@お腹いっぱい。
2006/11/23(木) 17:38:030901名無しさん@お腹いっぱい。
2006/11/23(木) 23:20:53http://hyperestraier.sourceforge.net/intro-ja.html#deployment
0902名無しさん@お腹いっぱい。
2006/11/26(日) 03:00:06subjectが長い場合、語の途中に空白が入っていて、
その語が、検索に引っ掛からないことがあるんですが、
これは、hyperestaraier側の問題なんでしょうか。
subjectのソースを見ると、
=?ISO-2022-JP?B?........?=
の部分が複数行ある時、語の分断が発生して
いるように見えるんですが、関係あるんでしょうか。。。
0903名無しさん@お腹いっぱい。
2006/11/26(日) 09:59:58たぶんしょうがない。どちらかといえば送る側のメーラの問題。
0904902
2006/11/26(日) 14:49:48subjectで検索しても、ちゃんと検索語の含まれる
メールが抽出されるみたいです。
0905名無しさん@お腹いっぱい。
2006/11/26(日) 14:50:21estraierの問題だと思う。
エンコードされた文字列間は空白なしで連結するのが仕様。空白を含めたかったら空白もエンコードする。
0906名無しさん@お腹いっぱい。
2006/11/26(日) 15:03:51え、それってどの仕様?
0907名無しさん@お腹いっぱい。
2006/11/26(日) 15:09:40> エンコードされた文字列間は空白なしで連結するのが仕様。空白を含めたかったら空白もエンコードする。
それって確定したの? ずいぶん長いこと紛争の種になったポイントだよね?
0908名無しさん@お腹いっぱい。
2006/11/26(日) 15:16:03いまのところデコードした後、空白の前後が日本語の文字だったら連結すると
かってアプリ側で対処するしかない。
0909名無し募集中。。。
2006/11/26(日) 22:14:04estseek.cgi で検索することはできますか?
やってみると estseek.cgi のトップ画面は出るのですが
検索しようとすると Segmentation Fault します
インデックス化されているファイルのパス名に日本語が入ってると難しいかなぁ...
0910名無しさん@お腹いっぱい。
2006/11/30(木) 17:18:35Test.cgiで作ったのはフツーに動いたんですが、何がおかしいんでしょうか?
0911名無しさん@お腹いっぱい。
2006/11/30(木) 20:19:500912名無しさん@お腹いっぱい。
2006/11/30(木) 22:56:33そのApacheのエラーログが
>Premature end of script headers: estseek.cgiってエラー
なんじゃねーの?
0913名無しさん@お腹いっぱい。
2006/11/30(木) 23:11:090914名無しさん@お腹いっぱい。
2006/12/01(金) 00:12:080915名無しさん@お腹いっぱい。
2006/12/01(金) 11:49:42とにかくコンフを初期設定に戻してやってみます。
0916名無しさん@お腹いっぱい。
2006/12/01(金) 12:04:50因みに、私は、マニュアルの記載
http://hyperestraier.sourceforge.net/intro-ja.html#introduction
>>Hyper Estraierは、以下のライブラリを利用しています。予めそれらをインストールしておいてください。
>>libiconv : 文字コード変換。バージョン1.9.1以降(glibcにも同梱)。
>>zlib : 可逆データ圧縮。バージョン1.2.1以降。
>>QDBM : 組み込み用データベース。バージョン1.8.68以降。
で、既につまづいている状況です。
どなたか。。。
0917名無しさん@お腹いっぱい。
2006/12/01(金) 12:12:12だってさ。
0918916
2006/12/01(金) 12:26:20ありがとうございます。
これは、
・qdbmのwinバイナリパッケージ
のインストールも、不要と考えてよいのでしょうか?
重ね重ねすいませんが。。
0919名無しさん@お腹いっぱい。
2006/12/01(金) 12:27:53知らね。
まず入れてみて、動かなかったら考えたら?
0920918
2006/12/01(金) 12:56:52ありがとうございます。
まだ動かせる所までは程遠い状態、かつ、qdbmを入れてみることができるまで程遠い状態ですが、前に進みますね。
あと、どなたか、こんな超初心者の私に、win版のインストールを教示してくれるHPを教えていただけないでしょうか?
0921名無しさん@お腹いっぱい。
2006/12/01(金) 18:13:570922920
2006/12/02(土) 09:30:18どもです。
予めgoogleで調べたのですが、インストール・設定のメモ等をアップして
くれているHPが見つからなかったんですよ。。
私の探し方が悪いのかも。。
そこで、このスレの利用を思いついたのですよ。
0923名無しさん@お腹いっぱい。
2006/12/02(土) 10:59:43俺がXPで動かしたときは問題なくできたから
0924名無し募集中。。。
2006/12/02(土) 14:19:25QDBM とか他のは何もいらない
検索 CGI を動かすのだったら Apache などの Web サーバが必要
0925922
2006/12/02(土) 22:32:51ありがとうございます。
公式の熟読は、確かに不十分だったかもしれません。気をつけます。
>>QDBM とか他のは何もいらない
は、嬉しいコメントです。実は、この点は、公式の熟読でもわからない点でした。
以前(Hyper・・・前)のestraierは、セットアップ時間30分で十分だったのですが、
Hyperになって、高機能になった分、設定が難しくなったと感じているのは
私だけでしょうか?だからインストールメモのHPが無いのかな、、、と。
でも絶対難しくなってますよね。。。言い訳でした。。。
0926名無しさん@お腹いっぱい。
2006/12/02(土) 22:44:07どこが難しいんだ?
0927名無しさん@お腹いっぱい。
2006/12/03(日) 00:43:030928922
2006/12/03(日) 09:18:36欲嫁。
0929名無しさん@お腹いっぱい。
2006/12/04(月) 02:11:15例えば画像(png、jpgなど)ファイル中にコメントを埋め込んで、それを検索の対象に含める、ということは可能でしょうか?
ユーザガイド読んだら適切なフィルタを持ってくればできそうに思えたのですが、実際に運用してる方に聞きたく書きこみました。
それともこういう場合、コメントはファイルに埋め込むのでなく、別途テキストを用意するのが王道だったりするのでしょうか?
何かコメント頂ければ幸いです
0930名無しさん@お腹いっぱい。
2006/12/05(火) 02:13:35俺は実際に運用してるわけじゃないが、フィルタさえ用意すれば当然可能。
ファイルそのものにコメント記入フィールドがあるなら、
別途テキストなんか用意するよりファイルに直接埋め込む方が正攻法だべ。
0931名無しさん@お腹いっぱい。
2006/12/05(火) 04:44:17http://search.cpan.org/dist/Image-ExifTool/
0932929
2006/12/05(火) 07:45:42>>931
お返事ありがとうございます。お言葉に勇気づけられました。ちょっくらやってみます。
以下のような解説を書いてる方もおられましたです。
ttp://module.jp/blog/comment_in_imagefile.html
0933915
2006/12/07(木) 14:42:34ちなみに大事な要因を書き忘れてました、Windowsでアパッチは2.2.3を使ってます。
0934915
2006/12/07(木) 15:25:12replace: file:///www/cgi-bin/{{!}}http://localhost/
でCGIの設置場所がCのwwwのcgi-binに掘り込んでるんですが、正しくはどう
0935名無しさん@お腹いっぱい。
2006/12/07(木) 16:12:190936915
2006/12/07(木) 16:39:26Content-Type: text/plain; charset=UTF-8
Error: the configuration file is missing.
ってでました。
0937名無しさん@お腹いっぱい。
2006/12/07(木) 18:05:26ファイル名が微妙に間違ってるとかない?
これ以上はエスパーが降臨しないと分からんな
0938名無しさん@お腹いっぱい。
2006/12/07(木) 22:03:07どう見ても estseek.conf が存在しないとしか思えませんが
0939915
2006/12/13(水) 19:21:19Status: 500 Internal Server Error
Content-Type: text/plain; charset=UTF-8
Error: indexname is undefined.
となりました。
コンブの記述ミスでしょうか?
0940名無しさん@お腹いっぱい。
2006/12/13(水) 20:22:37出てくるメッセージ読めって
Error: indexname is undefined -> エラー:indexnameが定義されてません
Windows版バイナリパッケージを解凍した素のestseek.cgiを実行したって
Error: the index is missing or broken
って出る(バイナリパッケージにいきなりcasketなんていうフォルダはない
から当たり前)のに、undefined って出てるんだから、完全にコンブ(これも
新しい俺用語だな)の記述ミスだろ
0941915
2006/12/13(水) 22:15:15コンブの中身はこうししてるんですが・・・
どこがまずいですか?
環境はC:\www\casketにCASKETがあって、C:\www\public_htmlにindex.htmlやestseek.*やtest.cgiがある感じです。
加えてC:\www\cgi-binにもindex.htmlやestseek.*やtest.cgiがある感じです。
以下の中身はcgi-binの方です。
indexname: /www/casket
・・・
replace: file://C|/www/public_html/{{!}}http://localhost/
replace: /index\.html?${{!}}/
・・・
0942名無しさん@お腹いっぱい。
2006/12/13(水) 23:23:36でも、estseek.cgi を実行すると undefined ってエラーが*なぜか*出てるんだよ
何かきっと単純な見落としがあるんだろうけど、それが何かはエスパーが降臨しないと分からん
試しにWindows版バイナリパッケージをもう一度落としてきて、それをC:\hyperestraier に解凍して、
C:\hyperestraier\estseek.conf の一行目を indexname: c:/www/casket にして、コマンドプロンプト
から、
C:\hyperestraier> estseek.cgi [ENTER]
って実行してみな
これが動かなかったら PC を窓から投げ捨てろ
動いたとしたら地道に違いを見つければきっと解決できる
0943名無しさん@お腹いっぱい。
2006/12/13(水) 23:28:53CGI としてブラウザから操作できるかどうかは、apache の設定とかも絡んでくるから別次元の話
0944名無しさん@お腹いっぱい。
2006/12/14(木) 01:01:12> C:\www\casketにCASKETがあって
だったら何で
indexname: /www/casket
なの?
indexname: C:\www\casket
にしなければならないんじゃネーノ?
あと、その casket が estwaver で作ったものであるなら、
indexname は 〜/casket ではなく 〜/casket/_index にしないと動かないわけだが
0945915
2006/12/14(木) 09:52:34ただestcmdで作ったものなんでスけどね。。。
waverで作って、やってみます。
動かなかったら、新品のPCを最上階から投げ捨てる覚悟を作ってやります!!
0946915
2006/12/14(木) 09:53:150947名無しさん@お腹いっぱい。
2006/12/15(金) 01:53:32で、
indexname: C:\www\casket
は試したのか?
誰も waver で作り直せなんて言ってないだろが。
とっとと窓から投げ捨てろ
0948名無しさん@お腹いっぱい。
2007/02/18(日) 19:07:15age とく
0949名無しさん@お腹いっぱい。
2007/02/18(日) 21:37:07でも、記事は動作原理とインストールして走らすまでの
話が主で、Namazu みたいに使いこなしのこなれた
枯れたシステムという感じではないね、やっぱり。
へたれな おいらは mew 以外ではまだしばらく
様子見しまつ。
0950名無しさん@お腹いっぱい。
2007/02/20(火) 11:06:30_conf で denyrx: から pdfを除外して、
typerule: ^application/pdf${{!}H@/usr/local/share/hyperestraier/filter/estfxpdftohtml
を入れても、estwaver crawl xxx すっと
2007-02-20T01:47:06Z INFO fetching: 1: http://.../MS0024320.pdf
2007-02-20T01:47:06Z INFO ignored: 200: http://.../MS0024320.pdf
となる。なぜだろう?
0951名無しさん@お腹いっぱい。
2007/02/20(火) 11:17:34estfxpdftotextはシェルスクリプトで、内部的にpdftotextを読んでるだけだから。
0952950
2007/02/20(火) 11:23:44estcmd gather -cl -fx ".pdf" "H@estfxpdftohtml" -fz -ic UTF-8 -sd -cm casket /var/..
これは問題なくうごく。
ソースを追うとさ、estwaver が呼んでいる fetch_document が
status 200 を返しているんだな。てことは、est_url_shuttle
が200を返しているんだけど、その先が thread になってて
ようわからん。
0953950
2007/02/20(火) 12:36:47× typerule: ^application/pdf${{!}H@/usr/local/share/hyperestraier/filter/estfxpdftohtml
○ typerule: ^application/pdf${{!}}H@/usr/local/share/hyperestraier/filter/estfxpdftohtml
ttp://hyperestraier.sourceforge.net/cguide-ja.html のタイプミスに気が塚なんだ onz
0954名無しさん@お腹いっぱい。
2007/03/06(火) 13:11:370955名無しさん@お腹いっぱい。
2007/03/12(月) 12:45:54http://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11733369362470439636&focus=1
0956名無しさん@お腹いっぱい。
2007/03/15(木) 05:33:290957名無しさん@お腹いっぱい。
2007/03/16(金) 23:03:340958名無しさん@お腹いっぱい。
2007/03/17(土) 13:20:590959名無しさん@お腹いっぱい。
2007/03/26(月) 01:11:33pukiwikiのデータのインデックスをestwaverで作ろうとしたのですが、
casketの_confでseedで指定しているページのインデックスしか作ることが
できませんでした。(リンクをたどってくれない。)
通常のhtmlのページは取り込むことができます。
pukiwikiのようなURLでリンクが張られるページのインデックスを、
estwaverで作るにはどうしたらいいのでしょうか。
denyrxなどで弾かれているかと思い、制限がかかりそうなところは
全てコメントアウトするなどしたのですが、変わりませんでした。
またseeddepth,maxdepthは20にしています。
ヒントだけでも結構ですので、もしわかる方いましたらよろしくお願いします。
0960名無しさん@お腹いっぱい。
2007/03/26(月) 02:18:50denyrxで弾かれてるしかないだろうな
0961名無しさん@お腹いっぱい。
2007/03/26(月) 09:59:590962959
2007/03/26(月) 19:00:49レスどうもありがとうございます。
denyrx、noidrxは全てコメントアウトしているのですがだめでした。
その後いろいろ試行錯誤していたのですが、偶然取り込むことができました。
前に取り込めたhtmlも動作がおかしいようだったので、unittestを
してみたところ、_confが上書きされてしまいました。
そこで改めて設定をやり直したところ、ちゃんと動作しました。
_conf以外にはseedをphpの吐くページではなく、その上にphpにリンクを
張っているhtmlを作るという変更をしました。
あまり原因が明確ではないのが気持ち悪いですが・・・
付き合ってくださった方々、どうもありがとうございました。
0963名無しさん@お腹いっぱい。
2007/03/26(月) 23:30:560964名無しさん@お腹いっぱい。
2007/03/28(水) 00:46:280965名無しさん@お腹いっぱい。
2007/03/28(水) 06:39:47このスレ、ここまで来るのに2年以上かかったのね。
0966名無しさん@お腹いっぱい。
2007/03/28(水) 08:24:070967名無しさん@お腹いっぱい。
2007/04/15(日) 19:12:10検索インターフェース(search_ui)で検索をかけたのですが検索結果のリンク先が文字化けします
estseek.confの「showreal」のような設定はできますか?
あるいはestseek.cgiをインターフェースに使うことはできるのでしょうか?
0968名無しさん@お腹いっぱい。
2007/04/16(月) 10:07:180969名無しさん@お腹いっぱい。
2007/04/16(月) 11:30:100970名無しさん@お腹いっぱい。
2007/04/16(月) 19:25:09そうなんですが、正直なところマニュアル(uguide-ja)は、
入門者には情報が多すぎるのと専門用語が多くてわかりにくいです。
もうちょっと腰を落ちつけて読みます。
0971名無しさん@お腹いっぱい。
2007/04/16(月) 20:30:450972名無しさん@お腹いっぱい。
2007/04/16(月) 22:43:410973名無しさん@お腹いっぱい。
2007/04/16(月) 22:52:38HEのは、特徴的な文体ではあるな。
しかし、ほかのソフトマニュアル
のほうがうんと読みやすい、てことも
ないわけだし。
0974名無しさん@お腹いっぱい。
2007/04/16(月) 23:14:00でもだめ、
find ~/foo -iname '*.tex' | estcmd gather -il ja -sd casket -
でもだめ。
なんか大きな間違いをしてますか?
> 特に構造のない文字列です。デフォルトでは、ファイル名の接尾辞が「.txt」「.text
> 」「.asc」の場合にプレーンテキストとして扱われます。
はわかるんですが、デフォルト以外はどうしたらいいのかの説明がないから
迷ってしまう・・・
>第3引数としてファイル名を指定すると、そのファイルから処理対象のパスのリス
>トを読み込みます。
これもわかりにくかった。
-fxは、ファイル名の接尾辞に関連づけた外部コマンドを指定します。カンマ区切
りで複数の接尾辞を指定できます。「*」だと全てのファイルに一致します。コマ
ンド名の前に「T@」をつけるとその出力がプレーンテキストとして解析され、「H@
」をつけるとHTMLとして解析され、「M@」をつけるとMIMEとして解析され、いずれ
でもない場合は文書ドラフトとして解析されます。このオプションは複数回指定で
きます。
ここらへんなんでしょうが、私には意味わからんです。
この文章のあとにexampleが欲しいと思います。
0975名無しさん@お腹いっぱい。
2007/04/16(月) 23:18:27ここでもふつうのテキストをどうすれば読ませられるかってのは
わからない。うーん。
なんというか、もうひとつ流行らない理由がわかりました。
googleでも解説ページのようなものがひっかからないし。うーん。
なんか貢献したいんですが。
0976名無しさん@お腹いっぱい。
2007/04/16(月) 23:36:52% estcmd create tex_db
% find /usr/share/doc/ -name '*.tex' | estcmd gather -ft -fz tex_db -
みたいな感じでどう?
0977名無しさん@お腹いっぱい。
2007/04/16(月) 23:40:27'-ft'が読み込んだファイル全部をテキストファイルとして
扱うってオプションです。
0978名無しさん@お腹いっぱい。
2007/04/17(火) 07:25:55ありがとうございます。
0979名無しさん@お腹いっぱい。
2007/04/17(火) 19:58:52http://pc11.2ch.net/test/read.cgi/unix/1176807372/
0980774
2007/04/22(日) 11:22:42こちらのサイトでtestを検索
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?phrase=text&perpage=10&clip=8&navi=0&attr=&order=
すると関連キーワードとして
RelatRelated terms: text, rowspan, style, align, center, color, background, key
というふうに出てきますが、これって配布されているCGI、estseek.cgiでも出すようにできますか??
いろいろ調べているんですが、方法が一向に分からず。
ご存知の方いらっしゃったら教えて下さい。お願いします。
0981名無しさん@お腹いっぱい。
2007/04/23(月) 07:01:46http://hyperestraier.sourceforge.net/uguide-ja.html#estseek
> 設定ファイルの書式
> relkeynum : 表示する関連語の数を指定します。
では駄目だったということ?
・「いろいろ調べている」がいったいどこを調べたのか?
・実際に試した事
くらいは書こう。
0982名無しさん@お腹いっぱい。
2007/04/24(火) 22:21:29estseek.confのindexname: 部分では複数の記述ができませんでした。
0983名無しさん@お腹いっぱい。
2007/04/24(火) 22:57:29ノードマスタを叩け
0984名無しさん@お腹いっぱい。
2007/04/25(水) 22:37:44ありがとうございます。
DesktopHEを見ていると、対象を複数書いても1つのインデックス。
普通にgatherだけでは作れないかもしれないですが、こちらの方法も調べてみます。
0985名無しさん@お腹いっぱい。
2007/04/26(木) 02:50:530986名無しさん@お腹いっぱい。
2007/04/27(金) 07:31:49myfilter.batを作って、
type %1 > %2
としました。効率良い方法でしょうか?
0987名無しさん@お腹いっぱい。
2007/04/27(金) 09:08:24レス数が950を超えています。1000を超えると書き込みができなくなります。