トップページunix
298コメント107KB

全文検索エンジン Hyper Estraier 2

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。2007/04/17(火) 19:56:12

http://hyperestraier.sourceforge.net/index.ja.html

0002名無しさん@お腹いっぱい。2007/04/17(火) 19:57:06
前スレ
http://pc11.2ch.net/test/read.cgi/unix/1100221699/
0003名無しさん@お腹いっぱい。2007/04/17(火) 21:59:35
「はっ!はぁぁぁあんっ!ナ、ナマズは?ナマズは、こ、超えたの??」
0004名無しさん@お腹いっぱい。2007/04/17(火) 22:08:40
いいえ、タイにご執心の気違い次男がいる限り、なまずは不滅です。
もっとも最近は、もっとダイレクトにcockらしいですが。
0005名無しさん@お腹いっぱい。2007/04/18(水) 00:12:47
>>1
0006名無しさん@お腹いっぱい。2007/04/18(水) 22:59:59
こんなところにエロゲーのスレが!??
0007名無しさん@お腹いっぱい。2007/04/19(木) 08:50:05
>>6
「イサキ 大漁」で検索
0008名無しさん@お腹いっぱい。2007/04/19(木) 17:49:02
インストール方法から検索方法までの詳細

0009名無しさん@お腹いっぱい。2007/04/19(木) 18:58:11
つGoogle
0010名無しさん@お腹いっぱい。2007/04/22(日) 17:16:55
いちいちhttpdなんか動かしてられるか!
ってひとのため。
http://green.ribbon.to/~ikazuhiro/lookup/ndest.html
0011名無しさん@お腹いっぱい。2007/04/22(日) 20:12:08
フロントエンド、統一してくれんかのぅ
00127742007/04/23(月) 01:14:13
前スレとの二重カキコご免なさい。
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?clip=8
こちらのサイトでtestを検索
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?phrase=text&perpage=10&clip=8&navi=0&attr=&order=
すると関連キーワードとして
Related terms: text, rowspan, style, align, center, color, background, key
というふうに出てきますが、これって配布されているCGI、estseek.cgiでも出すようにできますか??
いろいろ調べているんですが、方法が一向に分からず。
ご存知の方いらしたら改造のしかた教えて下さい。
0013名無しさん@お腹いっぱい。2007/04/24(火) 22:20:44
複数のインデックスを作っておいて、同時に検索できるのでしょうか?
estseek.confのindexname: 部分では複数の記述ができませんでした。
0014132007/04/24(火) 22:22:08
すみません。前スレに移動しました。
0015名無しさん@お腹いっぱい。2007/05/02(水) 19:49:28
relwords.qdb って何処で入手できるんでしょうか。
0016名無しさん@お腹いっぱい。2007/05/02(水) 20:50:02
ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11373623770980940568&focus=1

0017名無しさん@お腹いっぱい。2007/05/02(水) 21:16:15
>>16
http://athlon64.fsij.org:8080/wikipedia/relwords.tsv.bz2

http://athlon64.fsij.org/wikipedia/relwords.tsv.bz2
のようですが、not found なのです。

wikipediaのデータを使っているようなので、GNU FDL に基づいて
作者に直接請求しなければならないのでしょうかね。
0018162007/05/02(水) 22:17:48
俺なら作者に「お願い」するけどな。

ところでGNU FDLに基づいて公開義務が生じる根拠って何かあるの?
0019名無しさん@お腹いっぱい。2007/05/03(木) 13:45:41
ここで改変されたデータへのアクセスを提供してる。
http://athlon64.fsij.org/~mikio/wikipedia/relwords.cgi
0020名無しさん@お腹いっぱい。2007/05/06(日) 11:58:48
これだろ
http://athlon64.fsij.org/~mikio/wikipedia/relwords.qdb
0021名無しさん@お腹いっぱい。2007/05/07(月) 11:24:34
>>20
多謝です。
0022名無しさん@お腹いっぱい。2007/06/12(火) 00:07:48
KaMailV3もここで良い?
0023名無しさん@お腹いっぱい。2007/06/12(火) 15:08:13
xyzzyのスレがあるべ。
作者さんはずっとあっちの人だ
0024名無しさん@お腹いっぱい。2007/06/20(水) 03:25:39
estcmd search -ord のあとに何をかけばいいのかわかんねー。
rubyの二つの bindingもどういう得失があるんだろう..
やっぱり purerubyだとちょっと遅いとか??
ちょっとソースに diveしてくる。
0025名無しさん@お腹いっぱい。2007/07/02(月) 22:06:30
mixiが自社開発の検索エンジンに移行、ウェブ検索はYSTに:ニュース - CNET Japan
http://japan.cnet.com/news/media/story/0,2000056023,20352009,00.htm

Hyper Estraier あげ
0026名無しさん@お腹いっぱい。2007/07/03(火) 09:54:12
mixy日記はコーパスとしておもしろそうだよねえ。
0027名無しさん@お腹いっぱい。2007/07/04(水) 20:56:32
namazu.el と同じようなフロントエンドおねがいしますー。

上にあったlookupじゃ使いにくいです。
リターン一発で編集したいです。

0028名無しさん@お腹いっぱい。2007/08/26(日) 14:16:34
Windowsバイナリ版で作成したインデクスと付属CGI(estseek.cgi及び関連ファイル)は
そのままレン鯖にうpしても動かないですかね?
試用段階なのだけど、なにか違うんだろうか。
0029282007/08/26(日) 15:33:46
ご、ごめん、いずれにしてもRubyからアクセス(検索)することになるので
そっちをテストしたらうまくいきました。
付属CGIが動かない理由はまだわからないけど、
自分でもいまいち整理できてないですし、
estseek.cgiは使わないので質問は取り下げます。
ごめりんこですm(_ _)m
0030名無しさん@お腹いっぱい。2007/09/04(火) 21:14:26
ちかごろ良さげなパッチがMLに
流れてるが、作者はマージせんのか。
中華、作者はメンテしてんのか?
0031名無しさん@お腹いっぱい。2007/09/05(水) 02:18:45
確か1.4.9と1.4.10の間も長かったな。
mixi移籍後社内業務で手一杯なのか開発速度が大幅に落ちた希ガス
0032名無しさん@お腹いっぱい。2007/09/05(水) 11:32:08
Tokyo Cabinet なんてのも作ってるしなあ。 QDBM ともども H.E. もこのまま放置されたりして。
http://tokyocabinet.sourceforge.net/

つーか代わりにメンテナに立候補する香具師はおらんかなあと思う今日このごろ。
0033名無しさん@お腹いっぱい。2007/10/28(日) 19:54:12
>>32
開発スピードが遅くなるのはいいんだけど、放置プレイだけが心配だなぁ。
Tokyo Cabinet で QDBM の不満点を解消したとかいってるし、QDBM 放置 → H.E. も放置な流れの気配が…
0034名無しさん@お腹いっぱい。2007/11/05(月) 14:51:27
100万レコードくらいのインデックスを作成したいのですが、
mysqlのエラーで止まります。何かいい方法ありますか?
0035名無しさん@お腹いっぱい。2007/11/06(火) 00:03:34
そもそもmysqlのエラーというのが発生する経緯がわからん
どういう使い方をしているのか、それを説明したまえ
0036342007/11/06(火) 19:34:03
>35

レスありがとうございます。
hyperestraierとacts_as_searchableというrailsのプラグインを使って、全文検索を行いたいと考えています。

acts_as_searchableに備わっているreindex!というメソッドを実行すると、インデックスが構築される仕様になっているのですが、
これを実行すると、だんだん処理が重くなり、最終的にはMysql::Error: Lost connection to MySQL server during queryというエラーが出てしまいます。

reindex!というメソッドはデフォルトでは対象になるレコードを一気にメモリにのせてしまうので、
そのあたりは負荷を減らすようなコードに修正して実行しています。
(このような感じです。ttp://d.hatena.ne.jp/yune_kotomi/20070912/1189617411)

hyperestraierのメーリングリストで、mysqlのLost Connectionを改善する
mysql_retry_lost_connectionというrailsのプラグインを教えて頂いたのですが、
インストールしても効果がなく、どうも、接続が切れる前の段階でつまずいているような気がします。

対象レコード数は100万弱で、途中で止まってしまいましたが、
#docs => 22897、#words => 196666まではいけました。

なにかアドバイスいただければ幸いです。
よろしくお願いします。







0037名無しさん@お腹いっぱい。2007/11/07(水) 11:56:45
そのMySQLのqueryとやらは、その先の処理が何時間かかろうともいつまでも待ってくれるの?
単にタイムアウトしているだけのような気が...
0038名無しさん@お腹いっぱい。2007/11/08(木) 01:02:45
つーかMLとマルチ?やるなあおい
0039名無しさん@お腹いっぱい。2007/11/08(木) 08:42:09
作者こないね

0040名無しさん@お腹いっぱい。2007/11/08(木) 22:48:10
マルチっていうより、ML で有効なレスポンスがないからこっちにも、ってことだろう。
残念ながら俺は MySQL と組み合わせたことも Rails も使ったことがないからよくわからん。
つか普通 MySQL で全文検索するんだったら Senna じゃね?
0041名無しさん@お腹いっぱい。2007/11/11(日) 18:28:54
いや、だからさ、作者はメンテする意思あんのか、と。
0042名無しさん@お腹いっぱい。2007/11/12(月) 00:50:42
メンテナンスに関しては、開発者コミュニティが形成されていない
のがダメな点だな。

作者の手を煩わせてはいかんよ。
0043名無しさん@お腹いっぱい。2007/11/12(月) 08:59:50
いやでもパッチ投げても直接マージされるわけじゃなく、本人がリライトして
著作権保持者を維持してるので、開発コミュニティの形成はforkでもしないと
無理だよ。
0044名無しさん@お腹いっぱい。2007/11/12(月) 10:29:24
作者がmixiじゃなくgoogleに就職していれば…
0045名無しさん@お腹いっぱい。2007/11/12(月) 10:59:56
googleに行ったフーリソフトウェア者も沈黙しちゃってる件(泣)

0046名無しさん@お腹いっぱい。2007/11/12(月) 19:53:49
マイクロソフトはソース見たらフリーウェアに参加で着なくなるけどほかのも?
0047名無しさん@お腹いっぱい。2007/11/21(水) 14:39:17
estseek.cgiで属性検索しても結果に出てこないのはなんで?
[UVSET]してるけどなー
■ このスレッドは過去ログ倉庫に格納されています