全文検索エンジン Hyper Estraier 2
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
2007/04/17(火) 19:56:12http://hyperestraier.sourceforge.net/index.ja.html
0002名無しさん@お腹いっぱい。
2007/04/17(火) 19:57:06http://pc11.2ch.net/test/read.cgi/unix/1100221699/
0003名無しさん@お腹いっぱい。
2007/04/17(火) 21:59:350004名無しさん@お腹いっぱい。
2007/04/17(火) 22:08:40もっとも最近は、もっとダイレクトにcockらしいですが。
0005名無しさん@お腹いっぱい。
2007/04/18(水) 00:12:47乙
0006名無しさん@お腹いっぱい。
2007/04/18(水) 22:59:590007名無しさん@お腹いっぱい。
2007/04/19(木) 08:50:05「イサキ 大漁」で検索
0008名無しさん@お腹いっぱい。
2007/04/19(木) 17:49:02↓
↓
0009名無しさん@お腹いっぱい。
2007/04/19(木) 18:58:110010名無しさん@お腹いっぱい。
2007/04/22(日) 17:16:55ってひとのため。
http://green.ribbon.to/~ikazuhiro/lookup/ndest.html
0011名無しさん@お腹いっぱい。
2007/04/22(日) 20:12:080012774
2007/04/23(月) 01:14:13http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?clip=8
こちらのサイトでtestを検索
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?phrase=text&perpage=10&clip=8&navi=0&attr=&order=
すると関連キーワードとして
Related terms: text, rowspan, style, align, center, color, background, key
というふうに出てきますが、これって配布されているCGI、estseek.cgiでも出すようにできますか??
いろいろ調べているんですが、方法が一向に分からず。
ご存知の方いらしたら改造のしかた教えて下さい。
0013名無しさん@お腹いっぱい。
2007/04/24(火) 22:20:44estseek.confのindexname: 部分では複数の記述ができませんでした。
001413
2007/04/24(火) 22:22:080015名無しさん@お腹いっぱい。
2007/05/02(水) 19:49:280016名無しさん@お腹いっぱい。
2007/05/02(水) 20:50:020017名無しさん@お腹いっぱい。
2007/05/02(水) 21:16:15http://athlon64.fsij.org:8080/wikipedia/relwords.tsv.bz2
は
http://athlon64.fsij.org/wikipedia/relwords.tsv.bz2
のようですが、not found なのです。
wikipediaのデータを使っているようなので、GNU FDL に基づいて
作者に直接請求しなければならないのでしょうかね。
001816
2007/05/02(水) 22:17:48ところでGNU FDLに基づいて公開義務が生じる根拠って何かあるの?
0019名無しさん@お腹いっぱい。
2007/05/03(木) 13:45:41http://athlon64.fsij.org/~mikio/wikipedia/relwords.cgi
0020名無しさん@お腹いっぱい。
2007/05/06(日) 11:58:48http://athlon64.fsij.org/~mikio/wikipedia/relwords.qdb
0021名無しさん@お腹いっぱい。
2007/05/07(月) 11:24:34多謝です。
0022名無しさん@お腹いっぱい。
2007/06/12(火) 00:07:480023名無しさん@お腹いっぱい。
2007/06/12(火) 15:08:13作者さんはずっとあっちの人だ
0024名無しさん@お腹いっぱい。
2007/06/20(水) 03:25:39rubyの二つの bindingもどういう得失があるんだろう..
やっぱり purerubyだとちょっと遅いとか??
ちょっとソースに diveしてくる。
0025名無しさん@お腹いっぱい。
2007/07/02(月) 22:06:30http://japan.cnet.com/news/media/story/0,2000056023,20352009,00.htm
Hyper Estraier あげ
0026名無しさん@お腹いっぱい。
2007/07/03(火) 09:54:120027名無しさん@お腹いっぱい。
2007/07/04(水) 20:56:32上にあったlookupじゃ使いにくいです。
リターン一発で編集したいです。
0028名無しさん@お腹いっぱい。
2007/08/26(日) 14:16:34そのままレン鯖にうpしても動かないですかね?
試用段階なのだけど、なにか違うんだろうか。
002928
2007/08/26(日) 15:33:46そっちをテストしたらうまくいきました。
付属CGIが動かない理由はまだわからないけど、
自分でもいまいち整理できてないですし、
estseek.cgiは使わないので質問は取り下げます。
ごめりんこですm(_ _)m
0030名無しさん@お腹いっぱい。
2007/09/04(火) 21:14:26流れてるが、作者はマージせんのか。
中華、作者はメンテしてんのか?
0031名無しさん@お腹いっぱい。
2007/09/05(水) 02:18:45mixi移籍後社内業務で手一杯なのか開発速度が大幅に落ちた希ガス
0032名無しさん@お腹いっぱい。
2007/09/05(水) 11:32:08http://tokyocabinet.sourceforge.net/
つーか代わりにメンテナに立候補する香具師はおらんかなあと思う今日このごろ。
0033名無しさん@お腹いっぱい。
2007/10/28(日) 19:54:12開発スピードが遅くなるのはいいんだけど、放置プレイだけが心配だなぁ。
Tokyo Cabinet で QDBM の不満点を解消したとかいってるし、QDBM 放置 → H.E. も放置な流れの気配が…
0034名無しさん@お腹いっぱい。
2007/11/05(月) 14:51:27mysqlのエラーで止まります。何かいい方法ありますか?
0035名無しさん@お腹いっぱい。
2007/11/06(火) 00:03:34どういう使い方をしているのか、それを説明したまえ
003634
2007/11/06(火) 19:34:03レスありがとうございます。
hyperestraierとacts_as_searchableというrailsのプラグインを使って、全文検索を行いたいと考えています。
acts_as_searchableに備わっているreindex!というメソッドを実行すると、インデックスが構築される仕様になっているのですが、
これを実行すると、だんだん処理が重くなり、最終的にはMysql::Error: Lost connection to MySQL server during queryというエラーが出てしまいます。
reindex!というメソッドはデフォルトでは対象になるレコードを一気にメモリにのせてしまうので、
そのあたりは負荷を減らすようなコードに修正して実行しています。
(このような感じです。ttp://d.hatena.ne.jp/yune_kotomi/20070912/1189617411)
hyperestraierのメーリングリストで、mysqlのLost Connectionを改善する
mysql_retry_lost_connectionというrailsのプラグインを教えて頂いたのですが、
インストールしても効果がなく、どうも、接続が切れる前の段階でつまずいているような気がします。
対象レコード数は100万弱で、途中で止まってしまいましたが、
#docs => 22897、#words => 196666まではいけました。
なにかアドバイスいただければ幸いです。
よろしくお願いします。
0037名無しさん@お腹いっぱい。
2007/11/07(水) 11:56:45単にタイムアウトしているだけのような気が...
0038名無しさん@お腹いっぱい。
2007/11/08(木) 01:02:450039名無しさん@お腹いっぱい。
2007/11/08(木) 08:42:090040名無しさん@お腹いっぱい。
2007/11/08(木) 22:48:10残念ながら俺は MySQL と組み合わせたことも Rails も使ったことがないからよくわからん。
つか普通 MySQL で全文検索するんだったら Senna じゃね?
0041名無しさん@お腹いっぱい。
2007/11/11(日) 18:28:540042名無しさん@お腹いっぱい。
2007/11/12(月) 00:50:42のがダメな点だな。
作者の手を煩わせてはいかんよ。
0043名無しさん@お腹いっぱい。
2007/11/12(月) 08:59:50著作権保持者を維持してるので、開発コミュニティの形成はforkでもしないと
無理だよ。
0044名無しさん@お腹いっぱい。
2007/11/12(月) 10:29:240045名無しさん@お腹いっぱい。
2007/11/12(月) 10:59:560046名無しさん@お腹いっぱい。
2007/11/12(月) 19:53:490047名無しさん@お腹いっぱい。
2007/11/21(水) 14:39:17[UVSET]してるけどなー
0048名無しさん@お腹いっぱい。
2007/11/21(水) 14:44:41属性検索で速く検索する方法ありますか
0049名無しさん@お腹いっぱい。
2007/11/21(水) 18:22:16それ属性インデクス追加のオプションだっけ?
おれは
estcmd create -attr @uri str idx
とかやって属性インデクス付けたよ.
1000万件位のレコード数だったけど,URI検索は体感できるほど
速くなった.
0050名無しさん@お腹いっぱい。
2007/11/29(木) 10:43:00で、いざ新バージョンが出たら沈黙ってなんだよ。
0051名無しさん@お腹いっぱい。
2007/11/29(木) 13:26:34> 最新のソースパッケージ(バージョン1.4.12)
あれ、いつの間に。
ML 入ってるけどリリース情報なかったぞ。
何にせよ復活age.
ただ、ChangeLog 見る限り、
2007-11-18 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c: code clean-up.
- Bugs related to type casting of perl binding were fixed.
- Release: 1.4.12
2006-11-11 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c (est_resmap_add): "method" argument was added.
* estraier.c (est_inode): a bug related to overflow was fixed.
* estraier.c (est_narrow_score): a bug related to attribute distinction was fixed.
* estraier.c (est_search_union): search accuracy with trailing uni-gram was improved.
* estmaster.c (searchlocal): a bug related to scanning with regular expressions was fixed.
* estscout.c (realmain): "union", "score", and "idsuffix" attributes were added.
* estsupt.c (realmain): "score" attribute was added.
* estsupt.c (procsearch): accuracy of hint was improved.
* estsupt.c (realmain): "logmsg" parameter was added.
* estscout.c (realmain): "distinct" parameter was added.
* estscout.c (showresult): cache clear at random was added.
- Release: 1.4.11
ここのところ精力的に ML に投げられてたパッチはマージされてなさげ?
0052名無しさん@お腹いっぱい。
2007/12/05(水) 19:46:42なんとかならんですかね。
0053名無しさん@お腹いっぱい。
2007/12/06(木) 19:59:56http://www.osstech.co.jp/product/chimera
> 構築コンポーネントに以下のOSS(オープンソースソフトウェア)を利用
> しているため、安価に導入できるのに高性能・高機能を発揮します。
> * プログラム言語: Rubyおよび Ruby On Rails
> * 全文検索システム : Hyper Estraier
0054名無しさん@お腹いっぱい。
2007/12/22(土) 14:50:01會→会
懷→懐
みたいに異体・旧字体・繁体・簡体をまとめてくれるといいのに。
estraier.c のなかの canonize なんとか関数に誰かちょっちょっと書き加えてくれ。
0055名無しさん@お腹いっぱい。
2007/12/22(土) 15:24:27こういう製品って虚しいよね。
だって、導入60万、年12万だったらGoogle MINIの方が
安いし、ハードウェア込みの提供だからメンテフリーだし。
実際,うちの会社はWWW用はGoogleMINI にした。
部内サーバは自分でHyper Estraierをいれた。
0056名無しさん@お腹いっぱい。
2007/12/22(土) 17:12:45それはそうなんだが、Google MINIってちっとも社内のニーズに合わせてくれなくて不満がでるんだよな。
ページの計算もなんか適当に丸められちゃうし。
0057名無しさん@お腹いっぱい。
2007/12/24(月) 16:00:59acts_as_searchableの未完成具合に泣いたけどww
Rails系のエンジニアに聞くと皆使ってるし、
結構いろんなサービスでも使ってるみたい。
■ このスレッドは過去ログ倉庫に格納されています