Namazu全文検索システム
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
2001/06/14(木) 09:17ID:???http://www.namazu.org/
日本語全文検索エンジンソフトウェアのリスト
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html
前スレ http://tako.2ch.net/test/read.cgi?bbs=perl&key=981352718
0002名無しさん@お腹いっぱい
2001/06/14(木) 15:26ID:???0003名無しさん@お腹いっぱい。
2001/06/15(金) 01:24ID:???作り直しきぼん。
0004名無しさん@お腹いっぱい。
2001/07/05(木) 09:41ID:???namazuってやっぱり負荷かかるのかな。
0005名無しさん@ディストリいっぱい
2001/07/05(木) 10:22ID:wD33sdDIindex作る時にはCPU使用率100%になります。
項目がいくつもあるとかなりツライです。
↓うちのNamazu
http://2ch.dyn.to/
0006名無しさん@お腹いっぱい。
2001/07/05(木) 17:05ID:???すご・・・
0008名無しさん@お腹いっぱい。
2001/07/09(月) 00:57ID:muVIdrhshttp://www.amays.com/~mizusawa/namazu_kaisetu/noSUinstall.html
当方レンタルサーバー 専用サーバー持つ金ありません。
C言語は使えます。負荷のかからないように、自分のマシンでindex作ればいいかな。
っていうかレンタルサーバー会社に聞かずにやっちゃって、かまわんかしら(汗
0009名無しさん@お腹いっぱい。
2001/07/25(水) 04:10ID:OjwNZy2Ihttp://www1.odn.ne.jp/mimizun/
0010名無しさん@お腹いっぱい。
2001/07/25(水) 18:41ID:smjKvwXM0011名無しさん@お腹いっぱい。
2001/08/01(水) 18:06ID:ix6uIOfU0012ナナ萌え(゚д゚)ウマー
2001/08/02(木) 00:34ID:???0013名無しさん@お腹いっぱい。
2001/08/04(土) 01:50ID:aNwZ.JX.穴。まさぐられると逝ってしまうぞ。
0014名無しさん@お腹いっぱい。
2001/08/10(金) 14:53ID:A94SLV6Y0015初心者
2001/08/11(土) 11:52ID:???いらないファイル(テンプレート等)も多いと思います。
結局必ず必要なファイルってどれなんですか?
0016名無しさん@お腹いっぱい。
2001/08/12(日) 00:26ID:???んー俺もそう言えばわからん、
もともと、俺にとって、このNamazu初めの頃難しすぎた。
その前に、うなぎ食いたいんだよね。腹減ってきた・・・
0017NAMANAMA
2001/08/12(日) 01:02ID:TrSLsWVYでも、さすがにインデックスの作成は共有サーバでやるのも申し訳ないので、ローカルで作ってあげてます。
そういう場合って、namazu.cgi, .namazurc, Template, Index以外は全部テデリっても問題ないですかね?
それと、やっぱ、インデックスをcrontabで定期的に共有サーバで作ったら迷惑でしょうか?
マジレスお願いします。
0018むぎ茶
2001/08/12(日) 01:08ID:???ばれなければ問題無い。
┐(´ー`)┌
┏━━━━━━━━━┓
┃('Д')y ─┛~~ ┃
┃むぎ茶 ┃
┃mugicha@360.cc ┃
┗━━━━━━━━━┛
0019名無しさん@お腹いっぱい。
2001/08/12(日) 01:24ID:???負荷はかからないけど、ローカルは、めんどくせぇ(涙
0020名無しさん@お腹いっぱい。
2001/08/12(日) 17:40ID:KkZ3OuWwNamazu.pmってあまり人気がないんですか?
参考スクリプト(書籍・サイト)がなかなか見つからなくって
何かありませんか?
0021名無しさん@お腹いっぱい。
2001/08/15(水) 21:03ID:???ない、と思う。
まあしかし機能はシンプルなことこのうえないので、
利用にあたってそんなに難しいこともないと思うけど。
Ruby 用のモジュール rbnamazu.rb の方機能は多そうだ。
0022名無しさん@お腹いっぱい。
01/08/28 05:33ID:aw.N/Mcoとりあえず2ちゃんねる全板検索可能です。
http://mimizun.mine.nu/
0023名無しさん@お腹いっぱい。
01/08/28 21:59ID:1JnfOa0A0024名無しさん@お腹いっぱい。
01/08/29 00:17ID:TsF5AU7kこれ、すげぇじゃん。
0025名無しさん@お腹いっぱい。
01/08/29 02:52ID:1UTTw6kkどこが?
0026名無しさん@お腹いっぱい。
01/08/30 12:01ID:8CpRLBMo0027名無しさん@お腹いっぱい。
01/08/30 12:11ID:3TFNK/cINamazuで検索できるのは「ファイル」だけのようです。
0028名無しさん@お腹いっぱい。
01/08/30 23:03ID:YzLgVA/.0029名無しさん@お腹いっぱい。
01/09/10 22:31ID:2EURowzoみずずん大丈夫?
0030名無しさん@お腹いっぱい。
01/09/10 22:32ID:???0031名無しさん@お腹いっぱい。
01/09/11 12:11ID:liJMw8bE0032名無しさん@お腹いっぱい。
01/09/17 18:14ID:???filter 書いてくれ。
0033名無しさん@お腹いっぱい。
01/09/17 18:18ID:dMB6uEtMNamazuシステムの構築と活用, ソフトバンク
やっぱこれじゃない?
0034名無しさん@お腹いっぱい。
01/09/17 18:21ID:FURvtMLg0035名無しさん@お腹いっぱい。
01/09/17 23:18ID:???よく知らないけど、pgnmz はPostgreSQLにNamazuのインデックスを
入れておいて、DBにクエリー投げて検索結果を出すという感じっぽいので、
テーブル内容検索とはちがうっぽい。
ttp://search.namazu.org/ml/namazu-users-ja/msg01550.html
0036名無しさん@お腹いっぱい。
01/09/20 17:20ID:TUOJrHAwソースがまんま出ちゃうんですけど。
0037名無しさん@お腹いっぱい。
01/09/26 22:51ID:9178Yr9sPHP の出力を検索させたいのなら出力した結果をファイルにして
それにインデックスをかけるとかしないと無理。
003836
01/09/27 00:11ID:IzjiFxn2「出力した結果をファイルにする」ってのは、phpでですか?
なんかそこら辺のこと詳しく書いてあるサイトが無いんで…。
Namazuシステムの構築本に書いてないかなー
0039名無しさん@お腹いっぱい。
01/09/27 01:15ID:???php のことよく知らないけど
php scriptname.php ってやったら出力されないかな?
ところで俺も質問なんだけど、namazu.cgi って検索後は
ファイルへのリンクを http://hostname/hogehogeで出力するけど、
こいつを file://hogehoge にする方法って無い?
windows でローカルファイルの検索に使いたいんだけど WEB で
探しても見つからなかった。
0040名無しさん@お腹いっぱい。
01/09/27 17:20ID:IzjiFxn2php scriptname.phpだとコマンドすら無いって言われてしまう。
指定先は.namazurcってファイルで設定できる↓参照
http://village.infoweb.ne.jp/~fwnk1502/data/howto2.htm#namazurc
0041名無しさん@お腹いっぱい。
01/09/27 22:04ID:clsPKe1Y>>39 はインデックス作成時に
mknmz --replace='s#^#file:///'
とかでもいけそうだけどどうよ。
004239
01/10/01 05:28ID:UjeefWpE>>40
.namazurc で
Replace http://localhost/ file://
と指定してみてたんだけど、どうやら無効の模様。
この部分(http://hostname)は固定で出力してるのかな?
>>41
やってみたけどだめっぽい。
でも他にそれらしいオプションも見つからないね・・・
こういう変な事やる時は cgi 改造しか無いのか、とほほ。
pnamazu か rbnamazu に挑戦してみよう。
ところで >>40 はうまくいったかな?
アパッチのモジュール lib_php3.so (だっけ?) しか
インストールされてない時は >>41 の 言う通りコマンド
ラインで使えるようにしよう。手動で最初からやってみ
たこと無いので詳しい説明できなくてごめん。
004340
01/10/04 19:40ID:4sun3RUk>> 39
うちは
Replace /C\|/docume~1/admini~1/mydocu~1/mywebs~1/ http://ark/
みたいな感じになってる。ちなみにこの行と
Lang ja_JP.SJISと書かれた行以外は全てコメントアウト
php検索はコマンドラインで使えるように設定してみます。
というかコマンドラインで使えるようにする方法すら知らないんだけど。
どこか書いてるとこ知りません? 本でも良いんですけど。
0044アナログから光までオッケー
01/10/05 02:03ID:7kq.xdqkスピードを計ってくれます。また、遅いと思う
人は設定を少し変えることによって無料で
スピードを早くすることができます。
お金を出す前に一度試してみては
いかがでしょうか。上がりの計測も可能です。
http://cym10262.omosiro.com/
004522
01/10/05 02:47ID:UlE8Ntsc0046名無しさん@お腹いっぱい。
01/12/09 11:02ID:eU0f+J4K一応FAQに書いてあることは試したつもりなんだが・・・。
どうも特定のファイルの時にそうなってるみたい。
なんか落ちやすい文字とか、そういうのあるんかな?
0047名無しさん@お腹いっぱい。
01/12/10 22:24ID:UuNX8sYB0048名無しさん@お腹いっぱい。
01/12/15 22:02ID:???もしくは本当にメモリ(+仮想メモリ)が足りないか。
0049名無しさん@お腹いっぱい。
02/01/04 06:04ID:HxTTmUTvprint strftime "%Y%m%d\n", localtime;
こう書くと年月日が出るじゃないですか。
この日付けに7を足す事ってできます???
0050名無しさん@お腹いっぱい。
02/01/04 06:04ID:???マルチうざい
資ね!
0051名無しさん@お腹いっぱい。
02/01/04 23:19ID:???逝って良し。
■解説■
マルチは下げ進行で微妙に煽りつつシカトします
上記例のように古典的な煽りは「逝って良し」
他にアスキーアートを使ったものなど多彩ですが、
サーバーの不可を考慮してかあまり好まれません。
やはりシンプルに「氏ね」など短文なものがベストです。
0052名無しさん@お腹いっぱい。
02/01/09 18:03ID:???0053名無しさん@お腹いっぱい。
02/01/12 04:40ID:???0054名無しさん@お腹いっぱい。
02/01/13 16:11ID:???0055名無しさん@お腹いっぱい。
02/01/13 19:32ID:???再利用というか、もっかい盛り上がることが出来ないスレなんですか?(笑)
0056名無しさん@お腹いっぱい。
02/01/25 06:48ID:YyTiWZ/90057名無しさん@お腹いっぱい。
02/02/18 08:00ID:TWCf5+1d00581001 Over 1000 Thread
02/02/18 10:21ID:Qb17d1xdもう書けないので、新しいスレッドを立ててくださいです。。。
0059名無しさん@お腹いっぱい。
02/02/19 07:42ID:DggBq+7H0060名無しさん@お腹いっぱい。
02/02/20 22:28ID:???全文検索エンジンNamazu @ Unix板
http://pc.2ch.net/test/read.cgi/unix/1009715036/l50
0061nobodyさん
02/03/11 21:08ID:Jt12j7IU変に文節で区切らずに、googleみたいに普通に検索してくれたら
それでいいのに。。
0063nobodyさん
02/03/12 07:59ID:qMnzd5b/これのこと?
>日本語がでたらめにわかち書きされてしまう
>{ [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、
>でたらめにわかち書きされることがあります。
>これは、そもそも最新情報という言葉が検索対象に含まれないことを意味します。
>検索はあきらめましょう。
それとも、インデックス作るときの分かち書きをしないでほしい、ってこと?
それって実現できるのか?
0064nobodyさん
02/03/18 17:35ID:???0065nobodyさん
02/03/19 11:29ID:ulLvfL7+日本語は解析していないように見えるけど…。
英語はスペースでわけるだけだから楽だね。
それにしてもgoogleはスペルミスの修正判断も出してくれたりすごい。
つーか20億ページを0.1秒で検索できるのが単純にすごいと思うのだが。
ローカルでほしい、、
0066nobodyさん
02/03/19 12:54ID:TPtrOTqRgoogleも分かち書きしてるらしい、という実験結果がある。
検索エンジンのしくみ教えます
http://www.google.com/search?hl=ja&ie=Shift_JIS&oe=Shift_JIS&q=cache%3AALmw0POy8V4C%3Awww.mars.sphere.ne.jp%2Fengine%2Fchap_g1.htm+site%3Awww.mars.sphere.ne.jphl%3Dja+Google&lr=lang_ja
なんか 403 forbidden になってるんでgoogleのキャッシュで見てね。
0067nobodyさん
02/03/19 14:31ID:???ほんとだ。分かち書きしてる、、
うむ、googleはちゃんと各言語ごとにチューンしてるんですね。
0068nobodyさん
02/03/19 15:32ID:TPtrOTqRgoogle並みのことはできるってことだよね
(もちろん、PageRank とかは抜きにして)。
いつも kakasi だけど、Chasen を使ってみようかなあ・・・。
0069nobodyさん
02/03/19 15:52ID:???0070nobodyさん
02/03/19 20:25ID:???googleの肝は結果の表示順序。(pagerankもそれを支える情報の一つ)
なので、namazuに少し手を入れたぐらいではgoogle並にはならないよ。
ヒット数が少ない場合、関係ないけど。
0071nobodyさん
02/03/19 20:38ID:???その点は激しく同意。
ただ、分かち書きの精度を上げることで、
>>61 のやりたいことは実現できるんじゃないかな、って思った。
0072nobodyさん
02/04/24 13:48ID:???0073ato
02/05/09 14:31ID:8gc3nIf40074nobodyさん
02/05/10 00:55ID:???0075nobodyさん
02/05/10 02:55ID:???いまさらだが、NamazuへのPageRankの実装は、この論文が有名。
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html
0077nobodyさん
02/05/10 20:41ID:??? ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄ (´´
∧∧ ) (´⌒(´
⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
 ̄ ̄ (´⌒(´⌒;;
ズザーーーーーッ
0078nobodyさん
02/05/24 03:19ID:???0079nobodyさん
02/05/27 19:51ID:LrpMVRitWWW検索エンジンサイト
http://pc.2ch.net/test/read.cgi/esite/973436559/l50
0080nobodyさん
02/06/06 04:44ID:jW1FwXu20081nobodyさん
02/06/09 00:21ID:MvwsaEnIhttp://freshmeat.net/projects/snatcher/
0082山拓変態問題
02/06/20 09:30ID:???0083nobodyさん
02/06/20 09:39ID:updula6Fわからん、俺がアフォなだけか?
0084nobodyさん
02/06/20 12:41ID:0pQ6ektuID3タグでも検索するのか?
そういうのは ふつー DB 使うだろ。
008682=85
02/06/20 15:34ID:???スレ違いスマソ。
0087nobodyさん
02/06/25 01:01ID:cgKxt6dSなるほど、mp3 の中に埋め込まれたテキストも「文書」として扱い、
検索対象としたい、ってわけね。全然変じゃない。むしろ面白い。
やってることは google のイメージ検索みたいな感じかな。
perl でサクッと書けそうな雰囲気。
ぜひトライしてみて。
あと、Web プログラミングとは関係ないけど、
Namazu に関係あればいいと思うよ。
0088nobodyさん
02/06/25 02:46ID:???むちゃくちゃ関係あるじゃん。
> やってることは google のイメージ検索みたいな感じかな。
イメージ検索は外部から関連性を持ってくるのでちと違うような。
内部のID3だけだったらPDF検索くらいに対応するだろう。
ぜんぜんNamazuじゃなくても良さそうだけど、他と串刺し検索するなら
やっぱり便利かも。
0089nobodyさん
02/08/12 22:58ID:???0090nobodyさん
02/09/02 23:28ID:???0091nobodyさん
02/09/20 08:19ID:???0092nobody
02/09/21 15:05ID:???検索結果で表示されるファイルの先頭部分のサイズを変更できますか?
やりかたを教えて下さい。
0093nobodyさん
02/09/25 08:37ID:3VOnIdJAでURLテキスト-iで、ディレクトリ作成-x
しながらページ拾ってくると、
稀にディレクトリ作成(www.aaa.xxx)されなくて
関係ないディレクトリ(www.bbb.xxx)にページを
格納してしまいます。
このままindex作るとURLリンクが関係ないところに。
どうしてだろう。困った。
0094nobodyさん
02/09/27 20:30ID:7S/gcFrV0095nobodyさん
02/09/28 02:50ID:gf1ROtiYピュー( ‘ д‘)
=〔~∪ ̄ ̄〕
=◎−−◎
0096名無しさん@お腹いっぱい。
02/10/07 17:04ID:ucR8g7pl(' д ‘)ピュー
〔~∪ ̄ ̄〕=
◎−−◎=
づかれたゾイ
0097名無しさん@お腹いっぱい。
02/10/07 17:05ID:ucR8g7pl0098nobodyさん
02/11/02 15:20ID:Jwe6TBuD0099Windows における namazu w/chasen
02/11/03 10:47ID:rQsphwgxhttp://www.namazu.org/ml/namazu-win32-users-ja/msg00671.html
http://www.namazu.org/ml/namazu-win32-users-ja/msg00672.html
http://www.namazu.org/ml/namazu-win32-users-ja/msg00692.html
を見ると、2001/05 時点で chasen を使ったインデックス作成は
cygwin 環境で行うことができるようですが、
現在も chasen を使おうとすると cygwin 上で行うのが妥当でしょうか?
0100Windows における namazu w/chasen
02/11/03 11:17ID:???Chasen 2.0.2 は cygwin 上で問題なくコンパイルできました。
0101Windows における namazu w/chasen
02/11/03 11:33ID:???cygwin のデフォルトの perl 関連のパッケージでは File::MMagic はインストールされないので、
CPAN http://search.cpan.org/dist/File-MMagic/ からダウンロードしてきて
あらかじめ (configure の前に) インストールしておく必要があります。
■ このスレッドは過去ログ倉庫に格納されています