Namazu全文検索システム
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
2001/06/14(木) 09:17ID:???http://www.namazu.org/
日本語全文検索エンジンソフトウェアのリスト
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html
前スレ http://tako.2ch.net/test/read.cgi?bbs=perl&key=981352718
0002名無しさん@お腹いっぱい
2001/06/14(木) 15:26ID:???0003名無しさん@お腹いっぱい。
2001/06/15(金) 01:24ID:???作り直しきぼん。
0004名無しさん@お腹いっぱい。
2001/07/05(木) 09:41ID:???namazuってやっぱり負荷かかるのかな。
0005名無しさん@ディストリいっぱい
2001/07/05(木) 10:22ID:wD33sdDIindex作る時にはCPU使用率100%になります。
項目がいくつもあるとかなりツライです。
↓うちのNamazu
http://2ch.dyn.to/
0006名無しさん@お腹いっぱい。
2001/07/05(木) 17:05ID:???すご・・・
0008名無しさん@お腹いっぱい。
2001/07/09(月) 00:57ID:muVIdrhshttp://www.amays.com/~mizusawa/namazu_kaisetu/noSUinstall.html
当方レンタルサーバー 専用サーバー持つ金ありません。
C言語は使えます。負荷のかからないように、自分のマシンでindex作ればいいかな。
っていうかレンタルサーバー会社に聞かずにやっちゃって、かまわんかしら(汗
0009名無しさん@お腹いっぱい。
2001/07/25(水) 04:10ID:OjwNZy2Ihttp://www1.odn.ne.jp/mimizun/
0010名無しさん@お腹いっぱい。
2001/07/25(水) 18:41ID:smjKvwXM0011名無しさん@お腹いっぱい。
2001/08/01(水) 18:06ID:ix6uIOfU0012ナナ萌え(゚д゚)ウマー
2001/08/02(木) 00:34ID:???0013名無しさん@お腹いっぱい。
2001/08/04(土) 01:50ID:aNwZ.JX.穴。まさぐられると逝ってしまうぞ。
0014名無しさん@お腹いっぱい。
2001/08/10(金) 14:53ID:A94SLV6Y0015初心者
2001/08/11(土) 11:52ID:???いらないファイル(テンプレート等)も多いと思います。
結局必ず必要なファイルってどれなんですか?
0016名無しさん@お腹いっぱい。
2001/08/12(日) 00:26ID:???んー俺もそう言えばわからん、
もともと、俺にとって、このNamazu初めの頃難しすぎた。
その前に、うなぎ食いたいんだよね。腹減ってきた・・・
0017NAMANAMA
2001/08/12(日) 01:02ID:TrSLsWVYでも、さすがにインデックスの作成は共有サーバでやるのも申し訳ないので、ローカルで作ってあげてます。
そういう場合って、namazu.cgi, .namazurc, Template, Index以外は全部テデリっても問題ないですかね?
それと、やっぱ、インデックスをcrontabで定期的に共有サーバで作ったら迷惑でしょうか?
マジレスお願いします。
0018むぎ茶
2001/08/12(日) 01:08ID:???ばれなければ問題無い。
┐(´ー`)┌
┏━━━━━━━━━┓
┃('Д')y ─┛~~ ┃
┃むぎ茶 ┃
┃mugicha@360.cc ┃
┗━━━━━━━━━┛
0019名無しさん@お腹いっぱい。
2001/08/12(日) 01:24ID:???負荷はかからないけど、ローカルは、めんどくせぇ(涙
0020名無しさん@お腹いっぱい。
2001/08/12(日) 17:40ID:KkZ3OuWwNamazu.pmってあまり人気がないんですか?
参考スクリプト(書籍・サイト)がなかなか見つからなくって
何かありませんか?
0021名無しさん@お腹いっぱい。
2001/08/15(水) 21:03ID:???ない、と思う。
まあしかし機能はシンプルなことこのうえないので、
利用にあたってそんなに難しいこともないと思うけど。
Ruby 用のモジュール rbnamazu.rb の方機能は多そうだ。
0022名無しさん@お腹いっぱい。
01/08/28 05:33ID:aw.N/Mcoとりあえず2ちゃんねる全板検索可能です。
http://mimizun.mine.nu/
0023名無しさん@お腹いっぱい。
01/08/28 21:59ID:1JnfOa0A0024名無しさん@お腹いっぱい。
01/08/29 00:17ID:TsF5AU7kこれ、すげぇじゃん。
0025名無しさん@お腹いっぱい。
01/08/29 02:52ID:1UTTw6kkどこが?
0026名無しさん@お腹いっぱい。
01/08/30 12:01ID:8CpRLBMo0027名無しさん@お腹いっぱい。
01/08/30 12:11ID:3TFNK/cINamazuで検索できるのは「ファイル」だけのようです。
0028名無しさん@お腹いっぱい。
01/08/30 23:03ID:YzLgVA/.0029名無しさん@お腹いっぱい。
01/09/10 22:31ID:2EURowzoみずずん大丈夫?
0030名無しさん@お腹いっぱい。
01/09/10 22:32ID:???0031名無しさん@お腹いっぱい。
01/09/11 12:11ID:liJMw8bE0032名無しさん@お腹いっぱい。
01/09/17 18:14ID:???filter 書いてくれ。
0033名無しさん@お腹いっぱい。
01/09/17 18:18ID:dMB6uEtMNamazuシステムの構築と活用, ソフトバンク
やっぱこれじゃない?
0034名無しさん@お腹いっぱい。
01/09/17 18:21ID:FURvtMLg0035名無しさん@お腹いっぱい。
01/09/17 23:18ID:???よく知らないけど、pgnmz はPostgreSQLにNamazuのインデックスを
入れておいて、DBにクエリー投げて検索結果を出すという感じっぽいので、
テーブル内容検索とはちがうっぽい。
ttp://search.namazu.org/ml/namazu-users-ja/msg01550.html
0036名無しさん@お腹いっぱい。
01/09/20 17:20ID:TUOJrHAwソースがまんま出ちゃうんですけど。
0037名無しさん@お腹いっぱい。
01/09/26 22:51ID:9178Yr9sPHP の出力を検索させたいのなら出力した結果をファイルにして
それにインデックスをかけるとかしないと無理。
003836
01/09/27 00:11ID:IzjiFxn2「出力した結果をファイルにする」ってのは、phpでですか?
なんかそこら辺のこと詳しく書いてあるサイトが無いんで…。
Namazuシステムの構築本に書いてないかなー
0039名無しさん@お腹いっぱい。
01/09/27 01:15ID:???php のことよく知らないけど
php scriptname.php ってやったら出力されないかな?
ところで俺も質問なんだけど、namazu.cgi って検索後は
ファイルへのリンクを http://hostname/hogehogeで出力するけど、
こいつを file://hogehoge にする方法って無い?
windows でローカルファイルの検索に使いたいんだけど WEB で
探しても見つからなかった。
0040名無しさん@お腹いっぱい。
01/09/27 17:20ID:IzjiFxn2php scriptname.phpだとコマンドすら無いって言われてしまう。
指定先は.namazurcってファイルで設定できる↓参照
http://village.infoweb.ne.jp/~fwnk1502/data/howto2.htm#namazurc
0041名無しさん@お腹いっぱい。
01/09/27 22:04ID:clsPKe1Y>>39 はインデックス作成時に
mknmz --replace='s#^#file:///'
とかでもいけそうだけどどうよ。
004239
01/10/01 05:28ID:UjeefWpE>>40
.namazurc で
Replace http://localhost/ file://
と指定してみてたんだけど、どうやら無効の模様。
この部分(http://hostname)は固定で出力してるのかな?
>>41
やってみたけどだめっぽい。
でも他にそれらしいオプションも見つからないね・・・
こういう変な事やる時は cgi 改造しか無いのか、とほほ。
pnamazu か rbnamazu に挑戦してみよう。
ところで >>40 はうまくいったかな?
アパッチのモジュール lib_php3.so (だっけ?) しか
インストールされてない時は >>41 の 言う通りコマンド
ラインで使えるようにしよう。手動で最初からやってみ
たこと無いので詳しい説明できなくてごめん。
004340
01/10/04 19:40ID:4sun3RUk>> 39
うちは
Replace /C\|/docume~1/admini~1/mydocu~1/mywebs~1/ http://ark/
みたいな感じになってる。ちなみにこの行と
Lang ja_JP.SJISと書かれた行以外は全てコメントアウト
php検索はコマンドラインで使えるように設定してみます。
というかコマンドラインで使えるようにする方法すら知らないんだけど。
どこか書いてるとこ知りません? 本でも良いんですけど。
0044アナログから光までオッケー
01/10/05 02:03ID:7kq.xdqkスピードを計ってくれます。また、遅いと思う
人は設定を少し変えることによって無料で
スピードを早くすることができます。
お金を出す前に一度試してみては
いかがでしょうか。上がりの計測も可能です。
http://cym10262.omosiro.com/
004522
01/10/05 02:47ID:UlE8Ntsc0046名無しさん@お腹いっぱい。
01/12/09 11:02ID:eU0f+J4K一応FAQに書いてあることは試したつもりなんだが・・・。
どうも特定のファイルの時にそうなってるみたい。
なんか落ちやすい文字とか、そういうのあるんかな?
0047名無しさん@お腹いっぱい。
01/12/10 22:24ID:UuNX8sYB0048名無しさん@お腹いっぱい。
01/12/15 22:02ID:???もしくは本当にメモリ(+仮想メモリ)が足りないか。
0049名無しさん@お腹いっぱい。
02/01/04 06:04ID:HxTTmUTvprint strftime "%Y%m%d\n", localtime;
こう書くと年月日が出るじゃないですか。
この日付けに7を足す事ってできます???
0050名無しさん@お腹いっぱい。
02/01/04 06:04ID:???マルチうざい
資ね!
0051名無しさん@お腹いっぱい。
02/01/04 23:19ID:???逝って良し。
■解説■
マルチは下げ進行で微妙に煽りつつシカトします
上記例のように古典的な煽りは「逝って良し」
他にアスキーアートを使ったものなど多彩ですが、
サーバーの不可を考慮してかあまり好まれません。
やはりシンプルに「氏ね」など短文なものがベストです。
0052名無しさん@お腹いっぱい。
02/01/09 18:03ID:???0053名無しさん@お腹いっぱい。
02/01/12 04:40ID:???0054名無しさん@お腹いっぱい。
02/01/13 16:11ID:???0055名無しさん@お腹いっぱい。
02/01/13 19:32ID:???再利用というか、もっかい盛り上がることが出来ないスレなんですか?(笑)
0056名無しさん@お腹いっぱい。
02/01/25 06:48ID:YyTiWZ/90057名無しさん@お腹いっぱい。
02/02/18 08:00ID:TWCf5+1d00581001 Over 1000 Thread
02/02/18 10:21ID:Qb17d1xdもう書けないので、新しいスレッドを立ててくださいです。。。
0059名無しさん@お腹いっぱい。
02/02/19 07:42ID:DggBq+7H0060名無しさん@お腹いっぱい。
02/02/20 22:28ID:???全文検索エンジンNamazu @ Unix板
http://pc.2ch.net/test/read.cgi/unix/1009715036/l50
0061nobodyさん
02/03/11 21:08ID:Jt12j7IU変に文節で区切らずに、googleみたいに普通に検索してくれたら
それでいいのに。。
0063nobodyさん
02/03/12 07:59ID:qMnzd5b/これのこと?
>日本語がでたらめにわかち書きされてしまう
>{ [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、
>でたらめにわかち書きされることがあります。
>これは、そもそも最新情報という言葉が検索対象に含まれないことを意味します。
>検索はあきらめましょう。
それとも、インデックス作るときの分かち書きをしないでほしい、ってこと?
それって実現できるのか?
0064nobodyさん
02/03/18 17:35ID:???0065nobodyさん
02/03/19 11:29ID:ulLvfL7+日本語は解析していないように見えるけど…。
英語はスペースでわけるだけだから楽だね。
それにしてもgoogleはスペルミスの修正判断も出してくれたりすごい。
つーか20億ページを0.1秒で検索できるのが単純にすごいと思うのだが。
ローカルでほしい、、
0066nobodyさん
02/03/19 12:54ID:TPtrOTqRgoogleも分かち書きしてるらしい、という実験結果がある。
検索エンジンのしくみ教えます
http://www.google.com/search?hl=ja&ie=Shift_JIS&oe=Shift_JIS&q=cache%3AALmw0POy8V4C%3Awww.mars.sphere.ne.jp%2Fengine%2Fchap_g1.htm+site%3Awww.mars.sphere.ne.jphl%3Dja+Google&lr=lang_ja
なんか 403 forbidden になってるんでgoogleのキャッシュで見てね。
0067nobodyさん
02/03/19 14:31ID:???ほんとだ。分かち書きしてる、、
うむ、googleはちゃんと各言語ごとにチューンしてるんですね。
0068nobodyさん
02/03/19 15:32ID:TPtrOTqRgoogle並みのことはできるってことだよね
(もちろん、PageRank とかは抜きにして)。
いつも kakasi だけど、Chasen を使ってみようかなあ・・・。
0069nobodyさん
02/03/19 15:52ID:???0070nobodyさん
02/03/19 20:25ID:???googleの肝は結果の表示順序。(pagerankもそれを支える情報の一つ)
なので、namazuに少し手を入れたぐらいではgoogle並にはならないよ。
ヒット数が少ない場合、関係ないけど。
0071nobodyさん
02/03/19 20:38ID:???その点は激しく同意。
ただ、分かち書きの精度を上げることで、
>>61 のやりたいことは実現できるんじゃないかな、って思った。
0072nobodyさん
02/04/24 13:48ID:???0073ato
02/05/09 14:31ID:8gc3nIf40074nobodyさん
02/05/10 00:55ID:???0075nobodyさん
02/05/10 02:55ID:???いまさらだが、NamazuへのPageRankの実装は、この論文が有名。
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html
0077nobodyさん
02/05/10 20:41ID:??? ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄ (´´
∧∧ ) (´⌒(´
⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
 ̄ ̄ (´⌒(´⌒;;
ズザーーーーーッ
0078nobodyさん
02/05/24 03:19ID:???0079nobodyさん
02/05/27 19:51ID:LrpMVRitWWW検索エンジンサイト
http://pc.2ch.net/test/read.cgi/esite/973436559/l50
0080nobodyさん
02/06/06 04:44ID:jW1FwXu20081nobodyさん
02/06/09 00:21ID:MvwsaEnIhttp://freshmeat.net/projects/snatcher/
0082山拓変態問題
02/06/20 09:30ID:???0083nobodyさん
02/06/20 09:39ID:updula6Fわからん、俺がアフォなだけか?
0084nobodyさん
02/06/20 12:41ID:0pQ6ektuID3タグでも検索するのか?
そういうのは ふつー DB 使うだろ。
008682=85
02/06/20 15:34ID:???スレ違いスマソ。
0087nobodyさん
02/06/25 01:01ID:cgKxt6dSなるほど、mp3 の中に埋め込まれたテキストも「文書」として扱い、
検索対象としたい、ってわけね。全然変じゃない。むしろ面白い。
やってることは google のイメージ検索みたいな感じかな。
perl でサクッと書けそうな雰囲気。
ぜひトライしてみて。
あと、Web プログラミングとは関係ないけど、
Namazu に関係あればいいと思うよ。
0088nobodyさん
02/06/25 02:46ID:???むちゃくちゃ関係あるじゃん。
> やってることは google のイメージ検索みたいな感じかな。
イメージ検索は外部から関連性を持ってくるのでちと違うような。
内部のID3だけだったらPDF検索くらいに対応するだろう。
ぜんぜんNamazuじゃなくても良さそうだけど、他と串刺し検索するなら
やっぱり便利かも。
0089nobodyさん
02/08/12 22:58ID:???0090nobodyさん
02/09/02 23:28ID:???0091nobodyさん
02/09/20 08:19ID:???0092nobody
02/09/21 15:05ID:???検索結果で表示されるファイルの先頭部分のサイズを変更できますか?
やりかたを教えて下さい。
0093nobodyさん
02/09/25 08:37ID:3VOnIdJAでURLテキスト-iで、ディレクトリ作成-x
しながらページ拾ってくると、
稀にディレクトリ作成(www.aaa.xxx)されなくて
関係ないディレクトリ(www.bbb.xxx)にページを
格納してしまいます。
このままindex作るとURLリンクが関係ないところに。
どうしてだろう。困った。
0094nobodyさん
02/09/27 20:30ID:7S/gcFrV0095nobodyさん
02/09/28 02:50ID:gf1ROtiYピュー( ‘ д‘)
=〔~∪ ̄ ̄〕
=◎−−◎
0096名無しさん@お腹いっぱい。
02/10/07 17:04ID:ucR8g7pl(' д ‘)ピュー
〔~∪ ̄ ̄〕=
◎−−◎=
づかれたゾイ
0097名無しさん@お腹いっぱい。
02/10/07 17:05ID:ucR8g7pl0098nobodyさん
02/11/02 15:20ID:Jwe6TBuD0099Windows における namazu w/chasen
02/11/03 10:47ID:rQsphwgxhttp://www.namazu.org/ml/namazu-win32-users-ja/msg00671.html
http://www.namazu.org/ml/namazu-win32-users-ja/msg00672.html
http://www.namazu.org/ml/namazu-win32-users-ja/msg00692.html
を見ると、2001/05 時点で chasen を使ったインデックス作成は
cygwin 環境で行うことができるようですが、
現在も chasen を使おうとすると cygwin 上で行うのが妥当でしょうか?
0100Windows における namazu w/chasen
02/11/03 11:17ID:???Chasen 2.0.2 は cygwin 上で問題なくコンパイルできました。
0101Windows における namazu w/chasen
02/11/03 11:33ID:???cygwin のデフォルトの perl 関連のパッケージでは File::MMagic はインストールされないので、
CPAN http://search.cpan.org/dist/File-MMagic/ からダウンロードしてきて
あらかじめ (configure の前に) インストールしておく必要があります。
0102Windows における namazu w/chasen
02/11/03 14:10ID:rQsphwgxcygwin のコアDLLのバージョンは 1.3.14-1 です。
0103nobodyさん
02/11/03 23:09ID:sdt4YScv全部cygwinでやる方法以外無いのでは?
そもそもkakasiを使う事が推奨されていて。
茶筅は結構イレギュラーな方法なわけだし。
(運用上結構問題がある)
0104nobodyさん
02/12/03 00:32ID:???0105nobodyさん
02/12/26 00:21ID:DUegdvZH形式自体はレス1つが1行になっているだけなんだけど、<a name="hoge">をつけるのもなんか違う気がするし。
ファイル名と行数だけ教えてくればそれでよいんですが。
Namazuでやっているようなこと、ChaSenで分かち書きしてインデックス作ってcgiで検索っていうのも作りかけたけど、
車輪の再発明になりそうで中断してる。
0106nobodyさん
02/12/26 00:41ID:M1+zinp+dat からそのままインデックスを作りたいってこと?
mknmz 用のフィルタを書けばいいだけだよね。
perl だし結構簡単そうだね。
0107nobodyさん
02/12/26 01:19ID:DUegdvZHそのとおりっす。
各行の先頭に<a name="スレ番号"></a>入れて、理由は不明ですが、先頭行に適当に<html>とか入れてあげて、
mknmz --html-split -a hogohoge.dat
でインデックスは作れたし、検索もできるのは分かるのですが、
mknmzのソースのprocess_file辺りを見ると、コメントに、FIXME: Very complicated.とあるくらいなんで、めんどいなと。
html向けには分割して処理してるみたいですし。
誰か同じようなこと考えていないかなと。
0108nobodyさん
02/12/26 01:48ID:M1+zinp+read.cgi が出力する html をインデックスするよりも、
dat から直にインデックスする方がきっと速い。
いちいち dat から html 作らないから、不要なファイルを作らなくてもよい。
html として出力するのは 2ch ビューアとか、read.cgi に一任できる。
利点はこのあたりかな。みみずんとか喜びそうだよね。
結局、mknmz の仕様に則ったフィルタを作ればいい。
html.pl とか参考にして作ってみたら?
http://cvs.namazu.org/namazu/filter/html.pl?rev=1.34&content-type=text/vnd.viewcvs-markup
もし実現できたら、cvs にある scheme/http.pl と組み合わせて、
2ch.net の dat を直接インデックスできるかな。
あ、今 2ch.net は dat 直読みできないんだっけ? だめか。
0109nobodyさん
02/12/26 02:05ID:DUegdvZHフィルタ自体はHTMLのでも十分なんですよ。
--html-splitなしでは、mknmzってファイル単位でしかインデックス作らないじゃないですか。
datってスレ毎で、全レスが入っているから、スレごとにしか検索できないことになってマズーなのです。
p2 ( http://pc.2ch.net/test/read.cgi/mac/1034199997/ )のdatを2次利用したいなと思っていろいろ試してます。
>>107 に書いたように、mknmzのprocess_fileあたりの--html-split処理部を書き換えてみてます。
0110nobodyさん
03/01/02 18:30ID:cP1MLYPA--html-split的なファイル分割を実現している人がいます。
本家には全く取り込まれていませんが…
Emacsのinfoファイルの分割(X-ml-name: namazu-devel-ja X-mail-count: 02059 )
http://www.namazu.org/ml/namazu-devel-ja/msg02063.html
PDFファイルをページごとに分割(X-ml-name: namazu-devel-ja X-mail-count: 01951)
http://www.namazu.org/ml/namazu-devel-ja/msg01950.html
つーかどちらも実装したのは僕ですが…
実現は単純だと思います。
行ごとにsplitするだけでとりあえずは実装できると思います。
見やすいようにフィールド情報を与えるためにはちょっと工夫がいるかもしれません。
ただフィールド情報が無くても十分有用だと思います。
そのページだけじゃわかりづらいと思うのでわからなかったら質問してください。
navi2chやら他の2ちゃんねるブラウザと連携すれば便利かもしれません。
ある特定のスレだけを検索対象にしてwebに公開しても便利かもしれません。
0111nobodyさん
03/01/03 09:06ID:???すべてのページについて、php4とpostgresを使っていて、
URLは http://domain.com/foo/?category=bar の形式で作ってるんですが
(fooとbarはいろいろ変わる&postgresでページの階層構造を管理してる)
これにNamazuを導入するには、どうすればいいんでしょうか・・・?
0112nobodyさん
03/01/03 09:29ID:v/h8n2uJ0113111
03/01/03 18:29ID:lPX3I1sa0116111
03/01/04 00:23ID:U6dtWDEb・・・いきたいな
0117111
03/01/04 19:17ID:BatkqzbV「php namazu インデクサ」とじゃ
「php namazu シェルスクリプト」とかで検索してるんだけど、
いまいち該当しない。
検索のヒント、ください。
0118111
03/01/11 17:11ID:CeP+V+mb0119nobodyさん
03/01/11 18:22ID:8y79ZXZ4ひらがなとかカタカナのもうめちゃくちゃな弱ささえ克服できればなぁ。
kakasiにひらがな単語の辞書登録さえあれば…。
もともと、そーゆープログラムではないから
AQに採用されることないけど。
0120山崎渉
03/01/15 13:33ID:???0121nobodyさん
03/01/17 16:56ID:TsHzDgv8茶筅にしる!
0122nobodyさん
03/01/18 02:26ID:???サマリは直接生成。
0123nobodyさん
03/01/18 07:01ID:0IdKnMy10125124
03/01/18 15:07ID:???CGIを使えるサーバーを借りたら、解決だった。
0127nobodyさん
03/01/18 22:45ID:KC3+f7J6自分的にもそれは必須の機能だと思うんだけどなぁ。
頭の部分だけ静的に切り出したサマリーでずらずら検索で引っ掛かってきてもあんまサマリーの意味ない。
メーリングリストみたいにタイトルが内容の要約になってる、とかならいいんだけど。
0128nobodyさん
03/01/21 15:04ID:2m91wCEmNamazu 2.0.12 for Win32をWin98で使用しています。
mknmzを実行すると、下記のエラーが出てしまいます、、、
Can't locate File/MMagic.pm in @INC (@INC contains: . C:/Perl/lib C:/Perl/site/
lib .) at C:\USR\LOCAL\NAMAZU\BIN/mknmz line 34.
BEGIN failed--compilation aborted at C:namazu\bin/mknmz line 34.
お分かりになる方、いらっしゃっいましたら
ご教授ください。お願いします!
0129nobodyさん
03/01/21 23:04ID:???0130nobodyさん
03/01/22 00:18ID:???MMagicのインストールを行おうとすると、エラーがでるので確かにインストール
されていないようです。
namazuのパッケージに含まれてるppmは、500番台と600番台の2つなのですが
私のActivePerlのビルド番号を確認すると、804となっています、、、。
これが原因なんでしょうか?
0131nobodyさん
03/01/22 22:49ID:tlaGPNPQ0132nobodyさん
03/01/22 22:55ID:0SY2SNochttp://pc1.moo.jp
パソコン・インターネットの仕組み、パソコン自作・サーバー構築法について、動画や静止画を豊富に取り入れて、初心者向けに基礎から分かりやすく解説しています。
ガンガン、アクセスしてください!!
0133nobodyさん
03/01/22 23:06ID:DuSjMjDYhttp://banana.fruitmail.net/cgi/introduce_jump2.cgi?1363289
0134nobodyさん
03/01/23 09:19ID:XTkiyiclやっぱりkakasiより検索精度あがりますか?
とくにひらがな単語やカタカナ単語で。
0135nobodyさん
03/01/24 13:46ID:DnlSMTjH1ディレクトリで1000ファイルオーバーとかって、インデックス
作るのに問題ないっぽい?
なんか、毎日自動でインデックス作ってるんだけど、ちゃんと
インデックス作れてない(検索できない)場合が時々あるのよ。手動で
作ってやるとちゃんと動くところがまた憎らしい。
0136nobodyさん
03/01/24 15:43ID:9aIuMK5Xindex.htmが格納されて困るんだけどなんでだろう。
ブラウザ動かしながらやるとミスするのかなぁ。
win2k
0137nobodyさん
03/01/25 15:38ID:x6YUG/OMperl版でインデックス作らないとダメなのでしょうか?
そのままのインデックスでpnamazu.cgiでとりこぼしが減るのでしょうか?
0138nobodyさん
03/02/05 04:47ID:vQpd3y9f0139nobodyさん
03/02/05 06:56ID:CehyN38Wいいね〜 これ♪
0140nobodyさん
03/02/05 09:04ID:LQrwCDVWナマズの派生で、カバヤキっていうのでたけど使ってる人いる?
0141nobodyさん
03/02/05 09:11ID:JiOCwoo30142nobodyさん
03/02/05 10:12ID:???0144nobodyさん
03/02/07 03:32ID:/4XUF2iq作成した全文検索ってどのくらいパフォーマンスが変わってくるかなー
検索対象レコード:1000、検索対象フィールド:3
各フィールド60,000文字ぐらいで考えてるんだけど、
MS-Access + ASP じゃ無理あるかな・・・
2、3秒で検索結果がでてくればいいのですが・・・
インデックスの作成自体、最近気づいた愚か者ですが、
よろしくお願いいたします m(_ _)m
0145nobodyさん
03/02/07 06:28ID:KeFGYCTZ?????????
0146nobodyさん
03/03/07 18:19ID:+bpjK8Vp0147nobodyさん
03/03/08 13:01ID:???http://www.akira.ne.jp/index.htm
0148nobodyさん
03/03/08 16:11ID:6pWNtujSどちらを使うかはどうやって決まるのでしょうか?
0149山崎渉
03/03/13 17:05ID:???0150nobodyさん
03/03/13 20:02ID:???0151nobody
03/03/28 00:40ID:???0152山崎渉
03/04/17 12:25ID:???0153山崎渉
03/04/20 06:08ID:???( ^^ )< ぬるぽ(^^)
0154nobodyさん
03/04/23 13:38ID:???CPU周り熱々になって九割方落ちる鬱
0155nobodyさん
03/04/28 11:08ID:???0156nobodyさん
03/05/14 16:15ID:???0157nobodyさん
03/05/18 02:04ID:inHKtSNsただ、データの量が多くインデックス作成に失敗する事が多々あり、
現在は分割して、インデックスを作成。
ここに追加( --no-delete オプション)しています。
(更新は週に1回でも十分なので、本当は週に1回最初からインデックスを
作り直したいのですが、時間的にも労力的に厳しいです)
質問なのですが、上記の --no-delete オプションで一部のファイルをインデックスに
追加することと逆に、なんらかの方法で「指定したファイル」のインデックスからの
削除は可能でしょうか?
0158nobodyさん
03/05/18 10:06ID:OMFaVw9A>データの量が多くインデックス作成に失敗する事が多々あり
うちではそんなこと無いなあ。まあ10万ファイル程度だけど。
データ量が多いってどのくらい?
インデックス作成失敗って、どんなメッセージが出てどんな状況になるの?
0159nobodyさん
03/05/18 14:25ID:???共用サーバにてインデックスを作成、Namazuを利用しています。
おおよそ、1MB前後が1回あたりのインデックス作成の限度のようです。
メッセージは「Out of Memory!」です。
0160nobodyさん
03/05/18 17:53ID:???0161nobodyさん
03/05/19 02:54ID:???それも考えたのですが、インデックスには当然ローカルのファイルのパスが含まれてますよね?
現在はReplaceで、サーバのパス/virtual/ID/→http://〜の絶対パスに変更しています。
ローカル(Windowsマシン)C:\〜を絶対パスhttp://〜に変更させる事ができるのでしょうか?
0163nobodyさん
03/05/19 11:12ID:???Namazu と直接関係ないじゃん。
>>161
可能。パスを書き換えて、インデックスを再構築すればいい。rfnmz だっけ?
ml の過去ログで似たような事例を見た気がする。
0164nobodyさん
03/05/19 12:36ID:R1nWpNfcJavaで書かれたLuceneってのはできますよ。
0165動画直リン
03/05/19 13:08ID:IEVyzYan0166nobodyさん
03/05/19 14:26ID:???>>163
ありがとうございます。
wget>インデックス作成>検索と3段階で相当な負荷が
サーバにかかっていたので、いつアカウントを止められるのか
心配していました。
wget>インデックス作成まで行えれば、
検索だけをサーバで行うので負荷も和らげられると思います。
0167nobodyさん
03/05/19 15:01ID:hryn2RRehttp://homepage3.nifty.com/coco-nut/
0168bloom
03/05/19 15:08ID:IEVyzYan0169nobodyさん
03/05/21 10:19ID:???互換性があるのでしょうか?
0170nobodyさん
03/05/21 14:38ID:zDb/UTki0171bloom
03/05/21 15:08ID:JZ9K0e/X0173nobodyさん
03/05/22 01:10ID:???ありがとうございます。
Liunxのインストールからはじめるのは辛いですし、
cgiでインデックスを作ろうとするとすぐに落ちるので
助かりました
0174山崎渉
03/05/22 01:58ID:???0175nobodyさん
03/05/23 00:35ID:???0176山崎渉
03/05/28 17:21ID:???ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。
=〔~∪ ̄ ̄〕
= ◎――◎ 山崎渉
0177nobodyさん
03/05/30 16:43ID:???0178nobodyさん
03/06/18 16:39ID:DT1VWY3V0179nobodyさん
03/06/18 22:37ID:yFwDTAK+PHPマヌアルにかぎらずUTF8で書いてあるページは文字化けするツー事
nkfを利用しているからじゃないかな
0180nobodyさん
03/06/19 00:34ID:r/KT2iM+0181nobodyさん
03/06/25 14:23ID:77oj5Ix9全文検索できないの?
できるんだったら、指定したキーワードを含むファイルだけから全文検索するなんて使い方も可能?
また、インストールしたLinuxとかのディスクに置いてあるファイルでないと検索できないのかな?
Windowsマシン上にあるファイルもさがせたりしないんでしょーか。
いろいろ関連サイト見てみたけどそういったことは書いてなかったYo!って探し方悪いんでしょうか
0182nobodyさん
03/06/25 15:10ID:vaUG6cj5http://endou.kir.jp/yuminet/link.html
0183_
03/06/25 15:12ID:???0184ミルフィーユ
03/06/25 15:24ID:???おいしそうですねぇ。
0186181
03/06/27 00:27ID:6z/IvjGbnoってそれぞれの私の質問に対する回答ですか?
いずれにしてもサンクス子 http://www.namazu.org/ いってきます。。m(。_。)m
0187???
03/06/27 19:27ID:1V/886pX→キーワード入力 OK →検索している 検索結果は出るのですが
全く関係のないページばかりリストアップ。そのページソースを検索キーワード
で探してもありません。
インデックスもエラーなくできて、アップも問題なくでき、検索もできるのですが
その結果が全くあさって・・・どこに問題がありそうでしょうか???。ご意見を
お願いします。
0189187
03/06/30 07:16ID:???んっ〜それにしても結果が全く関係なさ過ぎるんですよ。
インデックスがまともに出来ていないような現象です。
ただ、作業的には問題なく進んでるんですよ・・・トホホ 。・゚(/д\)゚・。
0190 ◆MiMIZUNCjA
03/07/07 03:25ID:sv7ydGsIそういう場合は最初から作り直しますがなんなんでしょうね。
たぶん回答じゃなくて、ガイジンさんなんだよ。
...no. no! no!! no!!! nohhh!!!!!! nanimochigaudesholtu!!!
って感じだと思う。
0192山崎 渉
03/08/15 22:47ID:???│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン
0193nobodyさん
03/10/02 14:51ID:???0194nobodyさん
03/10/06 00:26ID:MvGVNeyO複数indexを作る場合、
namazu.cgiと.namazurcのあるディレクトリの下に新しいディレクトリを作って分けて、.namazurcで制御すればいいんでしょうか?
今はindexファイルをnamazu.cgiと.namazurcのあるファイルと同じ階層に全部詰め込んでいます。
これだと、二つ以上のindexは作れないみたいです。
0195nobodyさん
03/10/06 00:33ID:???そのままインデクス名になる。使う場合は、.namzurcではなくて
NMZ.head.jaで idxname="foo" とか指定してやればいい。
0196nobodyさん
03/10/06 06:50ID:fxmWtj2Yわかりやすいレスありがとうございます。
解決しました。
0197nobodyさん
03/11/13 08:37ID:Tw9dU9HY「ホスティング依頼している鯖に namazu を入れて、メールの全文検索ができ
ないもんかな?」
という相談をうけますた。
う〜ん…………
おいらの使ったのは、RedHatだったんで、namazuはRPMでなんも考えずに
入れて、インデックス作って使ってたことはあるけど、ホス依頼してる鯖だと
root 権限なんか貰えないだろーしなぁ……
なんかいい方法ってないでしょか?
0198nobodyさん
03/11/14 09:37ID:???0199197
03/11/14 14:31ID:bYphtnKKありがとう!提案してみるよ
って、これ、インデックス作成はローカルの環境でするのかぁ
ま、いいや。相手がなんていうか、言うだけ言ってみよう
ヒントくれてサンクス!
0200nobodyさん
03/12/20 12:12ID:BT5vMVU90201nobodyさん
03/12/20 14:36ID:???特定のファイル(拡張子だけだったかも)を除外する
という設定項目があった様な記憶があるんで、
もしかしたら、それの応用でディレクトリごと無視するとかできるかも。
#具体的にどんな設定をするかは忘れた
#多分namazuの本家サイト見たらあったよ
0202nobodyさん
04/01/02 23:12ID:???という形式なのですが、
こういった動的なページに対してNamazuを使うというか、インデックスを作成するには、
どうすればいいのでしょうか?
0203202
04/01/02 23:13ID:???誤:「http://www.example/com/?cat=★」
正:「http://www.example.com/?cat=★」
0204202
04/01/04 01:18ID:LkXOe+SC0205z33
04/01/04 10:35ID:???replaceでがんばってどうにかできないかな?
例えば
/home/apache/documentroot/test/1.txt
↓
http://www.example.com/?cat=/test/1.txt
って変換だったら
Replace "/home/apache/documentroot" "http://www.example.com/?cat="
とか
こういうこと?
0207nobodyさん
04/01/19 19:55ID:daYuprPNnmz.field.****
の****を増やしたいのですが、どうしたら良いでしょうか?
具体的にはmknmz時にuriを見て
wwwroot/aaa/a.html
wwwroot/bbb/b.html
nmz.field.locate ってファイルを作ると
その中に
aaa
bbb
って出力されてほしい
で検索結果でyahooのカテゴリのように
<a href="a.html">aのタイトル</a>
カテゴリ TOP>>aaa(${locate}の値)とかやりたい
まぁ検索結果の中でuri見て変換したら良いんだけど、
もうちっとスマートに処理させたいなと・・・
0208z33
04/01/20 22:20ID:???ちょっとググッて探してみたら、こんなの見つけたけど
http://www.namazu.org/ml/namazu-users-ja/msg02744.html
参考になる?
0209nobodyさん
04/02/11 00:01ID:???0210nobodyさん
04/02/13 03:38ID:jCzy8g3E2chの過去ログを検索出来るようにしていますけど
ファイル数17万程度でインデックス作成に取り組んでいるのですけど
3日経っても終わりません。。おかしいと思いこちらに来ました。
もっと処理を早くしたいのですが、、
一応何を書けばいいのかわかりませんが、
PCのスペック等を簡単にまず記します。
何か必要な設定項目を書けと言われればすぐ書きますので、、
CPU P3-1G@dual
mem 1G
namazu ver2.0.12
perl 5.6
設定ファイルの中身を弄ればいいのでしょうか。。
一応インデックス書き出しは行われ続けていますけど
遅くて遅くて、、、
何かヒント等くれる方いらっしゃいませんでしょうか、、、?
0211210
04/02/13 03:45ID:jCzy8g3EKAKASI使用
mknmzrc設定
$ON_MEMORY_MAX = 5000000;
$FILE_SIZE_MAX = 10000000;
$TEXT_SIZE_MAX = 1000000;
$WORD_LENG_MAX = 128;
$INVALID_LENG = 128;
$MAX_FIELD_LENGTH = 200;
$WAKATI = $KAKASI;
とりあえずon memory maxの値が小さいのはわかったのですけど
これが速さに関係するのかは理解出来ませんでした。
また、他に問題点や気づく点等がありましたら教えて欲しいです、、
0212nobodyさん
04/02/13 08:37ID:???一気にmknmzするのではなく、分割してmknmz→マージする。
そうすれば処理時間もだいたい想像できる。
0213210
04/02/13 13:43ID:wO1Lum8s少しそれについて調べてみます。
0214森の妖精さん
04/02/16 02:31ID:/mo58UcMGETAのPHPインタフェイス作ろうという奇特な御仁は
いらっしゃいませんか?
0215nobodyさん
04/02/20 12:32ID:???こちらにまとめました。
検索エンジンをつくりたい
http://pc2.2ch.net/test/read.cgi/php/1009030584/l50
0216nobodyさん
04/03/24 21:59ID:???http://pc3.2ch.net/test/read.cgi/unix/1075033822/576
Java の API のリファレンスを Namazu でインデックス化していて
Emacs でプログラミング中にカーソル上のクラス名ですぐ検索したいんです
0217nobodyさん
04/03/31 21:28ID:???「現在-3の文書がインデックス化され、・・・」と文書の数がマイナスになっています。
どうしてなのでしょうか。
0218nobodyさん
04/03/31 21:46ID:5e+SzBpf0219(´・ω・`)
04/04/01 21:05ID:98Q5EoMa日本語全文検索エンジンソフトウェアを教えてください。
0220nobodyさん
04/04/02 00:02ID:n5mwBUCQ0221nobodyさん
04/04/02 22:28ID:???0222nobodyさん
04/04/20 23:55ID:hVBcQucn0223nobodyさん
04/05/01 23:15ID:HE2QfFBX自分で作った辞書を、追加した。
# mkkanwa kanwadict (追加した辞書ファイル)
自分で追加した辞書の内容は、
上記の場合、(追加した辞書ファイル)を参照すれば分かるけど、
現在の辞書全体にどのような単語が登録されているかを調べるにはどうしたらいいんでしょうか?
kanwadictって、viで開くと文字化けして見れません。
※環境:UNIX
0224nobodyさん
04/05/27 15:51ID:CEx1TsW7にアクセス気出ません
0225nobodyさん
04/05/27 16:43ID:mtXfTMbYorz
0226nobodyさん
04/05/27 16:43ID:???0228nobodyさん
04/05/27 19:56ID:WJMdSqlX全文検索システム「Namazu」を配布するNamazu Projectは5月27日、
同プロジェクトのサーバが不正侵入を受けたと発表した。
http://headlines.yahoo.co.jp/hl?a=20040527-00000016-zdn_n-sci
0229nobodyさん
04/05/28 21:23ID:???0230nobodyさん
04/05/28 21:24ID:???0231nobodyさん
04/05/28 21:26ID:???0232nobodyさん
04/05/28 21:28ID:???0233nobodyさん
04/05/28 21:29ID:???0234nobodyさん
04/05/28 22:17ID:???0237nobodyさん
04/05/30 20:09ID:WmFD3m1t0239nobodyさん
04/06/17 19:14ID:KtXfrXmS検索結果について質問なんですけど
ttp://www.kaiho.mlit.go.jp/cgi-bin/namazu.cgi?query=%8B%DF%8AC&max=20&result=normal&sort=score
↑こんな風に検索語句と該当箇所が赤く強調されるのってどうやるんですか?
ttp://www.city.katano.osaka.jp/cgi-bin/namazu.cgi?key=a&submit=%B8%A1%BA%F7%B3%AB%BB%CF%21&whence=0&max=20&format=long&whence=0&dbname=reiki
自分のは↑こんなふうに参照したページの上部しか表示されません。
0240nobodyさん
04/06/17 21:45ID:???http://www.city.katano.osaka.jp/cgi-bin/namazu.cgi?query=%B8%F2%CC%EE&whence=0&max=20&result=normal&sort=score&idxname=reiki
NMZ.headにデフォルトで strong.keyword { color: Red; } あるから、
「ちゃんとしたキーワード」なら赤くなるハズ。
0241nobodyさん
04/06/18 00:33ID:???本当だ・・・キーワードの入れ方がまずかったようです。
自分のnamazuでやり直したらちゃんと表示されました。
無知で申し訳ありません。
0242nobodyさん
04/06/28 15:24ID:???全角文字で検索すると検索語が”%a5%d0%a5%”みたいな感じで文字化けします。
検索結果画面はきちんと表示されますが、検索文字列だけが化けています。
もう一回全角で検索すると文字化けが直ります。1回目だけ必ず文字化けします。
何が原因でしょうか?
0243nobodyさん
04/06/28 15:25ID:???ごめんなさい、無視してください。
0244nobodyさん
04/07/16 18:31ID:???ヒットしたファイルが日本語のファイル名だと、
ブラウザ上に表示されているファイル名を
クリックしてもファイルをオープンしません。
検索対象ファイルの、
ファイル名が日本語でも対応してますか?
ちなみにWindows版(2.0.12)です。
0245nobodyさん
04/07/19 00:54ID:???↑ここ見てnamazuの全文検索システムのソースを入れてみたら
無事に検索は出来るんですが検索された先のリンクがなぜか全てnamazu.phpがある
カレントディレクトリになってしまいます。
これはどうすれば対処することが出来ますかね?
0246nobodyさん
04/07/19 12:51ID:???0247245
04/07/22 13:31ID:???いじってみましたがやはり結果は同じです。
一体どこがおかしいんだろう?
例えばnamazu.phpをC:\homeに置いたら
検索結果はちゃんと表示されるんですがリンクが全て
namazu.phpを置いているディレクトリになってしまいます。(この場合はC:\home)
変えるべきところはnamazurcのReplaceのところとは思うんですが
何度変えても同じ結果になってしまいます。
どうすればちゃんとしたリンク先になってくれるかな?
参考にしたサイト↓
http://ponx.s5.xrea.com/hiki/ja/hiki.cgi?xrea_tdiary_namazu
http://you-like.to/nekomimi/works/w2k20001110.html
0249nobodyさん
04/07/31 19:38ID:???だよね。ちゃんとそうなってる?
0250nobodyさん
04/07/31 19:44ID:???この欄の ${author} が一体何を表示するのかがわからないので
ソースを追跡してみたのですが自分には具体的に読み解くことができませんでした。
sub field_init {
%FieldAlias = (
'author' => 'from' ,
'title' => 'subject' ,
'url' => 'uri' ,
);
あたりまではなんとなく分かるんですが・・・
Perlのすごい人! だれか教えて!
0251nobodyさん
04/08/02 08:46ID:???著者がなにかを知りたいんだったらpnamazuではなく、mknmzのほうを解析するよろし。
0252nobodyさん
04/08/12 09:03ID:???Replace /index.html /
Replace /C\|/namazu/nurupo/ http://hoehoe.ne.jp/~nurupo/
と、2つの置換を行いたいのですが、当然できません。
正規表現が使えるみたいなことが書いてありますが
Replace /C\|/namazu/nurupo/(.+)/index.html http://hoehoe.ne.jp/~nurupo/$1/
では全てが http://hoehoe.ne.jp/~nurupo/$1/ にされてしまいます($1が展開されない)
どうやればこの置換を実現できるのでしょうか?
0253nobodyさん
04/08/12 09:05ID:???0254nobodyさん
04/08/12 09:07ID:???0255nobodyさん
04/08/21 22:26ID:???Namazuの検索結果って、
全部ドキュメントの行頭あたりしか表示しないけど
Googleみたいにマッチした前後の文章を表示できんの?
0259nobodyさん
04/08/24 01:13ID:202RVh+Shttp://find.2ch.net/
0260nobodyさん
04/08/24 06:48ID:???F:\index
+aaa
+001
+002
+003
+bbb
+001
+002
+003
aaaとbbbを指定したいのだが…
ぐぐたら無理ぽいな
ttp://search.luky.org/vine-users.2/msg02960.html
0261nobodyさん
04/08/24 19:02ID:???javascriptとかでチェックボックスをコントロールするとかじゃ駄目か。
0262nobodyさん
04/08/24 22:09ID:???じゃダメ?
F:\index
+ccc
+aaa
+bbb
0263nobodyさん
04/08/25 01:35ID:???数字のフォルダがインデックスで大まかに分けてある。
やはり1つのフォルダ以下にインデックスの入ったフォルダを置くしかないのか。
0264nobodyさん
04/11/11 11:45:47ID:VoJd1QOh0265nobodyさん
04/11/23 11:20:19ID:???0266nobodyさん
04/11/26 13:50:33ID:cbW9i0f7wgetで落したHTMLファイルをNamazuで検索しています。
Namazuの検索結果の順番を自分で決めたいんですが、
NMZ.field.uriの順番をいじると全てのページがNOT FOUNDになってしまいます。
どなたかいい方法知りませんか?
0267nobodyさん
04/11/26 14:41:22ID:???namazuはcなのにmknmzはperlなのはどうして?
0268nobodyさん
04/11/26 14:55:11ID:???インデックスの作成を早くするには分散して作成してからマージすればよいかも。
namazuがcなのはcの方がリクエストの度にコンパイルがない分、早いから、
mknmzはインデックス作る時しか使わないので文字の操作が楽チンなPerlを・・・。
ちなみにpnamazuっていうPerlで書かれたnamazuもある。
たしか2chもread.cgiはCだけど、bbs.cgiはPerlだったと思う。
質問は一個ずつにしてね。
0269nobodyさん
05/01/02 10:01:19ID:Oo1G9Jagうまくいきません。
インデックスを作ろうとするとNKF.pmが無いといわれます。
PPM-INSTALL.BATを動かしてもうまくいきません。どうすればいいのでしょうか?
0270269
05/01/02 12:42:33ID:???0271nobodyさん
05/01/27 22:35:38ID:muSCpH63なんか改善する術ってありますでしょうか? 教えて誰かエロイ人!!
0272nobodyさん
05/02/11 17:47:10ID:LfkZHaha2行目以下のwordなどの設定が対応メディアタイプに反映されません。
2行目以下も#は外しているのですが…。
茶筌のところ#を残しているのですが、それもちょっと変かもです。
うまくいかない原因がわかる方どなたか教えてください。
読み込んだ設定ファイル: D:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.12
Perl: 5.006001
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: D:/namazu/etc/namazu
LIBDIR: D:/namazu/share/namazu/pl
FILTERDIR: D:/namazu/share/namazu/filter
TEMPLATEDIR: D:/namazu/share/namazu/template
対応メディアタイプ:
application/x-gzip
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-hdml
0273nobodyさん
05/02/11 19:36:57ID:???まず最新の2.0.14を使いましょう。
それと
D:/namazu/etc/namazu/mknmzrc の$ALLOW_FILE
のところを全行はりつけてよ。
どこの#を外したのか見てみないとわからんよ。
0274272
05/02/11 19:40:50ID:???最新って言ってもベータ版らしいので…。
とりあえずこんな感じです。
#
# This pattern specifies file names which will be targeted.
# NOTE: It can be specified by --allow=regex option.
# Do NOT use `$' or `^' anchors.
# Case-insensitive.
#
$ALLOW_FILE =".*\\.(?:$HTML_SUFFIX)|.*\\.txt" . # HTML, plain text
"|.*\\.gz|.*\\.Z|.*\\.bz2" . # Compressed files
"|.*\\.pdf|.*\\.ps" . # PDF, PostScript
"|.*\\.tex|.*\\.dvi" . # TeX, DVI
"|.*\\.rpm|.*\\.deb" . # RPM, DEB
"|.*\\.doc|.*\\.xls|.*\\.ppt" . # Word, Excel, PowerPoint
"|.*\\.j[sabf]w|.*\\.jtd" . # Ichitaro 4, 5, 6, 7, 8
"|\\d+|[-\\w]+\\.[1-9n]"; # Mail/News, man
0275nobodyさん
05/02/11 19:43:44ID:???0276nobodyさん
05/02/11 19:49:17ID:???Windows版はβ版扱いになっていますが、
インストーラがβというだけで本体に問題はないですよ。
たぶんフィルタが必要としているMS-Word等の
アプリケーションが入っていないのでしょう。
こちらのフィルタを使うとよいでしょう
ttp://www.geocities.co.jp/SiliconValley-Oakland/8718/namazu/index.html
0277nobodyさん
05/02/11 19:53:07ID:???0278272,274
05/02/11 20:00:49ID:???Office2003だということもあるのかな。
拡張子だけで判断してるのではないんですか。
まずは最新版をインストールしてみます。
用事があって今日これからはできないので、うまくいかなかったらまた後日質問させてもらいます。
回答ありがとうございました。
0279nobodyさん
05/03/10 15:52:52ID:???ページが増えてきたので階層ごとにインデックスを作成し階層ごとに検索ページを
作りたいと考えております。しかしインデックスファイルを作成しnamazuコマンドでは
検索できるのですがブラウザから
http://サーバIPアドレス/cgi-bin/namazu.cgi?idxname=aaaとすると
allインデックスから検索されてしまいaaaインデックスから結果を表示してくれません。
aaaインデックスから結果を表示するにはどのようにするのでしょうか?
ページの階層
/apache/htdocs/aaa
/apache/htdocs/bbb
/apache/htdocs/ccc
インデックスの格納場所
/apache/cgi-bin/namazu/index/all
/apache/cgi-bin/namazu/index/aaa
index/all内のNMZ.head.ja
<input type="hidden" name="idxname" value="all"> ←allに変更
<a href="{cgi}?idxname=all">[検索方法]</a> ←?idxname=allを追加
index/aaa内のNMZ.head.ja
<input type="hidden" name="idxname" value="aaa"> ←aaaに変更
<a href="{cgi}?idxname=aaa">[検索方法]</a> ←?idxname=aaaを追加
cgi-bin内にある.namazurc
Index /apache/cgi-bin/namazu/index
Template /apache/cgi-bin/namazu/index/all
Replace /apache/htdocs/ http://サーバIPアドレス/
0281279
05/03/11 09:08:13ID:???mknmz -O /apache/cgi-bin/namazu/index/all /apache/htdocs
合計の文書数 602
合計キーワード 5,499
わかち書き module_kakasi -ieuc -oeuc -w
mknmz -O /apache/cgi-bin/namazu/index/aaa /apache/htdocs/aaa
合計の文書数 9
合計キーワード 441
わかち書き module_kakasi -ieuc -oeuc -w
よろしくお願いします。
0282279
05/03/11 16:15:26ID:8QvGuHRhKAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /etc/namazu
LIBDIR: /usr/share/namazu/pl
FILTERDIR: /usr/share/namazu/filter
TEMPLATEDIR: /usr/share/namazu/template
対応メディアタイプ:
application/pdf
application/x-bzip2
application/x-compress
application/x-gzip
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; xtype=rfc
text/x-hdml
text/x-roff
0283279
05/03/11 16:20:49ID:???mknmz -C
読み込んだ設定ファイル: /etc/namazu/mknmzrc
システム: linux
Namazu: 2.0.12
Perl: 5.008
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /etc/namazu
LIBDIR: /usr/share/namazu/pl
FILTERDIR: /usr/share/namazu/filter
TEMPLATEDIR: /usr/share/namazu/template
対応メディアタイプ:
application/pdf
application/x-bzip2
application/x-compress
application/x-gzip
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; xtype=rfc
text/x-hdml
text/x-roff
0284nobodyさん
05/03/12 00:24:13ID:???Template /apache/cgi-bin/namazu/index/all
としているから
常に index/all内のNMZ.head.ja
が読み込まれているということでないか
namazurcのTemplateの行をコメントアウトしてみたら
0285nobodyさん
05/03/17 23:30:42ID:???亀レスだけど、
Namazuでは 「/cgi-bin/namazu.cgi?idxname=aaa」 みたいな直接指定はNGだったはず。
きちんとhiddenとかから送らないと。
0286nobodyさん
2005/03/22(火) 21:53:42ID:???それってどこでNGにしてるんでしょ。Namazu本体じゃなくて
pnamazuとかインターフェースのところでやってるんですよね。
0287279
2005/03/30(水) 18:10:10ID:???検証が遅くなり申し訳ありませんでした。
サーバIPアドレス/cgi-bin/namazu.cgi?idxname=インデックス名&query=キーワード
で検索したらうまくできました。htmlにhiddenで指定した場合もOKでした。
ご教授ありがとうございました。
しかし検索結果はOKなのですが、aaaインデックスを検索しても結果はOKなのですが
ヘッダーの部分がallのもので表示されてしまいます。
(現在602 の文書がインデックス化され5,499 個のキーワード)
検索結果ページから再検索するとあるはずのページでも検索できません。
(allインデックス及びaaaインデックス両方とも。インデックスネームがうまく指定されない為?)
namazurcのTemplate部分をコメントアウトするとインストール時?の古いインデックスが
表示されてしまいます。
複数インデックスがある時のTemplate指定はどのように行っているのでしょうか?
0288nobodyさん
2005/03/31(木) 00:35:45ID:???Templateが選択される順序は説明書にあるとおり
http://www.namazu.org/doc/manual.html#form-idxnames
再検索をする際にWebブラウザで表示ページのソースを調べて
どのNMZ.headが読み込まれているか確かめてはどうですか。
0289nobodyさん
2005/11/11(金) 14:19:22ID:lZiu1JMN日本語全文検索ってほぼGoogleでカバーできてるのでは?
Winではあまり普及していないらしいし、導入に面倒がありそうだし
今、敢えてNamazuで検索を作るうまみってなんですか?
0290nobodyさん
2005/11/11(金) 20:34:38ID:???0291nobodyさん
2005/11/12(土) 23:40:29ID:???0292nobodyさん
2005/11/13(日) 06:11:00ID:???イントラの情報を検索できること
検索結果画面をカスタマイズできること
カテゴリ検索ができること
文書の最終更新日をファイルスタンプから識別できること
0293nobodyさん
2005/11/13(日) 08:31:58ID:???0295nobodyさん
2005/11/14(月) 10:06:19ID:???なるほど、イントラ内検索がGoogleにはないうまみっぽいですね。
だんだん鯰の位置づけがおぼろげながらわかってきました。
どうもありがとうございます。
0296nobodyさん
2005/11/14(月) 12:47:16ID:???あれは便利だお。
0297nobodyさん
2005/11/14(月) 16:16:53ID:???0298nobodyさん
2005/11/16(水) 14:03:06ID:???0299nobodyさん
2005/11/17(木) 13:26:17ID:???⊂⌒( ・ω・) はいはいわろすわろす
`ヽ_っ⌒/⌒c
⌒ ⌒
0300nobodyさん
2005/11/18(金) 11:32:18ID:ngwfG4IKハイライトされて、(そのページの上のほうからのテキストだけでなく)
検索された部分が表示されるというやるがあるらしいよ
と先輩に言われたのですが、どこにありますか?
あるいはカスタマイズで処理するもんなのですか?
教えてください。
0302nobodyさん
2005/11/21(月) 10:11:48ID:T4fDN5+Gありがとうございます、調べてみます。(`・ω・´)ゝ
0303nobodyさん
2005/11/21(月) 10:27:34ID:T4fDN5+Gたとえば文中にキーワードがヒットしても、プレビューで表示されるのは
そのページの文頭から指定文字数分ですよね?
それを、キーワードの該当部分前後をプレビューに表示させたい
という話でした。
0304nobodyさん
2005/11/25(金) 10:08:55ID:???指示者がEstraierと混同していた可能性大です。
自己解決しました。どうもありがとうございました。
0305nobodyさん
2005/12/14(水) 20:47:34ID:CwjBoKRvできればPHPでサイト内検索ができるスクリプトをご存知でしたら教えてください。
0308nobodyさん
2005/12/16(金) 05:48:32ID:+W2Wi6VX0310nobodyさん
2006/01/16(月) 09:59:58ID:rhuM8+qJこのPHPから出来上がるページをnamazuで検索したいと思っています。
どのような手法がありますでしょうか?
0311nobodyさん
2006/01/16(月) 11:43:50ID:???0312nobodyさん
2006/01/16(月) 13:00:54ID:rhuM8+qJそれとも、やはりこちら側であらかじめ静的ページを作っておいて、それをインデックス化するしかないでしょうか?
なんとかコマンド一発で出来ませんかね?
0313nobodyさん
2006/01/16(月) 17:28:20ID:???っていうシェルスクリプト書けば一発でしょ。
0314nobodyさん
2006/01/16(月) 20:36:24ID:???動的なページをインデックスするには
http://pc8.2ch.net/test/read.cgi/unix/1113150661/116
0315312
2006/01/16(月) 20:44:28ID:???>>313さん
>>314さん
親切にありがとうございます。
よくわかりました。とりあえずwgetの方法を試してみようと思います。
0316nobodyさん
2006/01/16(月) 22:22:45ID:???0317nobodyさん
2006/01/30(月) 18:45:25ID:???0318nobodyさん
2006/01/30(月) 21:42:38ID:???ISO-8859-* に関する文書の間違いを訂正
RedHat ソフトウェア namazu.spec の不必要なパッチは削除
File::MMagic 1.25 を同梱
MeCab の正式対応
mknmz に -b 及び --use-mecab オプションを追加
mknmz および namazu に --norc オプションを追加
mknmz に --decode-base64 オプションを追加
新しいフィルタ(Gnumeric, Koffice, Mainman/Pipermail, Zip, Visio)を追加
mknmzrc に MECAB, DENY_DDN を追加
ファイル名がDDN である時にスキップ。
日付フィールドによるソート機能の追加
nmzcat, nmzegrep コマンドの追加
フィルタの Windows 対応
(msword.pl, excel.pl, powerpoint.pl, postscript.pl, 等...)
OLE コントロールフィルタ更新
QUERY_STRING の区切りに';' 使用可能
Perl版テストプログラム(pltests) を追加
各種バグフィックス
0319nobodyさん
2006/01/31(火) 08:21:04ID:???0320nobodyさん
2006/04/02(日) 12:56:16ID:6BlopTUrは、MacのSafariで見れないのは、なんか理由があるのかな?
0321nobodyさん
2006/04/02(日) 13:02:03ID:???http://www.namazu.org/index.html.ja ならOK
Content-Locationヘッダをうまく扱えてないみたい。
他所ではちゃんとリダイレクトされるんだけど、namazu.orgではNG。なんでだろう?
0322nobodyさん
2006/04/07(金) 19:28:41ID:???何のファイルをサーバーに送れば良いのか教えてください。
0323nobodyさん
2006/05/16(火) 22:05:32ID:A+ClptH/ttp://www.namazu.org/installation.html
0324nobodyさん
2006/07/04(火) 21:14:27ID:t84VuxwjPHPでnamazu検索???
こんなの??
ttp://www.c-boxs.net/PHP/NamaP/
0325nobodyさん
2006/09/07(木) 22:19:16ID:n616cZBcこの勢いでローカルにある2ちゃん専ブラのdatファイルもインデックス化したいんですけど
良い文書フィルタはありませんか?
0327nobodyさん
2006/09/08(金) 09:21:57ID:???っていうか2ちゃんにどっぷりハマってるような
人間のクズは氏んだほうがいいぞ。
専ブラ+dat保存なんて、何をたくらんでいるのやら・・・おー、こわ。
0328nobodyさん
2006/09/08(金) 14:34:10ID:???0330nobodyさん
2006/09/29(金) 14:11:41ID:MXN7wOzE0332(^-^) ◆MONSOON/qo
2006/10/08(日) 05:28:42ID:aDf/+h/t記号は除外するとかです
0333(^-^) ◆MONSOON/qo
2006/10/08(日) 05:39:20ID:aDf/+h/t0334nobodyさん
2006/10/10(火) 01:41:58ID:???http://pc8.2ch.net/test/read.cgi/unix/1113150661/195-197
マルチで「自己解決」とは笑わせてくれるな
0335nobodyさん
2006/10/13(金) 09:24:55ID:???何でもそうなのだが、部分一致ができない。
ファッキントッシュは、バカの使うOS
を検索するとする
「ファッキン」で検索すると一致なし
「ファッキントッシュ バカ」 で検索しても一致せず
「ファッキントッシュはバカの使うOS」でやらないと一致しない。
まるでMSNの検索エンジンだ
あれとまったく同じ
0336nobodyさん
2006/10/13(金) 15:19:49ID:???0338nobodyさん
2006/10/14(土) 00:11:41ID:???「ホントかよ」とおもったんで、試してみたけど、ヒットするよ。
プレーンテキストで「ファッキントッシュは、バカの使うOS」と書いて
最後に改行して保存。
> まるでMSNの検索エンジンだ
というが同エンジンと思われる「Windowsデスクトップサーチ」でも問題なくヒットした。
Hyper Estraierでももちろんヒット。
>>335の環境がおかしいんじゃないのか?
0339nobody
2006/10/25(水) 22:26:22ID:J6B8Hktuどうやってモジュールをインストールするのか良く分かりません。
よろしければ、手順を教えていただけないでしょうか?
0340nobodyさん
2006/11/20(月) 17:03:35ID:???自分でモジュールをコンパイルするしかないです。
www.mail-archive.com/namazu-users-ja@namazu.org/msg00374.html
0341nobodyさん
2007/02/08(木) 12:03:48ID:Mb2H3yQx0342nobodyさん
2007/03/22(木) 22:02:22ID:???あと、インデクサや検索エンジンの分散処理ってどうやるのですか?
どっちもHyperEstraierでは標準で付属してるよね
0343nobodyさん
2007/03/22(木) 23:21:03ID:???0344nobodyさん
2007/03/22(木) 23:25:45ID:???Namazuサーバを複数稼働させといてクライアントで検索結果をマージできるシステムとか
ないの?
0345nobodyさん
2007/03/23(金) 00:11:38ID:???ttp://www.hpcss.is.ritsumei.ac.jp/Essay/2005/thesis/pdf/ohsaki.pdf
0346nobodyさん
2007/05/11(金) 16:16:19ID:???インデックスを作ると、終了できてないと思われるwordやexcelの
プロセスがガンガンできるんですけど解決方法はありますか?
0347nobodyさん
2007/05/11(金) 23:54:36ID:???0348nobodyさん
2007/08/22(水) 06:00:29ID:XEGA28iCファイルを開くことすらままなりませぬ(Cの知識皆無・・・
PerlかRubyからアクセスする方法を探してるんだけど
説明のあるページなどご存知の方いませんか?
0349nobodyさん
2007/08/22(水) 21:34:30ID:???www.namazu.org/doc/nmz.html.ja#w
に書いてあるとおり単なるテキストファイルに
1行に1単語で書かれているだけ
0350348
2007/08/23(木) 00:04:33ID:???このページは見ていませんでした。(トップページからリンクされてない?)
片っ端からファイルを見ていって、
開くことができたファイルの内容をチェックしていたんですが見落としてました。
ありがとうございました!
0351nobodyさん
2008/02/20(水) 20:07:39ID:fLDVdokdmknmzrcには200MBまでを検索対象にするよう設定してるんだが。
0352nobodyさん
2008/02/21(木) 22:15:05ID:7VDtsl8Sメモリじゃん?
0353nobodyさん
2008/02/22(金) 01:51:00ID:CRNkbfG60354nobodyさん
2008/03/27(木) 06:31:14ID:???あえてNamazuを使いたいのであれば構わないけど、
良い子は「Hyper Estraier」を使いましょう。
http://pc11.2ch.net/test/read.cgi/unix/1176807372/l50
0355sfOdHWpuZpBZYiqez
2008/06/13(金) 21:05:42ID:???0356nobodyさん
2008/07/19(土) 19:10:35ID:Hdkv0asv「1000」が「1,000」と表示されないようにしたいのです。
0357nobodyさん
2009/07/30(木) 06:41:54ID:???いきなりよく分からない壁に当たりましたので教えて下さい。
namazu自体よく分かりませんので、手探りでやっています。
色んなサイトを見て見た結果、とりあえずnamazu.cgiを
見てみないと始まらないようなのでftpでダウンロードしてみました。
ところが、namazu.cgiを開いたら文字化けが酷くて読めません。
使ってみたソフトはjeditx あとは、miです。
どうしてこういうことになったのでしょうか。
namazu.cgiが読めないとインデックスの更新もできない
ようなので先に進めない、と思われるのですが、
どなたか読む方法をご教授下さい。
0359357
2009/07/31(金) 01:45:58ID:???無茶振りで回って来ました。なのでショッピングカート
(詳細なcgi部分を除く)とサイトいじりまでくらいしか
分からないです。
namazu.cgi自体はおまけでついて来るものだということは
色んなサイトを見て雰囲気で今日分かりました。
そもそもnamazu自体は、レンタルサーバにインストール
されているべきなのか、自分のpcにインストールされているべきなのか
それも分かりません。とりあえず、コンソ−ルからftpで入って、
フィルタに使うファイルがたくさん有るディレクトリでmknmzをしても
動かなかったので、namazuのインストール自体はサーバではなくて、
本体にすると言うことでしょうか?ネットを調べても
自サーバメインのチュートリアルが多くて困っています。
とりあえずインデックスを更新するだけで良いです。
そもそもいきなり分かる訳が無いので多くは望んでいません。
人名の間違い登録は流石に放置できないので、質問した次第です。
大真面目なので、申し訳ありませんがよろしくお願い致します。
0361nobodyさん
2009/08/06(木) 13:05:55ID:???dxf用フィルタはもう配布していないのでしょうか?
0362nobodyさん
2010/08/12(木) 12:11:44ID:XzX6VOe90363nobodyさん
2011/12/10(土) 02:14:28.72ID:???0364nobodyさん
2011/12/14(水) 21:07:04.55ID:???0365 忍法帖【Lv=40,xxxPT】(2+0:8) 【24.8m】 電脳プリオン ◆3YKmpu7JR7Ic
2012/09/17(月) 23:00:05.28ID:????PLT(12079)∧_∧
( ・∀・) 人 ガッ
( つ―-‐-‐-‐-‐-‐○ < >__Λ∩
人 Y ノ. V`Д´)/
し(_) / ←>>153
0366nobodyさん
2014/01/22(水) 21:41:46.61ID:???■ このスレッドは過去ログ倉庫に格納されています