ページ内検索CGI
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
01/11/23 15:56ID:kVZIJzDkどなたかある場所を知っている方はいませんか?
0002名無しさん@お腹いっぱい。
01/11/23 16:01ID:YACb9xmH0003名無しさん@お腹いっぱい。
01/11/23 16:24ID:kVZIJzDk0004名無しさん
01/11/23 17:16ID:VNvCM1edhttp://village.infoweb.ne.jp/~fwnk1502/data/howto.htm
0005名無しさん@お腹いっぱい。
01/11/23 17:21ID:kkIMnnEn00062
01/11/23 17:30ID:V3MaD290かかし>なまず
0007名無しさん@お腹いっぱい。
01/11/23 21:45ID:kVZIJzDk0008名無しさん@お腹いっぱい。
01/11/26 02:06ID:5luF+zhS(半角スペース)site:(ドメイン名)
とやれば、サイト内検索できます。
0009名無しさん@お腹いっぱい。
01/11/26 02:09ID:???http://www.hyuki.com/netserv/google.html
0010名無しさん@お腹いっぱい。
01/11/28 01:33ID:9ZiQuRgSやっぱり、なまずがいいと思う。けどシェル使えないとできないよね?
0011親切な人
01/11/28 01:36ID:???ヤフーオークションで、凄い人気商品、発見!!!
コピーガードキャンセラー↓
http://page2.auctions.yahoo.co.jp/jp/auction/b18032656
注目のオークションに適用される事、
間違いないですね。
私も買いました。
皆も買いましょう。
0012名無しさん@お腹いっぱい。
01/11/28 11:46ID:???ローカルでインデックス作ってアップロード
0013名無しさん@お腹いっぱい。
01/12/16 04:09ID:cvkbkX7uやはり検索システムをどうするかで迷っています。namazu
よりいい(速いとか、複雑な検索式が使えるとか)全文検索
システムや、文節を区切らない完全な全文検索システムで
フリーのものはありますか?
(文節を区切らない ≒ 日本語に依存しないということで、
海外のサイトで聞く方がいい?)
0014名無しさん@お腹いっぱい。
01/12/16 04:36ID:???どう言うことデスカ?
解説キボン
001513
01/12/16 05:11ID:cvkbkX7unamazu だと文節区切りに chasen を使うか kakasi を使う
かとか、いろいろ考えることありますよね? 文節を切らな
くてもいいのであれば、日本語コードの統一さえすれば日本
語固有の問題について考える必要はずっと少なくなります。
要するに、文節を考えなければ binary string から binary
string を探す問題に落ちるので、言語依存は少なくなると
いう話です。
0016名無しさん@お腹いっぱい。
01/12/16 06:04ID:???利用したものってことかい?
0017名無しさん@お腹いっぱい。
01/12/16 10:31ID:???001815
01/12/16 18:11ID:/rU+i0dxN-gram を明示的に覚えさせるのはスペース食いすぎますよね。
その辺をどうするか、圧縮方法などについても最近いろいろ研
究されてるみたいですけど、フリーの実装は無いかな、と。
>>17
日本語と決め打てば、例えば全て EUC にした後(SJIS との混同
問題はとりあえず考えません)の binary match で OK ですよね?
あとは空白類をどうするか(たぶん全て省いてしまう)と、1 バイト
ずれた時にどうするか(各 EUC 文字の前に 0x7f とか適当に挿入
しておけば OK) を押さえれば問題ないと思うのですが。
0019名無しさん@お腹いっぱい。
02/01/27 15:34ID:???で結局どうなったですか?
0020名無しさん@お腹いっぱい。
02/02/01 14:20ID:???そんだったらutf-8とかに揃えたほうがよくない?
でなければ、検索に都合のよい独自エンコーディングを作ってしまうか。
0021山崎渉
03/01/15 13:55ID:???■ このスレッドは過去ログ倉庫に格納されています