ページ内検索CGI
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
01/11/23 15:56ID:kVZIJzDkどなたかある場所を知っている方はいませんか?
0009名無しさん@お腹いっぱい。
01/11/26 02:09ID:???http://www.hyuki.com/netserv/google.html
0010名無しさん@お腹いっぱい。
01/11/28 01:33ID:9ZiQuRgSやっぱり、なまずがいいと思う。けどシェル使えないとできないよね?
0011親切な人
01/11/28 01:36ID:???ヤフーオークションで、凄い人気商品、発見!!!
コピーガードキャンセラー↓
http://page2.auctions.yahoo.co.jp/jp/auction/b18032656
注目のオークションに適用される事、
間違いないですね。
私も買いました。
皆も買いましょう。
0012名無しさん@お腹いっぱい。
01/11/28 11:46ID:???ローカルでインデックス作ってアップロード
0013名無しさん@お腹いっぱい。
01/12/16 04:09ID:cvkbkX7uやはり検索システムをどうするかで迷っています。namazu
よりいい(速いとか、複雑な検索式が使えるとか)全文検索
システムや、文節を区切らない完全な全文検索システムで
フリーのものはありますか?
(文節を区切らない ≒ 日本語に依存しないということで、
海外のサイトで聞く方がいい?)
0014名無しさん@お腹いっぱい。
01/12/16 04:36ID:???どう言うことデスカ?
解説キボン
001513
01/12/16 05:11ID:cvkbkX7unamazu だと文節区切りに chasen を使うか kakasi を使う
かとか、いろいろ考えることありますよね? 文節を切らな
くてもいいのであれば、日本語コードの統一さえすれば日本
語固有の問題について考える必要はずっと少なくなります。
要するに、文節を考えなければ binary string から binary
string を探す問題に落ちるので、言語依存は少なくなると
いう話です。
0016名無しさん@お腹いっぱい。
01/12/16 06:04ID:???利用したものってことかい?
0017名無しさん@お腹いっぱい。
01/12/16 10:31ID:???001815
01/12/16 18:11ID:/rU+i0dxN-gram を明示的に覚えさせるのはスペース食いすぎますよね。
その辺をどうするか、圧縮方法などについても最近いろいろ研
究されてるみたいですけど、フリーの実装は無いかな、と。
>>17
日本語と決め打てば、例えば全て EUC にした後(SJIS との混同
問題はとりあえず考えません)の binary match で OK ですよね?
あとは空白類をどうするか(たぶん全て省いてしまう)と、1 バイト
ずれた時にどうするか(各 EUC 文字の前に 0x7f とか適当に挿入
しておけば OK) を押さえれば問題ないと思うのですが。
0019名無しさん@お腹いっぱい。
02/01/27 15:34ID:???で結局どうなったですか?
0020名無しさん@お腹いっぱい。
02/02/01 14:20ID:???そんだったらutf-8とかに揃えたほうがよくない?
でなければ、検索に都合のよい独自エンコーディングを作ってしまうか。
0021山崎渉
03/01/15 13:55ID:???■ このスレッドは過去ログ倉庫に格納されています