検索エンジンをつくりたい
■ このスレッドは過去ログ倉庫に格納されています
0001yam ◆AyW.Rdbg
01/12/22 23:16ID:???自力で商用化をしたいんだけれど、
開発費用っていくらぐらいかかる?
信頼のおける技術者も探しています。
0002名無しさん@お腹いっぱい。
01/12/22 23:26ID:???スゲー面白そうじゃん、俺も参加しよ!!!!
みんなもやろーぜ!!!!!!!!
0003名無しさん@お腹いっぱい。
01/12/22 23:28ID:w+4+eLNdいまさらYahooでもないでしょう。
とりあえず、全文検索についての技術動向は
こちらが手軽にまとまっています。
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html
0004名無しさん@お腹いっぱい。
01/12/22 23:28ID:???あんなの利用するのネット暦半年未満ぐらいの人だよ?
いまさら同じアイデアで成功するとでも思ってるの?
0005名無しさん@お腹いっぱい。
01/12/22 23:33ID:???で、なんで>>1と同じメールアドレス?(w
0006名無しさん@お腹いっぱい。
01/12/22 23:34ID:1geb76gF開発費用は有能なプログラマを捕まえられるかどうかにかかってる。
有能なヤツつかめば驚くほど早くできるが
無能なヤツつかむとどれだけ人数と時間をかけてもはかどらん。
ま、有能なヤツは給料もタプーリ払わないとだめだけどね。
0007yam ◆AyW.Rdbg
01/12/22 23:35ID:???>>4さん
まさにそのとおりなんだけど、
あんなの利用しにくいから、つくってしまえ、と。
アイデアを話せば、なるほど、と思われる(あるいはひとりがてんと
笑われるかもしれないけれど)、
うまくいけば、第二のヤフー(大金持ち)も夢ではない
と思っています。
>>3さん
じっくり読んでみます。ありがとう
0008yam ◆AyW.Rdbg
01/12/22 23:36ID:???僕も不思議です。
>>2さん。人のメルアド使わないでね^^
0009yam ◆AyW.Rdbg
01/12/22 23:37ID:???>>6さんは
>>5さんの誤りです。^^
0011名無しさん@お腹いっぱい。
01/12/22 23:58ID:???みなさん協力してあげてください!!!!
0012yam ◆AyW.Rdbg
01/12/23 00:01ID:???画面という誌面の中で、
どういう工夫を施せば、もっと使える検索サイトになるかを、
(言い方は悪いけれど)
アメリカのWEB製作馬鹿(=別にヤフーをいっているわけではありません^^)
よりは、知っていると思います。
仕事がら検索サイトでの検索をよく利用するけれど、
「なぜ、こんな馬鹿な検索サイトをつくる!!」と日々怒っています。
それならつくってしまえ!と。
コネもなく、技術もなく、お金もない・・。
だから、まずは2chで、現状やご意見、我こそは、という人を探してみたいと思ったわけです。
0013名無しさん@お腹いっぱい。
01/12/23 00:07ID:???じゃ、ムリ
0014名無しさん@お腹いっぱい。
01/12/23 00:08ID:???0015yam ◆AyW.Rdbg
01/12/23 00:16ID:???>>14さん
だと、思います。だけど、そういってあきらめては、何も前進しない。
希望は、といえば、僕の考えに賛同してくれて、
成功を信じてプログラムをつくってくれる(成功報酬で。つまり失敗すれば無償)
優秀で奇特な人を探したい・・というのが本音かな。
そんな人がいたらメールください。
会って話しましょう。
0016名無しさん@お腹いっぱい。
01/12/23 00:19ID:???0017名無しさん@お腹いっぱい。
01/12/23 00:23ID:???運用は、まず無理だろなー。金がないと。
0018yam ◆AyW.Rdbg
01/12/23 00:24ID:???>運用は、まず無理だろなー。金がないと。
その運用のお金っていくらぐらいなんでしょうか?
0019yam ◆AyW.Rdbg
01/12/23 00:31ID:???買い手(運用者)はいくらでもいると思っています。
評価されなければ、実際に運用しても仕方がない。
運用は、評価のための、最小限の運用でよいと思っています。
0020名無しさん@お腹いっぱい。
01/12/23 01:06ID:???>>1に技術が無ければ無理。
0021名無しさん@お腹いっぱい。
01/12/23 01:10ID:???> どういう工夫を施せば、もっと使える検索サイトになるかを、
> (言い方は悪いけれど)
> アメリカのWEB製作馬鹿(=別にヤフーをいっているわけではありません^^)
> よりは、知っていると思います。
出版系の人って紙の印刷物での手法をwebにも持ち込もうとするけど、
単にあなたがweb系の表現方法に慣れてないというだけのことはない?
0022yam ◆AyW.Rdbg
01/12/23 01:25ID:???web系の表現方法ではなく、考え方です。
使う側の立場に立った、
検索サイトのあり方を問題にしています。
けっして表現の部分ではありません。
また、「web系の表現方法に慣れる」という、
習熟を利用者に強いるようなコンテンツは、そもそも最悪と考えています。
0023名無しさん@お腹いっぱい。
01/12/23 01:39ID:???コンテンツは大抵パワーユーザーには無視される。
単純に、「わかり易いもの」=「良いもの」じゃない。
どんな「使う側」の立場に立つつもりかは知らんけどね
0024名無しさん@お腹いっぱい。
01/12/23 02:18ID:???> 習熟を利用者に強いるようなコンテンツは、そもそも最悪と考えています。
何をするのにもある程度の習熟は必要だと思うけど。
自転車に乗るのには習熟が必要だけど、サイクリングロードなんかの施設は最悪?
0025名無しさん@お腹いっぱい。
01/12/23 02:27ID:???これは世の中の初心者さんの事を言ってるんか?
それとも、自分の事? つまりこう言う事?
「車を買ったが、こんなにスイッチが有るのは大変なので車を作ろうと思います。
因みに、僕は八百屋をやっていて無償で手伝ってくれる人を探しています!!」
・・・・無理! あきらめろ
0026名無しさん@お腹いっぱい。
01/12/23 02:30ID:aSYtfI1G(本気でやるなら)
0027名無しさん@お腹いっぱい。
01/12/23 02:34ID:???0028名無しさん@お腹いっぱい。
01/12/23 02:47ID:???各アルゴリズム本小一年位読めば、何とかなると思うよ
0029名無しさん@お腹いっぱい。
01/12/23 02:59ID:SWcGUWvj君よりかしこい人たちが沢山お金と時間をかけて検索エンジンってのは開発、管理、運用されているんだよ。
0030名無しさん@お腹いっぱい。
01/12/23 03:41ID:???なくてウェブディレクトリを言うのだが。今ではYahoo!もportalの一貫として
検索サービス(今はgoogle)へのゲートウェイも提供しているけどね。
0031名無しさん@お腹いっぱい。
01/12/23 12:29ID:1kn+Hw33技術なんて目的が伴って始めて意味もつんでさ。
何のために検索するのかとか、考えたこと無いでしょ?
0032名無しさん@お腹いっぱい。
01/12/23 13:51ID:???「ヤフーのような検索エンジン」の意味が分かりません。
「ヤフーレベルの検索エンジン」という意味でしょうか?
「ヤフーのような」ならゼロ円でききるし、「ヤフーレベル」なら
サーバー管理・費用など含めて100万200万の話じゃないような気もしますが。
そもそも現状Webの世界では技術開発よりも運用ポリシーの方が大事で、
まずそれを決めてから既存の技術をどう組み合わせるかを考えます。
それにヤフーは検索エンジンだけでなく様々なコンテンツとのシナジーで
さらに集客があがり、その結果商用(広告)として成り立ってます。
つまり、1>さんは何がしたいのですか?
0033名無しさん@お腹いっぱい。
01/12/23 14:32ID:???素人が採算の見こみもとれずにやっていけるところじゃない。
あと自作自演はすぐに分かるからやめてくれ。
0034名無しさん@お腹いっぱい。
01/12/23 15:59ID:???例えるなら1はロックが好き、そこで張り紙を出した
有能なバンド仲間募集しています、私は何もできません。
あほ
0035名無しさん@お腹いっぱい。
01/12/23 19:17ID:9yh03zgW極端過ぎるよアホ
0036名無しさん@お腹いっぱい。
01/12/23 20:31ID:???どうせならGoogleみたいな検索エンジンを作ってくれよ>>1
0038名無しさん@お腹いっぱい。
01/12/25 19:32ID:???5,33氏は早速死亡ですか。
#ひさびさの本物電波か中坊に出会って少々興奮してます、私
0039名無しさん@お腹いっぱい。
01/12/25 19:59ID:q4MWoNT+0040名無しさん@お腹いっぱい。
01/12/26 12:40ID:???0041名無しさん@お腹いっぱい。
01/12/26 18:26ID:???0042名無しさん@お腹いっぱい。
01/12/26 20:54ID:???スパムメールでも送りまくるのか?(w
0043名無しさん@お腹いっぱい。
01/12/27 09:03ID:???Googleを超えるの作れば集まるだろうよ。
>>1には無理だが。
0044名無しさん@お腹いっぱい。
01/12/29 18:59ID:???>>1よ。
個人の要求に応じて日々ネットを飛び回って、
要求に合ったWebを発見したら通知してくれる
「エージェント」を作ってくれ。
※技術的に極めて難しいのは承知の上。
0045nobodyさん
02/04/19 03:03ID:???( ゚曲゚) < 日下部は俺一人でいい…!
/⊂彡Vミつ \_________
|_ζ<O> ζ
(_)_)
0046名無しさん
03/01/03 01:26ID:???Λ_Λ | 君さぁ こんなスレッド立てるから |
( ´∀`)< 厨房って言われちゃうんだよ |
( ΛΛ つ >―――――――――――――――――――‐<
( ゚Д゚) < おまえのことを必要としてる奴なんて |
/つつ | いないんだからさっさと回線切って首吊れ |
\____________________/
(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)
(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)
(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)
0047nobodyさん
03/01/03 23:29ID:qJ+hUpKoこの人が作った雑誌を見てみたい。
勘違い糞雑誌(社)のなんと多いこと。
中途半端に出てくるくらいなら一生紙にしがみ付いてろ。
0048山崎渉
03/01/15 13:36ID:???0049nobodyさん
03/02/02 07:36ID:???2 :名無しさん@お腹いっぱい。 :01/12/22 23:26 ID:???
>>1
スゲー面白そうじゃん、俺も参加しよ!!!!
みんなもやろーぜ!!!!!!!!
0050検索エンジン占い
03/02/22 06:00ID:UEOb4JQUhttp://www.fm8283.sakura.ne.jp/um/view?id=2048
0051山崎渉
03/03/13 17:13ID:???0052山崎渉
03/04/17 12:24ID:???0053山崎渉
03/04/20 06:09ID:???( ^^ )< ぬるぽ(^^)
0054t-akiyama
03/05/20 17:55ID:???このPSPは、新規格UMD(ユニバーサルメディアディスク)というディスクを利用しており、そのサイズは直径6cmととても小さい(CDの半分程度)。 容量は1.8GBとなっている。
画面は4.5インチのTFT液晶で、480px x 272px(16:9)。MPEG4の再生やポリゴンも表示可能。外部端子として、USB2.0とメモリースティックコネクタが用意されているという。
この際、スク・エニもGBAからPSPに乗り換えたらどうでしょう。スク・エニの場合、PSPの方が実力を出しやすいような気がするんですが。
任天堂が携帯ゲーム機で圧倒的なシェアをもってるなら、スク・エニがそれを崩してみるのもおもしろいですし。かつて、PS人気の引き金となったFF7のように。
0055山崎渉
03/05/22 02:11ID:???0056山崎渉
03/05/28 17:15ID:???ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。
=〔~∪ ̄ ̄〕
= ◎――◎ 山崎渉
0057nobodyさん
03/06/24 04:27ID:GbEoFmirうぉぉぉぉぉぉ!!!!素晴らしい!!!(*´Д`*)ハァハァ
http://plaza16.mbn.or.jp/~satchel/oikawa_nao/
0058山崎 渉
03/07/15 11:11ID:???__∧_∧_
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
~ ̄ ̄ ̄ ̄
0059山崎 渉
03/08/02 02:40ID:???( ^^ )< ぬるぽ(^^)
0060ぼるじょあ ◆ySd1dMH5Gk
03/08/02 05:24ID:???ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。
=〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
= ◎――――――◎ 山崎渉&ぼるじょあ
0061山崎 渉
03/08/15 22:53ID:???│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン
0062nobodyさん
04/02/19 20:28ID:K/zLomxJ【求む!】ロボット検索エンジンのprog【教えて!】
http://pc2.2ch.net/test/read.cgi/php/1009507473/l50
検索エンジンつくりたい
http://pc2.2ch.net/test/read.cgi/php/1063529003/l50
YomiサーチPHP化プロジェクト
http://pc2.2ch.net/test/read.cgi/php/1044371877/l50
0063nobodyさん
04/02/19 20:32ID:???検索エンジン製作に関するスレになりました。
0064nobodyさん
04/02/20 04:34ID:???PHP+MySQLでヤフー式の簡単な検索エンジンを制作する場合
どのくらいのアクセス数、登録数に耐えられると思う?
0065nobodyさん
04/02/20 07:48ID:+ZtOPAr+0066中の人
04/02/20 09:10ID:2ykvpncxどんなマシンを何台使うかによるよ。
あと、検索精度にどの程度こだわるかにも。
フレイズ検索は不要と割り切ればMySQLでもそれなりにスケールするだろう。
0067nobodyさん
04/02/20 12:31ID:???俺同じようなのPerl+Accessで作ったけど
Accessでも10万件くらいはいけるんじゃないの?
とか楽観的に考えてる。
0068nobodyさん
04/02/20 15:18ID:pO9W6gy/例えばマシンはレン鯖によくある下記のスペックだとする
OS:RedhatLinux
CPU:Pen4 2.4GHz
RAM:1GB
HDD:120GB×2(RAID)
回線:光100Mbps
俺としてはYomi-searchほどあれこれ機能がついてなくてもいい。
用は検索の鮮度を上げることと、下位に位置するページも
見やすいような作りを望むわけだ。下位ページが悪いわけじゃないし。
>>67
個人、(もしくは中小)規模の人間が数人でせっせとやったところで
現状、大手の検索エンジンがある以上、数年でせいぜい10万件が限度だと思う。
と考えると、問題は数より中身で勝負なわけで。
検索スピードは最低でもYAHOOやGoogleと同レベルにする必要はある。
そして+αの機能。ランキングやアクセス数以外の面で何かユーザーにとって
”使いやすい”機能を提供しなければならない。
0069nobodyさん
04/02/21 19:46ID:???0070中の人
04/02/22 12:19ID:n4Z2WSBu1日10万アクセスぐらいは楽にこなすと思う。
MySQLで作っても大丈夫でしょう。
+αの部分がどれだけの計算量を必要とするかにもよるが。。
0072nobodyさん
04/02/22 16:40ID:???なるほど。あとは+αの部分だな。。RSSを絡めるのもいいとは思うし
アマゾンみたいに自分にあったサイトを抽出するような機能を
出せるのもいいとは思うが、それだとかなり大変そうだしな・・。
>>71
書き方が悪かった。個人や小規模の場合、YAHOOやGoogleなどの
組織と比べて動ける範囲や予算も知れてるだろうって事。
リンク獲得も人や金がいるだろうしね。
0073nobodyさん
04/02/22 23:54ID:???0076nobodyさん
04/02/23 19:15ID:XTMpAAWU俺としては基本的にYomi-Searchほどの機能は無くてもいいと思う。
特にランキング関係はサイトの差別化になり、良くないし。
だからYAHOO!のように地味でもキーワードにあったサイトを出すのが一番だろうね。
あとはジャンル化。Googleで検索しても目的のキーワードで拾えない
事が多々あるから専門分野に特化した検索エンジンなら効果あるかもね。
例えば野球の検索エンジンで試合結果をすばやく更新した
サイトを検索結果で上位に持ってくるとかね。
サイトのupdateの時間と野球の大体の試合時間を予測(もしくは手動で観察)
する必要があるけど、野球を見逃した人なんかは試合結果を気になって検索するしね。
0077nobodyさん
04/02/23 22:35ID:???それだけ見るといわゆる「アンテナ」でいいじゃんって感じがする。
野球系の役に立つサイトを100個ぐらいあつめてアンテナに登録して
おけば>>76に書いてあることは実現できるよね。
俺は「検索はアバウトだから良い」と思っているのでそういう特化した
検索エンジンはいらない。むしろ多少外れた内容がたまにあるから知識
が深くなることも多いと思う。
ところがたまに外れ過ぎるときがあるのと、ピンポイントでの検索を
行いたい時に困る。
あ、これ書いていたら良い方法が思い付いたかも…。
007977
04/02/24 00:24ID:???いや、『方法が思い付いた』と言っても何かアルゴリズムが思い付いたとか
ではなくて『もし、こんなことが可能なら理想に近くなるかも!?』と思った
程度の話。
しかも、紙に書きながら考えをまとめようとしているが、まったくまとまらん。
とりあえず、検索エンジンだけで成り立つシステムではないなぁ。
ってか自分でもよくわからん。
0080nobodyさん
04/02/24 00:51ID:???なるほど。例えば商売にするわけじゃなくてもはやりそれなりの反響は欲しいわけで
機能を限定したユーザーだけが利用するような検索エンジンを作っては
範囲がかなり狭まるからね。
俺もなんとなく”イメージ”は沸くんだが、なかなか口に出していえない。
ようはサイトに登録する人・観覧する人双方それぞれが得をして
その仕組みによってインターネットを活用する人が更に増えればいいんだけどね。
今は誰でもどんなページでも検索エンジンに登録できて
「野球」というキーワードで検索しても野球のサイトが出なかったりするし
それぞれ目的が違うしね。(試合結果を見たいのか、大リーグの応援サイトを見たいのか等)
と↑を書いてたら俺も微妙に浮かんではきてるんだけどねw
008177
04/02/24 01:33ID:???>「野球」というキーワードで検索しても野球のサイトが出なかったりするし
俺は違うと思う。
あくまで検索エンジンはできる限り多くのデータを持っているべきで、それを
『どのように』選ぶかで悩むべきだと思うんだ。
今何となく思っているのは
『野球についての良いサイトを見つけたかったら、野球について良く知っている
人に聞くのが1番』だということ。
ほんと、よくわからん(藁
0082nobodyさん
04/02/24 05:07ID:UjHo5qOk『どのように選びべきかで』という文と「俺は違うと思う」ってなんかおかしくない?
俺が感づいてないだけならすまん。。
>『野球についての良いサイトを見つけたかったら、野球について良く知っている
>人に聞くのが1番』だということ。
そのデータの”取捨て”が難しいわけで。データ量が多い=野球に詳しいってわけでもないし。
上でも書いたけどいくら検索エンジンが多くのデータを持つことが大事だとはいえ
”正確さ”ってのが大事なわけで。GoogleとYahooと比べて正確さなら明らかにYahooなわけで。
なぜなら人が見てカテゴリを判断してるからね。
俺も自分の話で悪いが「正確さ」を求める時はYahooでカテゴリ検索する。
上の例で言うと野球の有名な(情報量の多い)サイトを探したい場合、Yahooならあるが
Googleの場合、違うサイトが引っかかる場合があるからだ。漠然とキーワードが定まらない
場合はGoogleはいいけど、ある程度目的が決まっている場合はYahooになる。
このYahooの”正確さ”を手動ではなく自動で解析できるようになるといいんだけど
単にhtmlのtitleやmetaタグの文字を参考にするだけでは正確さが出ないしね。
なぜなら登録時に偽りのデータを書けるわけだし。
008377
04/02/24 05:36ID:???>『どのように選びべきかで』という文と「俺は違うと思う」ってなんかおかしくない?
>俺が感づいてないだけならすまん。。
伝わらない? ごめん
要するに『どんなページでも登録できる』ことが『目的のキーワード
の検索結果を濁らせる』わけではないと思う、ということ。
どんなページでも登録できて、かつ良い検索結果を出すのが理想だよね。
今考えている方法だとデータの取り捨ては重要ではなさそう。
もしも、もしもだけど、Google利用者が毎回各検索結果に対して
得点付けをしたらどうなるだろう。
それで、利用者はGoogleに対して『野球が好きな人が付けた得点のみを
採用』するように設定する。正の得点も負の得点も(つけてないものは0かな)。
言い方を変えると「野球好きな人が良いと判断したサイト」に重みを
かけるようにする、ということ。
問題は大きく分けて二つ。
1. 得点付けなんて面倒なことしたくない(しかも自動化は難しい)
2. どのユーザが野球好きかなんて分からない
この両方が解決したら、楽しそうだよね。
一応頭の中では解決しているのだけど、別の問題が多々…。
0084nobodyさん
04/02/24 06:46ID:UjHo5qOk>の検索結果を濁らせる』わけではないと思う、ということ。
なんとなく分かった気がするw
で、77の新提案だがそれはYahooのレビューサイト(本とかCDとか)を見ると答えが出ると思う。
あそこは2ちゃんからの荒らしが多いのか、めちゃくちゃだw
それに自分の検索結果だけを投票するようなスパム行為も行われることだろう。
俺が一番、検索システムで改善して欲しいポイントが「新規サイト」に関してだ。
Googleでも最近、登録されたサイトは上位にくる傾向にあるようだが
基本的に1ページ10サイト(Yahooなら20?)しか表示されないわけで
どう考えてもやったもん勝ちの新規参入がしにくい。
まぁ、実店舗と比較すると実店舗も中々大手には勝てないから地道にするしかないんだけど
ネットだとその差が激しいと思って。実店舗だととりあえず「新規開店時の優遇」があるけど
ネットの検索エンジンだとあまり効果が無い。まぁ、Yahooぐらいなサイトになると
新着サイトに載るのは効果があるけど、Yahooは手動だから論外なわけで・・。
何がいいたいかというともっと新規参入者が参入しやすい体制を作れないかな?と思うわけ。
そしてネットを数ヶ月していて毎回同じサイトばかり見ている人に
「こんなサイトが新しく出来ましたよ〜」っていう良い方法がないかな?と思って。
両方、提供する側・される側にとっても有益になると思うし。
うまくかけなくてごめん。。
0085nobodyさん
04/02/24 06:58ID:???いくつか手段を考えているがどれも解決しない。。
・ユーザー登録したユーザーに新着サイトを随時メールする
→うざがられてほとんど見ないと思う。
・検索するたびに新着サイトを表示
→限られている画面上では検索結果の情報と比べて限界がある。
・検索するたびに毎回表示されるサイトを変える(ランダム表示)
→検索エンジンの信頼性を欠く
・アクセス数、アップデート回数、投票数などで順位を決める
→不正が可能だし、cookieで制御しても数的に新規参入はなかなか上がれない
0086nobodyさん
04/02/24 07:41ID:???008777
04/02/24 14:16ID:???>>86が言う通り新しいサイトだからといってみる価値があるとも限らないよね。
でもこれが「新規ページ」ということならば同意。
単純に「過去一か月にアップされたページ内から検索」ができたら面白いかも。
「新規ページ」はリンクもあまりされていないからなかなか上位に入りにくいからね。
>・検索するたびに毎回表示されるサイトを変える(ランダム表示)
これは*うまくいけば*面白いと思うけどな。
Googleにランダム用のボタンでも作っておけば楽しいかもしれない。
というかこれならGoogle APIで実現可能(シンプルな方法ならば)。
話は変わるけどGoogle APIってどれくらい利用されてるんだろう。
俺は.NET使えないから、使うとしたらJavaかぁ。
最初はGoogleのデータベースを利用して形にしてみるのも良いかもな。
0088nobodyさん
04/02/24 18:21ID:D2PfXOG1・カテゴリ型検索エンジン
・ロボット型検索エンジン
・人力検索エンジン
0089nobodyさん
04/02/24 20:45ID:???0090nobodyさん
04/02/24 22:18ID:???何検索したかも覚えてないぞw
0091nobodyさん
04/02/24 23:11ID:???通常は
「サイト名」登録日
サイトに関する情報
で、Yomi-seachなら前にバナーを表示させたり、クリック数を表示させたりできるわけで。
”バナー”って個人サイトなんかだとそのサイトの色を示せるから結構、楽しいんだけど
逆に安っぽさがあったり、表示に時間かかったりするわけで。
かといって単に文字だけ表示だと文字に埋もれて醜いわけで。(電話帳のごとく・・。)
表示方法もそうだけど、表示件数も難しい。1ページ10件ぐらいが妥当だと思うが
逆にそれだと上位数ページしか見ないという問題も出てくるし・・。
検索結果の表示法ほうってのもかなり重要な気がする。
0092nobodyさん
04/02/24 23:24ID:???余計なもんがひっかかるだけだからやめろ
0093nobodyさん
04/02/25 01:15ID:???一つだけ言えるのは検索結果の表示にバナーは必要ない。
バナーなんてサイト運営者のエゴ以外の何者でもない。
検索する人の立場になって考えましょう。
Yomi-Searchの作者は利用者への配慮に欠けてる。
検索結果の画面も見にくくてしゃーない。
0094nobodyさん
04/02/25 01:23ID:???http://www.kent-web.com/pubc/navi/cruiser.cgi
0095nobodyさん
04/02/25 02:18ID:???例えば本屋のサイトを作る時の検索システムでもいるじゃん。
別にYahooやらGoogleに対抗する為だけにあるわけじゃないし。
>>93
確かにそうだな。「面白い」と感じることがあっても見る人の立場には立ってないし。
なんしか、良い表示方法は無いかな・・。
0096nobodyさん
04/02/25 02:25ID:???検索結果の表示はシンプルイズベストだと思うけどね。
「サイト名」登録日
サイトに関する情報
で十分だと思うけどねぇ。
関係ないけど最近見つけたアイデア検索エンジン
http://web-pasha.com/
0097nobodyさん
04/02/25 02:33ID:???あるジャンルに特化した検索エンジンって必要だと思うよ。
例えば飲食店の検索エンジンがあったとして、最寄の駅、
扱ってる料理の種類、営業時間などを指定して検索できるとする。
これらはGoogleやYahooでは検索しきれないものだと思うんだよね。
(YahooにはYahooグルメとかあるけどね)
あるジャンルに特化した検索エンジンを作るというのは
検索エンジン戦国時代の今を生き抜く一つの手だと思う。
0098nobodyさん
04/02/25 02:37ID:???そこいいね。実用向きかどうかは別にしてなんか面白い事してる。
そういえば、gooが3D検索みたいなのをはじめたっけ。あれと似てるな。
>検索結果の表示はシンプルイズベストだと思うけどね。
>「サイト名」登録日 サイトに関する情報 で十分だと思うけどねぇ。
確かに”十分”なわけだけど、なんか”物足りない”んだよね。
文字がただ並んでいるだけでは電話帳と変わりないし
サイトの説明文だけ見ても内容は開くまで分からないわけで
いまいち、合理性に欠けるというか。といいつつ、一番いいことは確かだけどね。。
0099nobodyさん
04/02/25 03:56ID:???凄い分かる、十分だけど十二分じゃないんだよね。
でも同時に思うのは、検索エンジンはそれ自体は所詮ツールだから
変な個性よりも直感性が大事ってこと。
Kart00:http://www.kartoo.com/
これなんかは面白いけど、どう考えても実用的ではない。
俺はGoogleみたいな表示形式でもう少しサイトの要約が多く表示されると
うれしい。それこそ今の倍ぐらいの要約テキストがあってもいいぐらい。
それこそ2chブラウザで「>>1」の上にカーソル乗っけた時みたいに、サイト名
の上にカーソル乗っけるとサイトの全文(または一部)がポップアップするような
機能が欲しい。
0100nobodyさん
04/02/25 06:51ID:???タイトルにマウスを載せたときに2chブラウザの要約みたいに
せめてmetaの内容でも出ると面白いね。
でも、そうなると基本的にはIE(ブラウザ)に依存するわけだから
プログラム的にはどうしようもないけどね。
Javascriptを使ってマウスオーバーにしてポップアップを表示して、とか出来そうだけど
これだとちょっと話が変わってくるし。。
0101nobodyさん
04/02/25 10:55ID:???Flashの普及率は良いと言われているし、好きなUI実装できるよ?
0103nobodyさん
04/02/25 17:39ID:zi0n15ep今後も復旧するだろうけど、見る人の立場になるとどんなもんかと。。
(TVCMの動画とか3Dが決して評判がいいわけじゃないのと同じで。。)
なんしか、「早い」「見やすい」「わかりやすい」
検索システムが必要なわけで。それもジャンルに特化した。
0104nobodyさん
04/02/25 18:00ID:???と思うとなかなか難しいもので。
0105nobodyさん
04/02/25 18:07ID:???本気で何かを探そうとしている時に「FLASHロード中…」なんてメッセージ
みたくないよね。
ジャンルに特化するのは良いと思うけど、特化しにくいジャンルはどうすればいい?
本や映画などのようなものは良いけど、「検索エンジン アルゴリズム」みたいな
キーワードで検索したい時はジャンルは何? 「プログラム」ってジャンルは広すぎる
し、「検索エンジン」じゃ狭すぎる。
こういう時にどうしても「オールジャンル」な検索エンジンが必要になる。
それはともかく…
Google APIを使ってGUIな検索ツールっていうのはどうだろ?
ブラウザ密着でなくなるから使いにくくなるかな?
おまけ:http://www.mamma.com/index.html(以外といい感じに使える…)
0106nobodyさん
04/02/26 02:40ID:???そうゆうのはGoogleにお任せで。
0107nobodyさん
04/02/26 10:21ID:???0109nobodyさん
04/02/26 14:55ID:khyHj+7Hだって君達検索エンジン作るって言ったって
YomiとかCosmoNaviとかの既存のスクリプト使って作るんだろ?
それとも一から自分で作るのか?
0110nobodyさん
04/02/26 15:00ID:QRXddEDf/´  ̄`ヽ,
/ 〃 _,ァ---‐一ヘヽ
i /´ リ}
| 〉. -‐ '''ー {!
| | ‐ー くー |
ヤヽリ ´゚ ,r "_,,>、 ゚'}
ヽ_」 ト‐=‐ァ' !
ゝ i、 ` `二´' 丿
r|、` '' ー--‐f´
_/ | \ /|\_
/ ̄/ | /`又´\| |  ̄\
俺様がみあか様だーよ キヒヒ
悔しかったらここまできな
http://school.2ch.net/test/read.cgi/senmon/1074344178/l50
0112nobodyさん
04/02/26 23:27ID:???嘘?マジで?
Yomi-SearchとかCosmoNaviとかAmigoNavigatorなどの
既存の検索エンジンスクリプトを使わないなんてすごいね。
ちなみにもう自作のスクリプトは動いてるのかなみんな?
0114nobodyさん
04/02/27 11:14ID:???Yahooのようなカテゴリ型の検索エンジンの話と仮定すると
あのYahooのカテゴリの階層ってどのように管理すればいいのかとか
カテゴリのショートカットはどうしようかとか結構大変でしょ?
0115nobodyさん
04/02/28 10:13ID:???0116nobodyさん
04/02/28 17:31ID:+L9rAJmN0117nobodyさん
04/02/28 18:00ID:???http://yellow.ribbon.to/~mil/
0119nobodyさん
04/02/28 23:15ID:+L9rAJmNやっぱり自前で作る場合、Yahooレベルのものを作るのは無理かな?
0120nobodyさん
04/02/29 01:44ID:???精度を気にしないなら GETA とか使ってクラスタリングするといい。
0121nobodyさん
04/02/29 01:45ID:???0122nobodyさん
04/02/29 05:52ID:???0125nobodyさん
04/03/03 01:18ID:lXnthRs50126nobodyさん
04/03/03 13:22ID:???このエンジンは気持ちは分かるが、作りこみが今一かな
更新作業が楽そうで本当は手を焼いてるんじゃないかと思う
0127nobodyさん
04/03/03 20:52ID:???0128nobodyさん
04/03/03 23:21ID:lXnthRs5カテゴリ型なのかロボット型なのか。
使用言語は何か。データはテキストで扱うのか、それともDBに格納するのか。
0129nobodyさん
04/03/04 00:02ID:???0130nobodyさん
04/03/04 05:13ID:naRm3zqcyomi程度なら誰でも簡単に作れるだろうし、自分で作った方が自由度は高い。
一番の問題は登録するデータをどう増やすのか。
検索サイトを作ったは良いが、登録データが増えず放置されるケースが多い事!
0131nobodyさん
04/03/04 05:50ID:???俺はカテゴリ型でPHP+MySQLで目標10万件を予定してます。
>>130
登録データが増えずに放置されるケースの対策はほぼ出来ている。
もちろん、Yahoo!やGoogleと対抗するのはおかしいが
中規模の検索サイト並みの情報を保てるだろう。
問題は上でも出てきたけど、+αの機能。
ようはユーザーに「迷った時にはここに来よう」と思わせるような検索エンジンであるべきだ。
そう思わせたらお気に入り登録→ホーム登録へとなりやすいだろうし
1年後・2年後には反響も出て商売としても成り立つと思う。
ところで問題の+αの機能。俺が良いと思うのは各検索ごとにRSSのような
ニュース記事が表示される機能。例えば、「パソコン」で検索したら
パソコンに関連したニュースが出るような。すでにどこかが行っている可能性もあるけど。
0132130
04/03/04 07:58ID:naRm3zqc教えて下さい。凄く気になる
+αはカテゴリを絞るのが良いんじゃ無いかと思います。
間口を広げると特徴を出すのが難しく、収拾不可能に成るかも知れないです。
0133nobodyさん
04/03/04 10:03ID:???http://www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&oe=UTF-8&q=%E6%A4%9C%E7%B4%A2%E3%82%A8%E3%83%B3%E3%82%B8%E3%83%B3
で表示されているサイトかな?個人的にはJOYだな。
んでカテゴリを絞るというのはその通りだと思う。
逆にしぼらなければ無理。
0134nobodyさん
04/03/05 19:30ID:N0xwB9R1でもどんなところが検索エンジンとして良いんだろう?
0135130
04/03/05 20:51ID:SabcyS9O検索サイトも見慣れた感じがあるのと、アクセス支援のためだけの検索エンジンが増えて、
検索サイトへの興味が薄れて来てる。
ユーザが使おうと思うのがほとんど無くて、アクセス支援の登録のためだけに存在する検索エンジンは不必要。
なんかスレッドフロートBBSを設置すれば人が集まると勘違いしてる人と同じな状況でもあるのかな?
JOYは中堅なんですね。古くからあるところは老舗っぽくて存在は知ってても使わないのが寂しいkな。
検索エンジンの大手・中堅とかのセグメント分けをしたリストがあれば面白いけどね。
検索サイトの検索エンジンとかメタサーチとかも今一だし、大手ポータルには敵わないのかな。
そういえば、韓国系のWAKANAって今あるのかな?
0136130
04/03/05 20:56ID:???WAKANOだった。WAKANAじゃないのね。
でもここ重たくて機能してないみたい。
0137nobodyさん
04/03/05 20:57ID:???gooもinfoseekもフレッシュアイもその他の検索エンジンも
Yahoo!やGoogleには到底及ばない。100:1いや、1000:1かもしれない。
なぜgooやInfoseekが出遅れた(もしくは越された)かと言うと
企業的な思惑はあるにせよ、Googleと比べて圧倒的に検索されるページと
検索時間が劣るからだ。逆に言えば、Googleはそれに特化して
現在の地位を保っていると言っても過言ではないと思う。
Yahoo!は「検索エンジン」というよりはすでにインターネット=Yaoo!になってきているから
全く別問題だと思うが。
それで、これらに対抗しようと思ってもいくら人や金があっても無理。所詮”猿真似”だからね。
では、どうすればいいのか?というとオリジナルの「何か」が必要なわけで。
検索エンジンとはとか違うけどblogなんかはかなり参考になると思う。
0138nobodyさん
04/03/05 21:04ID:???やっぱり量より”質”だと思う。
SEOにも当てはまるがユーザーにとっては「知りたいページ」が見られたら
それで言い訳で、知りたいページ・類似したページは多くても10ページあればいいわけで。
という事は検索した際により多くの情報が出るよりはより「ユーザーの考えにあったページ」
が検索結果に現れるといいわけだ。
こうなるともう、ブラウザにATOKのような機能を付けて
検索ワードの保護をしてやらないといけないわけで・・・M$任せになるな。。
0139nobodyさん
04/03/06 00:45ID:mLIiHzki0140nobodyさん
04/03/06 00:48ID:???それなりに長期に渡って運用していかないとデータ量すくないし、
逆に、データが増えたらとてつもなく膨大になるし・・・
0141nobodyさん
04/03/06 01:20ID:???googleのデータを何とか整理すればと思うが・・・。
0142nobodyさん
04/03/06 03:09ID:???最近チェックした商品をもとに、マイページみたいなところでタイプの似た商品なんかを上げてくれるんだけど、
検索エンジンにも、そんな風に以前の検索結果と似たタイプのものを出してくれると、
知りたいページが得られるとか思った。
ついでに、とても中規模に収まらないと思った _| ̄|○
0143nobodyさん
04/03/06 06:23ID:???おれも同じ事考えている。別にアカウント登録して無くても出来る見たいだし。
概念としては検索エンジンにキャッシュ機能みたいなのをつけて
検索ワードで判別して付随ページを抽出すれば。
中規模で収まる気がする
0144nobodyさん
04/03/06 07:21ID:m/dCwq/8かなり昔からあった機能ですね。
話は違いますが、前に検索したキーワードを出したり、類似性の高いキーワードを出すサイトもありますね。
yomiサーチを使ってるところが多すぎて、面白みが全く無い気がします。
自前の検索サイトを晒す勇気はありませんが、ブックマークで来てる人の少ない事。
137さんが言っている様にGoogle&Yahooがほとんどでgooがちょぼちょぼのアクセスです。
聞いた話ですが、某アダルト検索サイトの運営者がログを見たら、
上位キーワードが自身のコンテンツの名称だったそうです。
ブックマークをするのも面倒なのか、それとも家族でPCを共有してるのか、興味深い話でした。
サイト名称は分かり易くし、独特な名前にするのが良さそうです。
0145nobodyさん
04/03/06 09:46ID:???だろうね。極端な話アダルトなら「AV Search」でもいいと思う。
3,4年前はこういう名称のつけ方は「ありきたりでダサい」と言われてきたけど
逆に今はわかりやすくていいと思うし。
ところで
>話は違いますが、前に検索したキーワードを出したり、類似性の高いキーワードを出すサイトもありますね。
って書いているけど、具体的にはどこ?俺は知らないけど・・。
0146nobodyさん
04/03/06 09:53ID:???Yahoo!&GoogleとgooやinfoseekやMSNなどを含めて決定的に違うこと。
それは「検索エンジンだと理解されやすいデザイン」だと思う。
例えばネットに詳しくない人はフォームがあったからってそれがなんなのか?
検索って何?みたいな人が多いわけで。
それでも使っていくうちに分かるわけだが、MSNなんか特にそうだけど
どの部分が検索フォームかわかりにくい。と言うより「検索以外に目が行く」
と言った方がいいかもしれないね。それだけ検索エンジンには力をいれてないのだろう。
しかし、Googleはもちろん、旧Yahoo!なんかも明らかに検索フォームが”目立つ”
だから利用しやすいしわかりやすいと思うんだよね。
ちょっとプログラムとは違うけど、デザイン的な作り方もかなり重要だと思った。
0147145
04/03/06 10:16ID:m/dCwq/8合わせて検索される頻度が高いキーワードのチャックボックスやリンクが出る奴ですね。
旧Infoseekはそうでしたし、今はつながりシークだったかな名称が・・・
米国では結構あった気がしますが、思い出せない。
アフィリエイト全盛で広告に埋没した検索サイトも多くデザインは度外視かも知れないですね。
検索サイトは圧倒的なヒット数が無いと利益を出すのは難しいですね。
0148nobodyさん
04/03/06 13:42ID:???『共通語リスト』
例えば「プログラム 言語」で検索すると
「C / Java / VB ...」みたいに検索結果の中で良く出てくるキーワードを
抽出する。それをクリックすることで検索結果から「Java」を取り除いたり
「C」でフィルタリングしたり…。
結局はAND検索になるのだけど、良く出てくるキーワードがリストで出てくると
「なぜ、検索結果がぼやけるのか」が分かるような気がする。
検索者は「プログラム言語といえばCだろ!」と思って、「プログラム 言語」で
C言語の情報を探そうとしているが、予想以上にJava関連の情報が多かったりする
ことが一目で分かるよね。
/* この例ではキーワードが下手すぎるがそれは置いておく */
0149nobodyさん
04/03/06 13:52ID:???そそ。そういうのいいよね。
自サイトにアクセス解析を置いている人なら分かると思うけど
たまに「どうしてそのキーワードなの?」って人が訪れてくるからね。
キーワードの選択の仕方がわからないっていう場合が多い。
日本語って難しいからな〜
0151nobodyさん
04/03/07 01:24ID:???ttp://labs.nttrd.com/
0152nobodyさん
04/03/07 15:19ID:???一瞬いいと思ったんだが、”回答を登録できる”ってのが
いたずらをされる可能性も高く、使えないね。
ただ、グラフにして表示するのはいいと思う。
検索エンジン内のデータ件数・キーワード数+特定ワードを調べて。
0153nobodyさん
04/03/07 23:47ID:???0155nobodyさん
04/03/08 07:19ID:???0156nobodyさん
04/03/08 14:12ID:???2ch内をまともに検索できれば最強…
ってひろゆきが既にやってた。http://find.2ch.net/
0159nobodyさん
04/03/09 17:38ID:???機能、どうこう言う前に。
0160nobodyさん
04/03/09 17:39ID:???0161nobodyさん
04/03/10 19:37ID:XZBETSH0金取るのかよ・・・
0162nobodyさん
04/03/10 20:59ID:???キーワードの選択って考えると、ディレクトリ登録型のほうが便利だよね。
自分から絞り込んで行けるから。
>>161
本文と投稿者を検索するとき金がかかるみたい。
スレタイ検索は無料っぽい、というか普通にできたよ。
0163nobodyさん
04/03/10 21:23ID:???>>146
米Yahoo!がGoogleみたいな検索のみのページ始めたよ。
http://search.yahoo.com/
infoseekとかgooって、Googleと違ってポータルサイトってやつだから別モノなんじゃない?
WEB全体を検索するのはまず自分のとこにある記事を見てからっていうか、
自分のところで一般的な(?)情報は手に入るようにしてあるような。
0164nobodyさん
04/03/11 20:35ID:uu5Wjkv7何故今まで自社でロボット検索エンジンを開発しなかったのか。
0166nobodyさん
04/03/13 13:49ID:???0167nobodyさん
04/03/16 19:54ID:OF6zD5aFttp://www.tkensaku.com/
類似性検索の逆?が実装されています。
まだ荒いけど、これから面白くなるかもしれませんね。
0169nobodyさん
04/03/16 20:53ID:???15億超えてました
20億超えている?
0170167
04/03/16 21:14ID:OF6zD5aF12億ページもインデックスされていないのでは?
google で「図書館」が約300万
tkensaku で同じキーワードで約19万
単純にいって15分の1ぐらいでしょ。
google全体でも42億ですし、
tkensaku は日本語だけだからもっと少ないはず。
0171nobodyさん
04/03/16 23:20ID:???ごめん、間違えた。
150万ページはインデックス化されている。
「本」に関連する1508985ページ中の第1位から第10位までを表示しています。
ttp://210.189.72.196/sclient.cgi?value=%96%7B
4年超で法人登記して150万ページか
Record last updated on 02-15-2000 05:51:52 GMT
Record expires on 02-15-2011 05:51:52 GMT
Record created on 02-15-2000 05:51:52 GMT
Database last updated 03-16-2004 21:37:12 GMT
0172nobodyさん
04/03/20 22:57ID:hMly4azrurl を紹介してくれるようなプログラムを作ってみようと
思っているのですが、どこかに先例のようなものはありませんか?
まだ誰も思いついていない?
0173nobodyさん
04/03/21 03:35ID:???金取るが、書いた30秒くらいに反映されたり、
2ch内のすべての文章から検索してくれたり、と
その気になれば結構使える検索エンジンかも。
お金を払うのはちょっとつらいが。
性能はかなりよさそう。
0175nobodyさん
04/03/21 21:30ID:???0177nobodyさん
04/03/22 16:47ID:???MS-Officeでイルカの消し方がFAQになることと、Googleが好ましいとされる理由に「余分なインターフェースがない」が上位に挙げられることを思うと、あまり成功しない気がするよ。
検索エンジンとつながるマスコットが昔あったような気がするな。打ち込んだキーワードを学習して、時々新しいURLを勝手に拾ってきては、飼い主に「みてみて」とせがんでくる奴。
0178172
04/03/23 00:02ID:???確かにうざったいと誰も使ってくれないでしょうね。
検索をしたいときに遊びっぽいとうざったいけど、
遊びたいときにたまたまurlを発見してくれるとか。
やっぱりだめかな。
0179nobodyさん
04/03/23 00:47ID:???要はそのサイトを誰かが評価してあればいいんだよ。
昔はNTTの新着情報からのアクセスが一番多かったものだけど、
ググルに新着情報ページがあれば結構アクセスあるかもね。
0180nobodyさん
04/03/31 22:06ID:???音声で会話できるなら、会話型インタフェースも悪くないと思うよ。
0182nobodyさん
04/06/05 23:35ID:KbDZzecN0183nobodyさん
04/06/10 01:45ID:???いずれはユーザに登録させるとしても、最初は
人力で集めるんでしょ?
リンクの多そうなサイトを登録して、そこから
リンクたどってって、徐々に増やしていくとか?
自分も特定の分野の検索サイトをやりたいんだけど、
エンジン作りに挑戦してみようかな。
どっかに、検索エンジンの基本部分を解説してる
サイトってない?
0184nobodyさん
04/06/10 20:45ID:???0185nobodyさん
04/06/19 21:21ID:???作ればいいのかわかる奴いますか?
「クローラの自動巡回でデータ集める」
ってどうやるんだよ・・・分かんねぇ。
0189nobodyさん
04/07/02 03:03ID:wbSwwq8f【必要な機能】 ロボット検索技術を応用した、インターネット上の販売情報を検索することができるソフト。商品名やスペック等からリアルタイムな情報を検索することができる。その得た情報をMYSQLなどのDBに落とし込みたい。
【. 目 的 】 リアルタイムに価格比較できるPC比較サイトを作りたい
【. 使用OS 】 windowsXP
【. 条 件 】 10万以内なら払いたい
■試したけど条件を満たさなかったソフト
【. 名 称 】 まったく見つからず
■これだけはやりました
【 >>1-10、FAQ集、上手な検索の仕方 を読んだ 】 はい
【 調べたサイトの名前 】 GOOGLE YAHOO など大手検索エンジン
【検索キーワードは? ..】 ロボット型検索技術 クロール ソフト
恐らくこのようなソフトはないと思います。。
この技術の最も単純なソフト。もしくは応用が聞くような単純ソフトがあれば・・・・などと不遜にも考えています。
ちなみに下記2サイトで私がやりたいような事を行っております。
http://www.bestgate.net/
http://yasune.dokoda.jp/
このような技術の雛形などご存知の方いましたらどうかご教授下さい。
0190nobodyさん
04/07/02 03:08ID:???http://pc5.2ch.net/test/read.cgi/php/1086715675/235
↑バラ撒きっぱなしか?
# どこのテンプレを使い回しとるんだ…。
0191nobodyさん
04/07/02 03:52ID:???0192nobodyさん
04/07/07 01:24ID:???だろうが、でなければ意味ないわ。
価格比較にしても、まずは価格比較サイトにいくだろ。ロボットで価格を
漁るということに何の意味も見いだせない。
クローラーは単純だ。「波乗り野郎」みたいなもんだ。
ttp://www.bug.co.jp/nami-nori/
0193nobodyさん
04/07/23 16:09ID:ackJdXhihttp://www.surpara.com/
0194nobodyさん
04/09/03 04:40ID:bPh7a+Nk0195名無しさん
04/10/08 01:02:54ID:TPGoBuLXhttp://umasql.netkeiba.com/db/horse.php?hid=2000101537
0196nobodyさん
04/10/10 23:39:08ID:FanGpL5aGoogleみたいなロボット巡回型は相当難しそうだけど
0197nobodyさん
04/10/10 23:40:21ID:FanGpL5a0198nobodyさん
04/10/13 16:43:48ID:???グーグルの規模を小さくしたような検索エンジン・・・ないよな
0199nobodyさん
04/10/13 21:56:37ID:???ここオリジナルのロボットで運営してるよ
0200nobodyさん
04/12/15 19:54:07ID:???0201nobodyさん
04/12/20 08:16:35ID:???頼むから爆撃アクセスするようなロボットは作らないでくれな。
robot.txtやMETAタグには従うように。
どうせIPで弾くだろうけどな。
0202nobodyさん
04/12/20 10:55:13ID:SmxJcj5bさっき書き込んだときは60くらいだったのに。
さすが2チャンネルだなぁ。
0203nobodyさん
04/12/23 23:53:23ID:yKblct4O1.Inverted File Structureを勉強すること。
2.形態素解析
3.ロボットのこと テキストだけ抜き鳥。
0204nobodyさん
04/12/24 00:28:16ID:nkV22Kja0205nobodyさん
05/03/13 19:43:57ID:cxiEkR1Nhttp://hp6.0zero.jp/anq/anq.php?uid=1696&dir=84
0206nobodyさん
05/03/14 19:36:30ID:???0207nobodyさん
2005/03/22(火) 21:31:01ID:???0208nobodyさん
2005/03/23(水) 03:34:58ID:NriJPZTB検索ロボットとオンラインブックマークの関係について教えて下さい。
(初心者用質問スレが落ちたみたいなので?こちらに書いています)
具体的には、
オンラインブクマに登録されたサイトは検索ロボに登録されてしまうのか
が知りたいのです。
サイト自体は.htaccess、robot.txt、METAタグで
検索ロボを回避する様に設定しているのですが、
・オンラインブクマもロボットの検索対象になるのか(これはなる様な気がする)
もし検索対象になるのであれば、
・オンラインブクマに登録されたURLはそのまま検索ロボに登録されるのか
・もしくは、ブクマされたURLに飛んでからロボ避けがなければロボに登録されるのか
というのがぐぐっても分かりませんでした。
もしスレ違い、板違いでしたら申し訳ありません。
その際は誘導して頂けると嬉しいです。
どうぞよろしくお願い致します。
0210nobodyさん
2005/04/30(土) 21:14:50ID:MqigPbvB登録数100万件なら、どのぐらいのスペック(サーバー)が必要なんだ?
情報求む。
0212nobodyさん
2005/05/06(金) 00:17:36ID:???「簡単なサンプルプログラム」とは?210じゃないけど。
というか、ロボットは別としてディレクトリ型で
大手の検索エンジン以外で数十万単位の登録ってあるんだろうか?
そしてテキストだけならほぼ普通のレン鯖でも処理出来る気が
するのだが、あくまでも「気がする」程度なのだろうか・・。
0213nobodyさん
2005/05/06(金) 17:34:05ID:???いきなり、実稼動するわけじゃないんだから。。。
ローカルで動くシステムを作ってみれば
どのくらいの負荷がかかるとかわかるでしょ?
そこに、信頼性や要求なんかを加味して
そこから逆算してくださいな
ってことです
そう言えば、昔「ディレクトリ型はロボット型の対義語じゃない」って怒られたっけ
思い出しちゃった
0214nobodyさん
2005/05/24(火) 18:49:33ID:???かなり遅レスで悪いけど、ローカルだと所詮LAN内だから
実際の処理スピードなんて測れ無くないか?
それよりも”100万件”というのが、普通のディレクトリ型の
検索エンジンで可能なのだろうか?ある意味100万件
ジャンル別に集められる検索エンジンがあれば
そこそこ利用してもらえる気がする。
0215nobodyさん
2005/05/24(火) 23:12:25ID:???計れないのは、通信速度であって
処理速度はLANであろうと、WANであろうと変わらない
100万件のデータを扱うなら通信速度よりも処理速度の方が重要だろうと
まぁ、言い訳がましく言うと
もちろん、通信速度も重要だけど
>>210がスペックの話をしていたから処理速度の話だと思った
確かに、100万件もデータがあればそこそこのもんのような気がしますね
yahoo.co.jpの登録件数ってどのくらいなんだろう。。。
0216nobodyさん
2005/05/25(水) 16:09:44ID:???30万ぐらいじゃなかったか?
0217nobodyさん
2005/05/25(水) 21:56:46ID:???ttp://internet.watch.impress.co.jp/static/column/yst/2004/12/03/
> 今現在登録されているサイトの総数は40万件以上になっています。
0218nobodyさん
2005/05/26(木) 07:37:23ID:???0219nobodyさん
2005/05/28(土) 03:56:25ID:???100万件がどうのという話をしているが、それは=ディレクトリ型
というわけだろ?その時点でどういう検索エンジンであったとしても
二番煎じな気がする。
けど、ネットを利用してみて「欲しい情報を手に入れたい」と
思う人は多いわけで、だからこそ検索エンジンが使われるわけだ。
YAHOO!は知名度で成り立っているから、検索機能としては凄いわけではない。
Googleは莫大な情報量で成り立っているが、逆に言うと多すぎて
色々とみないと欲しい情報を得ることが出来ない。
この2つの点を回避出来たら、システム的にはそんなに大きくなくても
そこそこ利用される検索エンジンが出来ると思う。どうだろう?
0220nobodyさん
2005/05/28(土) 14:02:50ID:???回避するには更に莫大な情報が必要ですよ。
0221nobodyさん
2005/05/28(土) 17:11:12ID:???じゃ、とりあえず「何を必要とするか」を出していけば
自ずとまとまってくるんじゃないか?一人一つでも出せれば。
俺は「見づらいサイトを排除して欲しいor見やすさ重視」
色のカラーバランスや文字組みの構成を認識して
それによって順位が変動する検索表示だと良いかなって思ってる。
例えば、マイナーワードで古くからあるサイトとか
いくら上位表示されていても背景と文字のバランスがバラバラで
見づらいから、どこに情報があるかわからない。余計に探すのに
時間がかかってしまう。
0222nobodyさん
2005/05/30(月) 11:04:58ID:???導くよりは、gooラボで研究されて、下手すると実運用してないくせに
特許だけとられてがんじがらめにされてるようなアイデアを出しそうだ。
gooラボでのテーマや成果をみていると。
検索エンジンへの欲求は情報の鮮度と、アクセシビリティにつきると思う。
あとはパーソナライズね。鮮度を保証するために、機械で膨大なサンプルを網羅して
後は統計で個人ごとに異なる要求に応えるか、検索とは違うけどallAboutみたいに
権威者にディレクトリを維持させるというアプローチ自体は合理的な手段の
2極を極めていると思う。
強いて回避する方法があるとしたら、「何をソースに」「どういう重み付けをするか」
というロジックで差別化すること。前述の2極を意識するとSNSとかblogとか
すでに人が集めてディレクトリが出来ている情報から何を抽出するかだよね。
それは他の企業も取り組んでいる(需要が見越せる)けど完全な形が出ていない所。
一般的に「一次情報はどこか」に比重が置かれることが多いけど、
「次にくる」とか「以前きた」とか、情報が作り出したルートを図式化みたく
マクロ的な結論をどう出すか、というのはいくらでも研究の余地はあるらしい。
成功例が少ないけどw
0223nobodyさん
2005/06/01(水) 06:19:53ID:???すまん、また書くのが遅れた。
gooラボを出しているが、あれ自体が物凄く重くないか?
また、何かソフト入れなきゃ駄目だったろ。確か。
だから色物扱いされて、反響無かったと思うが。
あと、君は俺の1案に対してつっこみを入れているだけで
「自分が欲しい意見」というのを出していない気がするが。
単に既存のシステムを分析して批評しているだけで
開発のアイディアを出していない。
そういうの出さないと。
0224nobodyさん
2005/06/01(水) 06:22:44ID:???この板の特質上、あくまで個人のプログラマーが
検索エンジンを作る上で、どのような検索エンジンだと
反響があるのだろうか?使いやすいだろうか?
と言うことを話し合うスレだと思うが。
いわば開発アイディアの検証だ。
そうじゃなくて222のような企業的思考で難しいこと言ってても
誰も「検索エンジン作ろう」と思わないって。
0225nobodyさん
2005/06/01(水) 15:23:03ID:???どうせ自覚も無いんだろ。口だけなんだから素直にバイトでも探してろ。
0227nobodyさん
2005/06/01(水) 18:56:17ID:???0229nobodyさん
2005/06/01(水) 19:04:14ID:???0231nobodyさん
2005/06/03(金) 19:34:02ID:vAHoocN8つー訳で、とりあえずドンドンと意見を出して行こうぜ。素人考えだろうが
何だろうが、まずは案を挙げまくって、それから議論という事だ。
非アダルトの情報を欲して検索をかけても、アダルトの類のページが
検索にかかる割合が高い。オプション指定するだけで、キレイに検索から
アダルトを排除できる仕組みが欲しい。
逆に、アダルト検索用のオプションも欲しい。アダルトを検索にかけようと
思っても、検索にかかるアダルトサイトは殆どがクリックで目当ての小銭稼ぎ
サイトなのが現状だ。
検索の精度や抽出されるページの量を落とさずに、これらを実現できれば
嬉しい。ぬるぽ。
0232nobodyさん
NGNGそこにない差分データはとりあえず非アダルトということに
0233nobodyさん
2005/06/05(日) 09:34:25ID:???とりあえず、俺はこの板に来たらなんか書くようにするから
他のみんなもどんどん意見を出して欲しいと思う。
んで、231の方法はmetaとかページのテキストから
アダルト関連のワードを拾うことで、アダルトサイトを
ほぼ完全排除出来ないかな?
最近のサイト制作の傾向として、1つの検索エンジンのみを
対象とした作り方はしないし、どうせYAHOO!やGoogle相手
なんだから、アダルトサイトがアダルト関連のキーワードを
はずせないし。なら、それらのキーワードを禁止指定すると
割と容易にアダルトサイトは排除出来ると思う。
0234nobodyさん
2005/06/05(日) 09:38:35ID:???それでいて大手検索エンジンで使われていないのだが
ランダム検索と、ソート機能ってあれば面白いと思う。
ランダム検索機能はテキストボックスにキーワードを入れて
「ランダム検索」のボタンをクリックすると、ランダムな
検索結果を表示する。これで下位に埋もれるサイトを
見られる可能性が増える。
次にソート機能は主にタイトルからソートをかける機能。
タイトル以外にも登録日・更新日を昇順・降順出来ることで
タイムリーな記事やサイトを表示させることが出来る。
上記の2機能はディレクトリ型の検索エンジンでも
割と容易に出来る気がする。けど、あまり見かけない。
0235nobodyさん
2005/06/05(日) 10:29:47ID:???まぁ、言っていることは妥当だと思われ
ただ、問題なのはどうやってアダルト関連のキーワードを判断するかだね
人手で作ってちゃ馬鹿だし
ベイジアンフィルタなんてのもあるから
その応用なんだろうけど
0236nobodyさん
2005/06/05(日) 16:15:38ID:???アダルト関連のワードってめちゃくちゃ細かいのも排除するの?
例えば、AV女優の名前とか。
とりあえず、「アダルト」「風俗」「AV」とかそういうおなじみの
ワードを省くだけで良いと思う。管理者が入力するタイプでも。
0237nobodyさん
2005/06/05(日) 22:44:18ID:???っていうか、どこまでをアダルトと認識するかによって異なる
例えば、アダルト:アダルトチルドレンなんて様に
特定のキーワードを含む=アダルトサイト
ってわけにはいかないからね
子供向けのフィルタを作る or 特定の分野に特化する
なら話は違ってくるけどさ
ベイジアンフィルタ=めちゃめちゃ細かいものを排除する
って言うわけではないってことね
0238nobodyさん
2005/06/06(月) 00:20:28ID:???そう言われればそうだよね。AVでもAV機器ってあるしな・・。
とりあえず、+で含まれるワードはどうだろ?
「ホームページ」「制作」でホームページ制作をフィルタするように
「アダルト」+「AV女優」とか加えてフィルタにするとか。
でも、なかなか難しそうだな。なんか騙しリンクとか
そういうのを完全排除出来る、フィルタリング対応検索エンジン
があれば、割と受けると思うんだけどな。
0239nobodyさん
2005/06/06(月) 12:46:54ID:???まぁ、その辺を考えるんなら
既存のフィルタリング技術とかアプリケーションを
調べてみても面白いかも
有害コンテンツを子供に閲覧させないためのフィルタとかね
色んなサービスなんかあるし
0240nobodyさん
2005/06/06(月) 16:24:02ID:???0241nobodyさん
2005/06/07(火) 22:37:09ID:???超高機能なサーチエンジンを作りたいんだけど
http://pc8.2ch.net/test/read.cgi/tech/1048336478/
0242nobodyさん
2005/06/13(月) 04:28:42ID:???>>223-224
企業的視点であり、自分の意見の欲しい形を言ってないとの事だが、
そうではなく企業ですでに目をつけてるものをやっても仕方ない
と思う反面で、企業体が研究している分野を否定して需要がない所を
掘り込むのもどうかと思う(企業的規模で成功するためにじゃなく、
使ってもらってフィードバックしてもらうってレベルでね)から、
注目されてる一例を出しただけであって、深いとか難しいと思わなかった。
企業的視点と読み取るのは、単語に騙されやすいのではないかと。
で、そこから「何をソースに」「どういう重み付けをするか」 について特色を
出したものが欲しいなってのが俺の意見なわけで、述べてないと読み取るのは
最初から述べて欲しい意見を想定していて、プロテクトしちゃってるから
読み取れないんじゃないだろうか。まあ、俺も>1が01年のスレで一気に具体案まで
提案するのはどうかと、大ざっぱな概念から振ったのは不親切だったと思う。
>231-233で、まずはブレストって事で決着しているが、とりあえずなにやら
へんな読み取られ方してると思ったので訂正しておきたい。
アダルト情報の排除か、それを極めると逆にアダルトの検索エンジンのコア
としても機能しそうだね。ただ、運用したらお役所に睨まれそうだがw
アダルト、アドウェアみたいなデータからNOTで弾くために、エロボットは
必要なのかも知れないな。
0244nobodyさん
2005/06/15(水) 03:24:42ID:???このスレのタイトルを見たとき俺は、、、、、、、
検索ニンジンをつくりたい
かと思ってしまったんだ。すまない。
0245nobodyさん
2005/06/15(水) 03:46:17ID:???0246nobodyさん
2005/06/15(水) 06:28:52ID:???0248nobodyさん
2005/06/15(水) 19:00:23ID:SDEIoMgZエクセルのCSVを多様して検索システムをつくった
いまんとこ1000件データをいれてためしたが
結構早く検索する・・どれぐらいたえれるのだろうか・・・・
データベース俺のまえにたちはだかってやがる・・・
ショップサイトも検索サイトもすべてCSVで処理してる俺は首すんぜんだろうか・・・
0249nobodyさん
2005/06/15(水) 22:08:01ID:???・評価機能
・指定日時が過ぎると表示されない
・ポイントに応じて表示順位が変わる(ランキング?)
>>248
DBを使ったら恐ろしく多大なデータを処理出来るよ。
PHPとMySQLが軽くて最高だと思う。
ただし、レスポンスの問題で言えば、やはりサーバと回線の
問題によるから、それらの充実が一番だとは思う。
0250nobodyさん
2006/11/11(土) 21:19:03ID:???○_○
( ・(ェ)・) < 天然記念スレをまもれ!
/つ¶つ ¶
/ ̄ ̄ ̄ ̄ ̄ ̄ヽ //
人人 / ● ●、 ザバァ!!
/ 〇 ▼ l 人人人
/ = , 、_ _人_ノヾ
人人 ノ 人人
人人人 人人
0251nobodyさん
2006/12/01(金) 22:51:13ID:???このスレに出てるほとんどのアイディアが実現できる気がする。
0252たま
2007/02/02(金) 10:45:34ID:QBCmJWsF検索エンジンのPHPスクリプトを配布しているところを探しています。
どなたかご存じでしょうか??
宜しくお願い致します。
0253nobodyさん
2007/02/02(金) 11:27:23ID:???で検索しろ
0254 ◆hb//x7qyug
2007/02/02(金) 12:12:18ID:DuFcC87Dおもしろそう。協力しようか?
0256nobodyさん
2007/02/07(水) 08:59:32ID:CGn0u8gTgoogleライクに
"unko unko" -hogehoge (aaaa or "cc cc")
みたいなの
0257nobodyさん
2007/02/08(木) 09:24:06ID:???...めんどくさいけどね。でもPHPでパーサを書く場合でも.yの書き方は参考になる。
RubyならRacc
0258nobodyさん
2007/02/13(火) 02:21:01ID:???お行儀の悪い検索エンジンを使いたいです。
0259nobodyさん
2007/02/20(火) 18:20:31ID:???フィルターとかあれば良いんですけど・・
0260nobodyさん
2007/10/31(水) 21:21:23ID:nkFoGGXY0261nobodyさん
2007/11/07(水) 06:37:03ID:???0262ギニア3世
2007/11/16(金) 21:23:24ID:idEdN7T0http://www.quintura.com/
0263nobodyさん
2008/06/08(日) 13:47:25ID:oe9fgjbihttp://21news.cocolog-nifty.com/blog/2008/05/post_d828.html
連載:検索エンジンを作る|gihyo.jp … 技術評論社
http://gihyo.jp/dev/serial/01/make-findspot
0264nobodyさん
2008/06/24(火) 02:01:34ID:iHrl1LSI0265nobodyさん
2008/06/27(金) 00:50:18ID:gBJjjQVQ携帯サイトおもちの方必見!
携帯で登録できるよ
http://search-k.net/jcom/
0266nobodyさん
2008/12/07(日) 23:00:34ID:WE1pXcYehttp://www.marsflag.com/
0267nobodyさん
2008/12/20(土) 23:38:56ID:WN7kdZGE0268nobodyさん
2008/12/22(月) 00:27:02ID:9ZqbUAejanonymouse:0123456789
Search script配布
0269yamtoshi@hot .com
2008/12/31(水) 16:10:58ID:???どうでしょう?
0270nobodyさん
2008/12/31(水) 22:33:26ID:MitumZi6てめーの研究室がクロールされろ!!!
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
0271nobodyさん
2008/12/31(水) 23:04:32ID:???911では小型の水爆が使用されている。
http://ri■ch■ardkosh■im■izu.at.webry.info/
創価の保険金殺人事件。
オウム事件は、統一・創価.北朝鮮の共同犯行である。CIAが監修している。
http://www15.ocn.ne.jp/~oy■ako■don/kok_web■site/ir■iguc■hi.htm
与党も野党もメディアも全部朝鮮人だった。
http://jb■bs.li■vedo■or.jp/b■bs/read.cgi/news/20■92/115794■1306/
2ちゃんねるは統一■教会が個人情報を集めるための道具。運営には統一■教会がいる。
駅前で「手相を見せてください」と勧誘してるのが統一教■会。(カルト宗教)
カルト宗教の下にいる人と上にいる奴を分けて考えないといけない。下にいる利用される人は上がどんなことをしてるか知らない。
ユダヤ権力の子分→2ちゃん運営=統一協会上層部=層化上層部=自民党清和会=野党の朝鮮人ハーフの政治家=
与党の朝鮮人ハーフの政治家=金 正日(キム・ジョンイル )=読売サンケイ=小沢十朗
ユダヤ人=ロックフェラー=ブッシュ=クリントン=ヒラリー=アドルフ・ヒトラー=オサマ・ビンラディン
毎日新聞スレを荒らしてる奴らも統■一教会の可能性が高い。
荒らしは洗脳するために「ネトウヨ」などのレッテル付けレスを何千回もする。
現実には「ネトウヨ」などは存在しない。
http://changi.2ch.net/test/read.cgi/ms/1230363385/
0274名無しさん
2011/10/13(木) 00:52:05.66ID:/EgVNFsq| |
人
∧_∧ < >_∧∩
( ・∀・) 人`Д´)/ ←>>53
と ) < >_∧∩
Y /ノ .人`Д´)/ ←>>59
/ ) < >_∧∩
_/し' //. V`Д´)/ ←>>231
(_フ彡 /
■ このスレッドは過去ログ倉庫に格納されています