人工無脳
■ このスレッドは過去ログ倉庫に格納されています
00011
02/05/07 05:55ID:JxGSPxBK0161nobodyさん
04/09/03 17:10ID:???それを茶筅で品詞分解して(mechabuでのperl利用は挫折)それぞれの品詞に副詞の候補
つけて、出現回数で評価付けして辞書にするあたりまで出来た。
この段階で難解バカボン並の駄文を連発する事は可能(手動登録での駄文生成は以前やった)。
これに各品詞への別品詞の関連も要素に含めて、茶筅分解時の品詞の並びから自然文構造
辞書作って並べれば、ある程度の文章にはなるんじゃないかと思ってる。
1つのWEBページ分解したら、あらたに分解する以上のURL増えたり、やはり2chが多く引っかかった
りするのが面白いw
0162161
04/09/25 22:59:31ID:???かなりつたないコードなので負荷がかなり高く、あまりレンタルサーバーのような所に設置できる
代物じゃなくなってしまった。
一応、某MMOのデータベース的サイトのトップに、お遊びで派生版を設置してみた。
XREAなのでシステムが機動されるペースを調整しながらだけど、結構な負荷で怖い。
そちらは、扱ってるゲームの手動で指定した日記サイトを巡回して新規項目を取り込み、
同じく茶筅で解析後辞書として保持、簡単な一文をキャラクターの台詞として表示。
まったく前後脈絡無く品詞を並べる訳ではなく、それなりに関連性のある単語と助詞を
組み合わせて作文させてるので、変な日本語ではあるがそれなりに読める。
マルコフ連鎖を使うと、もっとそれっぽい文になると思うけど、辞書へかなりの量のサンプル文を
取り込まないと、原文に近くなりすぎるんじゃないかと思っている。
で、活用形とかではなく助詞をバリエーションとして羅列しているんで、500KB程度の辞書
でも相当な負荷に… XREAのは100KB越えると出現度低い方から消している。
■ このスレッドは過去ログ倉庫に格納されています