人工無脳
■ このスレッドは過去ログ倉庫に格納されています
00011
02/05/07 05:55ID:JxGSPxBK0353nobodyさん
2009/12/08(火) 03:36:44ID:???品詞ごとに辞書とうまいこと組み合わせられればもうちょっとそれっぽい発言はできそうね。
とりあえず色々いじってる最中。
0354nobodyさん
2009/12/09(水) 21:13:49ID:hr8QRvD+BBS投稿型人工無能「メック」を忘れてもらっては困るな。
0355nobodyさん
2009/12/10(木) 16:43:00ID:???0356nobodyさん
2009/12/17(木) 09:39:11ID:???0357nobodyさん
2009/12/17(木) 09:52:54ID:???0358nobodyさん
2009/12/17(木) 20:49:35ID:???0359nobodyさん
2009/12/17(木) 22:04:37ID:???0360nobodyさん
2009/12/21(月) 09:30:50ID:???0361nobodyさん
2009/12/22(火) 21:02:12ID:???現在の辞書登録数2871パターンです。
http://cw2nh75e.corede.net/tomock/ai/exa.cgi
0362nobodyさん
2009/12/30(水) 12:57:57ID:???0363nobodyさん
2009/12/30(水) 14:12:28ID:???0364nobodyさん
2009/12/30(水) 20:22:23ID:???今まで散々使われてきた誰にでも分かるような技術で「作りましたー」とか言われても何も面白くない。
自己顕示欲が強い人だね。
0365nobodyさん
2009/12/31(木) 20:12:40ID:???辞書登録型とかもはや廃れる運命にw
0366nobodyさん
2010/01/01(金) 00:17:03ID:???0367nobodyさん
2010/01/01(金) 00:18:44ID:???0368nobodyさん
2010/01/01(金) 12:45:40ID:???0369nobodyさん
2010/01/01(金) 18:45:39ID:???0370nobodyさん
2010/01/02(土) 01:14:24ID:???基本的には返事ベースなので、"意識?"は一分しか持続しませんが。
@windymeltanです。(出来ればフォローを)まださっぱり辞書に入っていないのでろくに返事も出来ませんが、外部ツールとの連携が可能なしくみになっています。
現在、chasenの読み仮名と、maximaの連携が出来ています。
他の人工無能とは一味違いますが、「忠実なツンデレ」みたいになっています。
0371nobodyさん
2010/01/02(土) 11:01:35ID:???0372DAWNTO_Windy-melt ◆Windy/f9HNwg
2010/01/03(日) 06:16:32ID:???mecabに載せ替えました。
文章を受け取って形態素解析をしたあとで、逆文献頻度と出現頻度を算出し単語の重要性を判定する、
と言うアルゴリズムを書いているところですが,人工無脳の言葉の辞書に有用でしょうか。
出現頻度=log((特定単語数)/(全単語数))
逆文献頻度=log(単語数?/単語が出現する文章数)
辞書を共有する試みを行ってみたいですね。
人格によらない部分のみを。単語帳のように。
0373nobodyさん
2010/01/03(日) 06:52:18ID:???うーん、エキスパートシステム向けなんじゃない?
文献によって偏りが出そう(*´〜`)
0374DAWNTO_Windy-melt ◆Windy/f9HNwg
2010/01/03(日) 07:08:10ID:???文献を「発言者」になぞらえれば,ある特定人物が良く発現する言葉,その人しか使わない言葉が重要と認識できると思うんだけど。
0375nobodyさん
2010/01/04(月) 16:19:02ID:tKEANqQN永遠に会話が成り立っているように見えるというレベルを超えることはできないよ。
発言に対する反応から好みを判断したり、人工無能から質問ふっかけて話者の情報を集めたりして、
そこから人工無能の発言内容を変えていくようなアルゴリズムの人工無能が未だに出てこないのが不思議。
人間の対話っていうのは、根本に「相手のことを知る」という動作が含まれているんだからね。
0377nobodyさん
2010/01/04(月) 19:52:02ID:???0378nobodyさん
2010/01/04(月) 22:04:46ID:???0379nobodyさん
2010/01/05(火) 12:43:06ID:???0380nobodyさん
2010/01/05(火) 13:42:26ID:???0381nobodyさん
2010/01/05(火) 16:21:06ID:???0382DAWNTO_Windy-melt ◆Windy/f9HNwg
2010/01/05(火) 16:33:28ID:???MySQLで記憶は実現できるのではないかと思うんだが、どう思う?
ただ、常に正確に意味を判定できる記憶のフォーマットを考えなくてはならないわけだが。
0383nobodyさん
2010/01/05(火) 17:01:42ID:???0384nobodyさん
2010/01/05(火) 22:21:54ID:O4sHV/qohttp://www.grokwork.com/alain/index.php
0385nobodyさん
2010/01/05(火) 22:26:49ID:???0386DAWNTO_Windy-melt ◆Windy/f9HNwg
2010/01/06(水) 00:14:25ID:???結構面白い
0387nobodyさん
2010/01/06(水) 09:49:17ID:???0388nobodyさん
2010/01/06(水) 14:02:12ID:???0389nobodyさん
2010/01/06(水) 15:23:14ID:wKBm7d/7あいにく、自分はあまりプログラミングに詳しくない者でデータベースはよく分からない。
相手のことを記憶するのに意味の判定までは必要ないだろうよ。
ベーシックな自己紹介情報フォーマット以外は、
IF-THANルールで「その人がその事項を好きか嫌いか」だけ記録していけばいい。
辞書書いて遊んだことしかない俺が言うのも何だが、
辞書型作ってる人が居るくらいなんだから「好意単語」「嫌意単語」リストくらいなら作れるだろうよ。
0390nobodyさん
2010/01/06(水) 17:22:12ID:???大量のログの中から適切なものを選ぶだけでも大変。
第一相手ごとに発言を変えたらそれこそ単調なものが出来上がりそうだ
うずらを少しは見習えカスども
0391nobodyさん
2010/01/06(水) 18:10:36ID:???0392nobodyさん
2010/01/06(水) 18:23:04ID:???もしくはBOTなのかもしれない
0393nobodyさん
2010/01/06(水) 18:43:03ID:p9eVlHBo0394nobodyさん
2010/01/06(水) 19:50:26ID:???プログラミングできない癖に偉そうに言うな、と言いたい気持ちは分かるが、
俺はとりあえず「人間側の情報を取得すべき」というベクトルを示したかっただけなんだ。
ただ、自分で示しておきながらなんだけれど
現状の人工無能では「好」判別機能を実装できそうなのって辞書型だけかもね。
まあ好意嫌意判断もベースのフォーマットも全部手打ちって時点でこのスレ的には論外か。
0395nobodyさん
2010/01/06(水) 21:23:22ID:p9eVlHBo辞書型は発言に開発者の人間性が出るので人間っぽくなります
完全学習型で、もし「好き」「嫌い」の概念自体も学習するとすれば人間とは違った価値観になるはずです。多分、人間では理解出来ない概念を話す、新種の生物になります。
「好き」「嫌い」の判定を人間が教えるとなると、名詞(もしくはジャンル分けされた名詞群)ごとに設定する事になるので結局辞書型になります。難しいところですね…
0397nobodyさん
2010/01/07(木) 17:06:35ID:???けんか腰ですみません 理想ばかり言われて開発者として腹を立ててしまいました 子供ですよね
>>394
「好き」「嫌い」の概念を理解させるには形態素解析を応用した仕組みを使えばできるかもしれません
人間が一つ一つ登録していくのにはやはり限界があります
0398nobodyさん
2010/01/07(木) 18:09:15ID:???を開発している
>>395
です
>>397
さん、もし開発中のものが拝見できるのであれば教えていただけませんか?
(差し支えなければですが)
その他の方もそうですが、開発者同士のコミュニケーションが取れればお互い有意義かと思い。ただでさえ開発者が少ない世界なので。
0399nobodyさん
2010/01/07(木) 18:21:34ID:???単語を連想して会話するようなことが出来ればなぁとか
0403nobodyさん
2010/01/08(金) 13:53:13ID:???ttp://axol.web.fc2.com/unagi/
ググって見ると作成者中学生。乙
0406nobodyさん
2010/01/18(月) 22:58:39ID:???形態素解析?
0408nobodyさん
2010/01/19(火) 05:02:03ID:???現実味のある検索結果を導き出す差分を持っている候補を挙げる機能はあるだろうが
それ以外に区切りのやりかたはないだろうな。
0409nobodyさん
2010/01/19(火) 20:50:38ID:???ただ、単語ごとだと大雑把過ぎる気もする。
だから、2文字ずつというのはどうだろう。
例:人工無能 うずら → 人工無能 うずる
解析結果:
人工
無能
うず
る
上三段からうずとうずらを連想させれば、できる可能性はある。
ただ、Googleの場合膨大な検索データがあるので、確実にそのデータを参照している。
0410nobodyさん
2010/01/19(火) 20:59:51ID:???0412nobodyさん
2010/01/19(火) 21:09:33ID:???そしてもしかしては連続したクエリから選んでるんじゃ無いだろうか
例えばシュミレーションと検索すると当然ヒット数は少ないので(ま、誤記にしてはかなり多いが)シミュレーションと入れ直すだろう
こういったユーザ動きを解析してもしかしてってやってるんだと思う
あとは単純なタイポなんかは結果のページに多く使われてる似たワードを表示するとかしてると思う
0413nobodyさん
2010/01/19(火) 21:20:08ID:???0414nobodyさん
2010/01/20(水) 06:13:35ID:???0415nobodyさん
2010/01/20(水) 06:31:31ID:???0417nobodyさん
2010/01/24(日) 14:10:43ID:???0418nobodyさん
2010/01/24(日) 21:57:57ID:???0419nobodyさん
2010/01/24(日) 22:40:20ID:???0420nobodyさん
2010/01/25(月) 20:41:43ID:???0422nobodyさん
2010/01/30(土) 23:20:09ID:???0423nobodyさん
2010/02/15(月) 16:33:05ID:???ゲーム開始してからフラグ立てればいいのに。
0424nobodyさん
2010/02/15(月) 16:33:51ID:???0425nobodyさん
2010/02/25(木) 00:22:19ID:???0426nobodyさん
2010/04/18(日) 18:39:17ID:DuqhqP6c/ ( ゚>t≡ )y─┛~~
(_ ノγ U ∩_∩) THANK YOU 2ch ┌───────┐
α___J _J and (|● ● |
/ ̄ ̄ ̄ ̄\ GOOD-BYE 2ch WORLD! /.| ┌▽▽▽▽┐ |
/ ● ● ( ┤ | | |
|Y Y \ またどこかで会おうね \. └△△△△┘ \
| | | ▼ | | \あ\ |\ \
| \/ _人| ∧∧∩゛ ∧_∧ | \り\ | (_)
| _/)/)/( ゚Д゚)/ (´∀` ) __ n \が\. |
\ / 〔/\〕 U / ∩∩ ( )o/ \ ヽ \と\ |
| | | c(*・_・) | |ヽ(´ー`)ノ_| | | (__丿 |. /\ \う | (-_-)
(__)_) UUUU /∪∪ (___)(_(__) ⊆_ ヽ_┘ └──┘(∩∩)
0427nobodyさん
2010/04/19(月) 22:53:05ID:IebtuEmPこのスレにあるだけでも結構ありそう(今存在しているかどうかは別)
うずら
ロイディ
なまこ
とぼっち
マスオ
カツオ
なまねこ
酢鶏
エクサ
よみうさ
うし
うなぎ
羽生くん
ちんぷん館
ゆいぼっと
ししゃも
伺か
ARISA
葵
他追加頼む!
0428nobodyさん
2010/04/22(木) 16:55:59ID:???俺のぐぐる力だと見つけられなかったorz
0429nobodyさん
2010/05/14(金) 13:05:28ID:JE6twfBc文法解析型 を 作ろうと思うが
モレの使う日本語変なので日本語の文法がわからん orz
とりあえず 文節に分けるとこからはじめた
0431nobodyさん
2010/05/14(金) 17:43:54ID:JE6twfBc形態素解析しながら辞書登録していくように作ろうかと思っている
原文
内閣支持続落、19%=普天間で49%「首相退陣を」
内閣支持続落 漢字
、 句読点
19%=普天間 値
で ひらがな
49%「首相退陣 値
を ひらがな
」- 記号
いま 数字 + 単位 と 名詞 を分けてる
三宅雪子が数値扱いになってしまうがな
0432nobodyさん
2010/05/14(金) 19:09:28ID:JE6twfBc例文が浮かばない
〜に の "〜"は名詞になるのか?
0433nobodyさん
2010/05/14(金) 23:05:43ID:???、 句読点
19% 値 単位
= 記号
普天間 名詞
で ひらがな
49% 値 単位
「 記号 S
首相退陣 名詞
を ひらがな
」 記号 E
一日でここまで
0434nobodyさん
2010/05/15(土) 13:08:37ID:???体系的に分類するのが難しい
すもももももももものうち
をどう切るかだ
原文
甘利氏が民主党の三宅雪子議員らを突き飛ばし、けがをさせたとしている。
甘利氏 名詞
が 助詞
民主党 名詞
の 助詞 名
三宅雪子議員 名詞
らを ひらがな
突 漢字
き ひらがな
飛 漢字
ばし ひらがな
、 句読点
けがをさせたとしている ひらがな
。 句読点
0435nobodyさん
2010/05/15(土) 18:07:12ID:???ひらがなの集まりをどう切るかってのが面倒だから無脳作るなら
そのへんは既存のに任せて本体作る方に手間さくほうがいいかもしれない。
形態素解析も全部やらないと気がすまないならそれでもよかろうが。
0436nobodyさん
2010/05/15(土) 18:55:03ID:???正確な必要はないんだ たて読みぐらいの精度で十分だと思う 名詞・形容詞・動詞が判断できる程度で あとは定文として扱う
環境だけさらしてみると 開発環境 エクセルVBA
解析文字数 256文字(65535文字にすればよかったと思う)今解析プロセスを表示させながら解析してるが 256文字 10秒かからない
まだまだ、途中だけどね(一日しかたってないし) 名詞・助詞は結構な確立で分離できるようになった
今はおくりがな処理して 動詞・形容詞処理をしてるよ
5段活用とか小学校に習ったことぐらいしか思いだせん・・・orz
原文
甘利氏が民主党の三宅雪子議員らを突き飛ばし、けがをさせたとしている。
甘利氏 名詞
が 助詞
民主党 名詞
の 助詞 名
三宅雪子議員 名詞
ら 名詞
を 助詞
突 漢字
き 形容詞 連
飛 漢字
ばし ひらがな
、 句読点
けが 名詞
を 助詞
させたとしている ひらがな
。 句読点
0437nobodyさん
2010/05/16(日) 00:14:11ID:???0438nobodyさん
2010/05/16(日) 11:36:36ID:dV/XhCOBphpで書かれた人工無脳でphpの勉強がしたいのですが
ソースってないですかね?
もちろん作りたいのは人工無脳
html覚えた時も、色んなページのソース見ながらやってたんで
他にいい覚え方というか練習方法あったら教えてください
0442nobodyさん
2010/05/16(日) 21:26:03ID:???それに正確な必要はないと思うんだ
普通の技術者は正確に
認識さ/れた or れない
って考えるけど
認識/された or されない
と認識すれば、形態素解析もそんなに難しいものじゃなくなるだろ(早いし)
あまり厳密にマルコフ連鎖させると日本語らしくない日本語ができてしまうので
辞書型とのハイブリッドが最終目的
0443nobodyさん
2010/05/16(日) 21:51:43ID:???例
http://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%8C
から
文字抜き取り形態素解析におくるところ作ってた
まだ完成してないけど
0444nobodyさん
2010/05/17(月) 23:55:42ID:Tr+nzFXDと書くと形態素解析ソフトを薦められるがmecabを内部で起動できるようにして辞書登録しようと思って半日ぐらい遊んだが
使ってみたけどそのめんどくささは今の100倍になるよということが今日一日わかった
今の自作のアルゴリズムだと
原文
2ちゃんねるは面白い
自作
2 数字
ちゃんねる 名詞
は 助詞
面白 漢字
い ひらがな
(助詞はそんなに多くないので文末にくればめんどくさくない まだ作ってないけど)
名詞は高確率で分離されるが
mecabを使うと
2 名詞
ちゃん 名詞
ねる 動詞
は 助詞
面白い 形容詞
名詞も動詞もぐずぐずになる
たぶん"2ちゃんねる"は自動では名詞にできない
mecabの辞書から抽出してみるか
0445nobodyさん
2010/05/18(火) 00:55:08ID:???MeCabの辞書にwikipediaの項目やらはてなワードやらを
全部名詞で追加してやると良いと思うよ
まぁ中には動詞あるのかもしれないけど大抵名詞だから
あと、名詞は新しい言葉が増えてくけど動詞は大して増えないから気にしなくてもあんま問題無い
(まぁググるとかはかなり浸透してるけど)
0446nobodyさん
2010/05/18(火) 00:59:24ID:???"めんど臭いから"自作するなら(特殊な用途除き)確実に既存の奴使った方が良いぞ
"興味が有るから"自作するなら好きにすれば良いが
0447nobodyさん
2010/05/18(火) 12:39:22ID:ZcBPV0UEそのめんどくささが既存のものだと100倍になる
アルゴリズムとして辞書から読み出し 比較だとすごい時間がかかるから
第一弾としてひらがな と 漢字などの集合体で 分ける
ひらがな 集合体 たとえば 4文字の組み合わせは
50^4(ひらがな50文字として)=6250000
その中で日本語として意味が通じるのは1%切ると推測されるから
それを単純にif 分で分離して やれば 80%位は分を理解できるんではないかとそれ以後は、辞書登録させ比較させる
原文
まぁググるとかはかなり浸透してるけど
自作
まぁ/ググ/るとかはかなり/浸透/してるけど
まだ作ってないが将来的に辞書引きして かなり とかは 分解できそうなので
まぁ/ググ/る/とかは/かなり/浸透/してるけど
にはなると思う
mecabの場合
ググ 名詞,一般,*,*,*,*,*
る 助動詞,*,*,*,文語・ル,基本形,る,ル,ル
とか 助詞,並立助詞,*,*,*,*,とか,トカ,トカ
はか 名詞,一般,*,*,*,*,はか,ハカ,ハカ
なり 助動詞,*,*,*,文語・ナリ,基本形,なり,ナリ,ナリ
になってしまう
自分で作ったものなら、何とかなるけど他人様の作ったものを解析してやる気力はない
0448nobodyさん
2010/05/18(火) 13:07:12ID:???なんかなぁ
そんなのは辞書の問題なのにMeCabがダメってのはどうなんよ
自分も(無脳では無いが)MeCab使った事あるけど精度・速度・使い勝手どれもまぁ満足できるレベルだ
もちろん、用途に合わせて辞書は若干チューンしたが
ちなみにMeCabは
>アルゴリズムとして辞書から読み出し 比較だとすごい時間がかかるから
これ+スコア付けを、あのスピードでやってる
0449nobodyさん
2010/05/18(火) 14:20:49ID:ZcBPV0UEは
行き当たりばったりでif分を書いてるので
文書を読む解析する成り立ってないものを
プログラムをとめてif分にして活用形も考える
デバッグ
とやっているので機械的作業にだんだん飽きてきた
助詞は数10しかないので一気にできたけど
一時的に辞書参照型に改造しよう
多少は楽になるだろう
二次生成物をうpした
mecabで遊んでくれ
http://uploader.moe.hm/cgi-bin/upload.cgi?mode=dl&file=1996
0450nobodyさん
2010/05/18(火) 14:26:13ID:???使ったことがあるんだろうが
〜って何?
とか
成り立たない文章とか生成しないかい?
最終的にこれを防ぐ方法を考えてるんだ
0451nobodyさん
2010/05/18(火) 15:19:22ID:???>〜って何?
>とか
>
>成り立たない文章とか生成しないかい?
MeCabはタダの形態素解析エンジンだぞ?
人工無能で文章生成する部分はMeCabの担当じゃない
もちろん変な解析のせいで最終的に変になるかもしれ無いが
殆どは変な(若しくは簡単な)生成や変な構文解析のせいで変な文になると思うよ
■ このスレッドは過去ログ倉庫に格納されています