mozc / Google 日本語入力 #1
レス数が950を超えています。1000を超えると書き込みができなくなります。
0001login:Penguin
2010/05/13(木) 11:58:50ID:e7jJ/yN9ref.
http://sourceforge.jp/magazine/10/05/11/0335246
http://googlejapan.blogspot.com/2010/05/google_10.html
0002login:Penguin
2010/05/13(木) 13:35:59ID:O0qZ7dj/Mandriva
http://www.geocities.jp/ep3797/mozc_01.html
FedoraとUbuntu
http://linux.ikoinoba.net/index.php?UID=1273605455
PCLinuxOS
http://tomcat.nyanta.jp/sb2/sb.cgi?eid=317
Momonga
http://b.awn.cc/2010/05/momonga-linuxgoogle.html
Fedora
http://tagoh.fedorapeople.org/ibus-mozc/
ほかにあれば追加よろしく
0003login:Penguin
2010/05/13(木) 13:40:57ID:O0qZ7dj/http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=581158
0004login:Penguin
2010/05/13(木) 14:06:04ID:y0/Hl/0Bhttp://aur.archlinux.org/packages.php?ID=37131
0005login:Penguin
2010/05/13(木) 15:08:09ID:y0/Hl/0B使ってるみたいだけど、これライセンス的にヤバくないの?
0006login:Penguin
2010/05/13(木) 15:29:54ID:O0qZ7dj/0007login:Penguin
2010/05/13(木) 15:44:26ID:y0/Hl/0Bというかそのまんまなかんじ。
0008login:Penguin
2010/05/13(木) 17:23:04ID:xS73WnAg0009login:Penguin
2010/05/13(木) 18:18:47ID:SrfxWAX1アイコン差し替えたらしい。
0010login:Penguin
2010/05/13(木) 18:38:28ID:y0/Hl/0Bmozcのバグトラッカーにも「アイコンつけてくれよ」的な要望があがってたから、
そのうちchromuimみたいにmozc用アイコン用意されるかもね。
っていうかそれに期待。
0011login:Penguin
2010/05/13(木) 19:55:32ID:VXGGLAQH0012login:Penguin
2010/05/13(木) 23:15:19ID:Nw/pWA1B先読みした文字列を選ぶのにはtabキー使うのか。
マウスで選んでも反映されないな。
0013login:Penguin
2010/05/14(金) 00:19:52ID:jXUhgslI0014login:Penguin
2010/05/14(金) 00:27:46ID:Z50AdfD5個人的にはスペル判らない英単語がくろーむとか読みで変換出来る奴が欲しいかな、
順位は一番下でいいんだけど。
0015login:Penguin
2010/05/14(金) 05:12:52ID:1eOIuraW0016login:Penguin
2010/05/14(金) 20:05:21ID:V8YokLRh0017login:Penguin
2010/05/14(金) 20:12:46ID:RKoNrI9+えっ?
0018login:Penguin
2010/05/14(金) 20:51:26ID:UhlYQllqttp://internet.watch.impress.co.jp/docs/news/20100511_366273.html
> Google日本語入力をオープンソース化するプロジェクトは、「Mozc(モズク)」と名付けられ、専用サイトでの情報公開やソースコードの提供などが始められた。
0019login:Penguin
2010/05/14(金) 21:27:35ID:/QeyC4hy0020login:Penguin
2010/05/14(金) 21:48:39ID:zcXnY/Qu「海の…と消える」「海の…となる」
○「もくず(藻屑)」
×「もずく(水雲,海蘊)」
ttp://kotonoha.cc/no/62264
0021login:Penguin
2010/05/14(金) 23:00:47ID:16GEbLzFオープンソースなんで誰がいじってもいいんだが出来ればきちんとしたプロジェクトが欲しいところ
0022login:Penguin
2010/05/14(金) 23:12:54ID:Ivit4eRwはじまったばかりとはいえ、変換効率ではすでにAnthyとは比ぶべくもない。
まあ、「くらぶべくもない」は変換できなかったわけだが。
記念カキコ@Arch Linux
0023login:Penguin
2010/05/14(金) 23:29:32ID:GNLYfS8shttp://github.com/hidegit/mozc-config
0024login:Penguin
2010/05/14(金) 23:30:30ID:GNLYfS8s0025login:Penguin
2010/05/14(金) 23:33:14ID:tJIzuQ9X0026login:Penguin
2010/05/15(土) 00:50:34ID:zuogiZUrArch用。
http://aur.archlinux.org/packages.php?ID=37131
0027login:Penguin
2010/05/15(土) 01:12:29ID:CRGQ+MuZMomonga用spec file
ttp://developer.momonga-linux.org/viewvc/pkgs/trunk/pkgs/ibus-mozc/ibus-mozc.spec?revision=43945&view=co
0028login:Penguin
2010/05/15(土) 01:17:28ID:nnVyvNGN日本語変換関連で有名なハッカーみたいだし。
0029login:Penguin
2010/05/15(土) 13:02:02ID:0uvn7PI2アイコンはやっぱり寂しい気がする
0030login:Penguin
2010/05/15(土) 13:18:00ID:OvnKkS2u/usr/share/ibus-mozcにproduct_icon.pngでアイコンに
したい画像をおいてmozcを再起動してやると表示されるよ
mozc.xmlに書いてあった
0031login:Penguin
2010/05/15(土) 13:35:54ID:0uvn7PI2レスありがと
自前ビルドなんだけど/usr/share/ibus-mozcがなかった
どこにいったのかちょっと調べてみる
0032login:Penguin
2010/05/15(土) 13:39:51ID:OvnKkS2u/usr/share/ibus-mozcは多分つくってやらないとないと思われる
sudo mkdir /usr/share/ibus-mozc
でつくるといいと思うよ
0033login:Penguin
2010/05/15(土) 13:44:30ID:0uvn7PI20034login:Penguin
2010/05/15(土) 13:45:58ID:0uvn7PI2リロードしときゃよかったorz
重ね重ねありがとです
0035login:Penguin
2010/05/15(土) 15:39:19ID:WBC1KGbjttp://ml.vinelinux.org/vineseed/msg04129.html
0036login:Penguin
2010/05/15(土) 19:49:54ID:xsBDhuUs0037login:Penguin
2010/05/15(土) 20:30:24ID:WBC1KGbj「もずく」ではない。「Mozc(モズク)」だ!
0038login:Penguin
2010/05/15(土) 20:47:44ID:dl5VQhEj0039login:Penguin
2010/05/15(土) 21:11:41ID:+VLrpVYE0040login:Penguin
2010/05/16(日) 00:01:11ID:bGG7bl+10041login:Penguin
2010/05/16(日) 00:20:06ID:kVBIoRlzAnthyは、漢字は知ってるけど日本語がわかってない感じだった
mozcはちゃんと日本語が分かっている感じがする
文節を区切って変換する人は、Modified Anthyのほうが幸せになれるだろうけど
長文を打つ人やAtokに憧れてる人にはいいと思う
0042login:Penguin
2010/05/16(日) 01:52:18ID:SQrMrh4Pという程度。
0043login:Penguin
2010/05/16(日) 01:55:41ID:SQrMrh4P検索屋がつくってるから、それはあるんだろうね。
0044login:Penguin
2010/05/16(日) 03:16:46ID:Jq+w1ra8ひじき
つづり
ふめい
0045login:Penguin
2010/05/16(日) 07:19:55ID:KwS5bda10046login:Penguin
2010/05/16(日) 07:27:28ID:LEPWL7ld0047login:Penguin
2010/05/16(日) 07:45:50ID:s4uMTR0w0048login:Penguin
2010/05/16(日) 09:40:49ID:LEPWL7ld0049login:Penguin
2010/05/16(日) 10:57:27ID:dqv9F0yk乗り換えない理由がなくなったな
0050login:Penguin
2010/05/16(日) 20:42:16ID:eFgJW+/G0051login:Penguin
2010/05/16(日) 20:45:09ID:MN751rmN>Google 日本語入力のOSSは、例の辞書がないから無意味とか言われると、とても残念だ。
お前ら批判されてるぞw
0052login:Penguin
2010/05/16(日) 20:55:31ID:mCXM9j+3向こうはプロ。批判しているのは素人。
そしてオイラはSKKユーザだから対岸の火事w
0053login:Penguin
2010/05/16(日) 21:00:27ID:cH9XZXAo0054login:Penguin
2010/05/16(日) 21:30:36ID:BYyS/9z2エスティマが届いたでござるの巻
0055login:Penguin
2010/05/16(日) 21:59:20ID:kKWK8GP90056login:Penguin
2010/05/16(日) 22:21:33ID:LDcnnSF/GTK_IM_MODULE=xim にすると分かり易くなるけど、今度は変換候補窓が明後日な位置に出ちゃう。
0057login:Penguin
2010/05/16(日) 23:01:01ID:sGArlv0Lっていうか、SKKってつまりKAKASIの辞書ってことでしょ?
あれぶち込んだら熟語系は結構補完できないものだろうか?
>>55
しかし汎用プロトコルサーバって作れないものかな?
pulseadioみたいに対応アプリによって別プロトコルのサーバに見えるみたいな。
0058login:Penguin
2010/05/16(日) 23:01:17ID:dqv9F0ykまなか→真中瞳
かるろ→カルロス・ゴーン
ぱんく→パンクブーブー
ばらく→バラク・オバマ
しゃんはいば→上海万博
とある→とある科学の超電磁砲
そらの→ソラノヲト
アップデートで辞書更新してるのかな?
0059login:Penguin
2010/05/16(日) 23:39:56ID:mCXM9j+3そんなフランクな辞書嫌だ……
0060login:Penguin
2010/05/16(日) 23:41:22ID:+DbqisIGかるろ->カルロス
->カルロスゴン
だけどw「かるろすご」までいくとゴーンが出てくるけど
0061login:Penguin
2010/05/16(日) 23:47:19ID:tIejJQ9m0062login:Penguin
2010/05/17(月) 00:05:58ID:MPHEbhtS例の辞書と言われても一昨日使い始めたばかりなのでわからないけど、なんかパワーアップしてるね。
どういう事なんだろうこれ?
0063login:Penguin
2010/05/17(月) 00:35:56ID:6iXl9CjZあ、うぶん厨か。
0064login:Penguin
2010/05/17(月) 01:46:43ID:MPHEbhtS何もせずに只更新しただけで辞書が充実するなんて初めての経験だわ。
0065login:Penguin
2010/05/17(月) 01:47:27ID:1JzuPqRlhttp://goo.gl/xsxM
0066login:Penguin
2010/05/17(月) 02:26:09ID:L4lIJaWJ0067login:Penguin
2010/05/17(月) 08:17:33ID:SrnXuvoJ時間が経つとこの変換ができるようになるの?なんで?
まなか がまだでないよ。
0068login:Penguin
2010/05/17(月) 09:00:55ID:3VvgwkSa野良パッケージを使ってて、その野良が辞書追加してくれてるだけ。
0069login:Penguin
2010/05/17(月) 09:50:39ID:LXrt6Hw/辞書が使えなくて既存よりちょっとマシ程度では、夢と希望の99%は潰えたわけで
この分野では(IMだけでなく自然言語処理)一緒に夢を見させてはくれないということね。
ちょっとM$のようで幻滅。
0070login:Penguin
2010/05/17(月) 09:54:20ID:GgtwhzgOMicrosoftもGoogleも営利企業だから、営利優先なのは仕方ないだろう。
Googleに変に期待するのは間違いというものだ。
0071login:Penguin
2010/05/17(月) 10:15:13ID:LXrt6Hw/M$とgoogleではブランドイメージが違うよ。というか違ってた。
今は足元が見えなくなった似たような巨大企業に見えるって話。脱線してるね。
0072login:Penguin
2010/05/17(月) 14:20:04ID:C9+QIeWJあんたが勝手な思い込みで過剰に期待してただけじゃないのか、それは
0073login:Penguin
2010/05/17(月) 15:24:58ID:wWBDQlhuとりあえずmain.ccをこうしてみたら再起動してくれるようになった。
int reboot() {
- const char *path = "/usr/bin/killall";
+ const char *path = "/usr/bin/ibus-daemon";
char *const argv[] = {
- (char *)"/usr/bin/killall",
- (char *)"ibus-daemon",
+ (char *)"/usr/bin/ibus-daemon",
+ (char *)"-rdx",
(char *)NULL
};
0074login:Penguin
2010/05/17(月) 16:24:41ID:m44FgXbZ0075login:Penguin
2010/05/17(月) 18:00:46ID:MPHEbhtSうちは>>61と同じだわ。
学習してるんじゃないの?
例えば曹操とか一度分けて変換したら次から出るようになったよ。
>>68
とりあえずmozc用にapt line追加したりはしていないんだよね。
モデファイアンシーの時に色々やってたのが効いてる気がするけど覚えてないや。
辞書はどうやらそれ由来の奴が追加されたのかな?
しかしそれだけでこれだけ印象が変わるというのは発見だと思う。
anthy用の辞書がこんなに使えるものだったなんて、
単にグーグル変換使ってるだけじゃ気がつかなかっただろうな。
0076login:Penguin
2010/05/17(月) 18:21:38ID:z+wFOyNBそりゃ勝手に期待していただけで、まともな人は MS も Google も同程度に evil
だって思っているよ。(Google が evil じゃない程度には MS も evil じゃない)
>>69
(MeCab も使っている) IPADic は40万語の辞書をフリーで公開してくれていて、
MeCab も Mozc もその恩恵を最大限に受けているわけだが、
それで自然言語処理まで幻滅と言うのは言い過ぎだと思うぞ。
Debian かなにかに入っている Cannadic を使った ChaSen でも使ってみるといいよ。
「ちょっとマシ」どころではない。
そして、Mozc みたくデータ構造やアルゴリズムまで惜しみなく公開してくれてるんだから、
うだうだ言ってないであとは自分で作ればいいじゃん。
0077login:Penguin
2010/05/17(月) 18:57:08ID:L4lIJaWJ0078login:Penguin
2010/05/17(月) 19:04:56ID:bWqpYvJzWinとOSXの開発版がアップデートされたからそれに伴う変更だと思うけど。
変換周りでの変更では口語表現の変換精度の向上とあるから、その辺の変更だと思う。
0079login:Penguin
2010/05/17(月) 19:09:36ID:6iXl9CjZChange Log みろよ。wikiの更新だけ。
mozcソースはr10から更新されてない。
0080login:Penguin
2010/05/17(月) 19:16:14ID:MPHEbhtSまあ、グーグルは検索売ってる会社でMSはOS売ってる会社だからな
本業絡みのフリー公開要求は酷でしょ。
只、オマケに関する考え方はかなり違うんじゃないかな?
日本語変換に関して言えば、各社公開してきた中で、MSが公開したのはAPIだけだろうか?
DOS用のFEPが利用できたりしたのにはそのお陰もあっただろうとは思うけど。
0081login:Penguin
2010/05/17(月) 19:21:14ID:bWqpYvJzもしかすると、OSSで公開したときにWinとOSX用の変更も入っていたのかも。
0082login:Penguin
2010/05/17(月) 21:50:10ID:MPHEbhtS0083login:Penguin
2010/05/17(月) 22:08:20ID:6iXl9CjZ0084login:Penguin
2010/05/17(月) 22:41:05ID:otewHu6c> 10.04 にibus-mozc_0.10.288.102-1_i386.deb を入れてみた
> 「バージョン」を変換して表示されるバージョンは「Mozc-0.11.352.0」みたいだね
公開時のバージョンはMozc-0.11.352.0 だったね
0085login:Penguin
2010/05/17(月) 22:45:05ID:sen2xgUr0086login:Penguin
2010/05/17(月) 22:51:53ID:LXrt6Hw/幻滅しているのは結局皆で協力して作る体制でないこと。
googleの収集能力に皆の知恵を合わせればきっといろいろな素晴らしい辞書や
それに見合うさまざまな自然言語処理ロジックができると思う。ロジックなんて
データとセットだと思うし、基礎分野で直接金儲けなんて所詮無理だと思うんだよね。
それが望みなら個々にやってもいいんだけどさ。つまらないなと思って。
0087login:Penguin
2010/05/17(月) 23:30:39ID:MPHEbhtSよくわからないけど、そんなの単に呼びかければいいだけの話じゃないの?
それとも鍋パーティーで持参した材料が期待はずれだったって話?
0088login:Penguin
2010/05/17(月) 23:43:37ID:6iXl9CjZ0089login:Penguin
2010/05/17(月) 23:46:25ID:LXrt6Hw/出された料理にケチつけてるだけだぞ。正直言ってガッカリだって。
0090login:Penguin
2010/05/17(月) 23:51:36ID:MPHEbhtSまずそれが理解できないんだよな。まだそんなバージョンじゃないような気がするし。
0091login:Penguin
2010/05/18(火) 00:02:35ID:B2LkaHDwうん。
// mozc_version_template.txt
MAJOR=0
MINOR=11
BUILD=daily
// mozc_version.py
if expand_daily and self._build == 'daily':
zero_day = datetime.date(2009, 5, 24)
self._build = str(
datetime.date.today().toordinal() - zero_day.toordinal())
ソースの改変に関係なく毎日バージョンが上がる。
実際のソースのバージョンはこれ、
$ ./gclient revinfo
src: http://mozc.googlecode.com/svn/trunk/src@16;
src/mozc_build_tools/gyp: http://gyp.googlecode.com/svn/trunk@819;
src/protobuf/files: http://protobuf.googlecode.com/svn/trunk@328;
src/third_party/gtest: http://googletest.googlecode.com/svn/trunk@422
「0.11.16」ってことになるのかな
0092login:Penguin
2010/05/18(火) 00:18:46ID:vzn3LFMgん?早合点なのかな?もう少し待ってみよう
面白そうになったらまた来るよ
0093login:Penguin
2010/05/18(火) 00:57:27ID:ek1o3lz7Win版で問題になってる意図的に間違った語彙やエロ単語ばっかり送ってる連中がいること忘れてないか?
世の中きれい事だけで出来てるわけじゃないしな
0094login:Penguin
2010/05/18(火) 08:59:01ID:JWxOBNY+個人的な予想だけど、辞書は辞書で別に育てるプロジェクトが
できるんじゃないの?核になる辞書はすでにあるんだし。
0095login:Penguin
2010/05/18(火) 10:03:01ID:LImcuvrfhttp://tools.google.com/dlpage/res/japaneseinput/images/icon-128.png
0096login:Penguin
2010/05/18(火) 13:47:49ID:70sjXmJM決め打ちされている LOCALE_DIR の値を適切なパスで書き換えてください。
ibus-setup-mozcのLOCALE_DIRに書くパスはどのように書けばいいのでしょうか?
とりあえずLOCALE_DIR = /home/Mydir/.mozcとしたけどダメでした
0097login:Penguin
2010/05/18(火) 14:10:36ID:5Kw0K1CNやっつけで書いた汚いパッチですが、ご参考までに。
http://aur.archlinux.org/packages/mozc-svn/mozc-svn/packaging-mozc-config.patch
setup.glade は /usr/share/mozc-config/setup.glade を想定。
ja.mo は /usr/share/locale/ja/LC_MESSAGES/ibus-mozc.mo を想定。
で、mozc r18 でソースに更新が入り、mozc-config の make が通らなくなりましたよと。
0098login:Penguin
2010/05/18(火) 14:13:23ID:70sjXmJM早速の対応ありがとうございますm( _ _ )m
0099login:Penguin
2010/05/18(火) 14:25:57ID:70sjXmJMでもスキルがないので使い方わからないです(つд⊂)エーン
0100login:Penguin
2010/05/18(火) 21:20:30ID:zuDAgc9p当て字でないとでないので登録できないのは致命的だと知った今日この頃でした
0101login:Penguin
2010/05/18(火) 21:34:46ID:v2MqqeZ1ひらがな->カタカナにしたいときとか
0102login:Penguin
2010/05/18(火) 21:57:33ID:9S8dCsGu0103login:Penguin
2010/05/18(火) 22:04:54ID:5Kw0K1CNしかも変更内容が全然書かれていないLog。
0104login:Penguin
2010/05/18(火) 22:05:49ID:ob1SjPRd0105login:Penguin
2010/05/18(火) 22:22:09ID:Cw6VPgaBビルド時に辞書へ登録すればいいと思って、登録様式を眺めているが
まだ理解しきれていない。
0106login:Penguin
2010/05/18(火) 23:04:29ID:7/hsmRtMttp://www.geocities.jp/ep3797/mozc_01.html
そんなあなたにここで公開されている[開発者向け] Mozc辞書生成用のスクリプトとデータ
というのを使うと幸せになれるかも
Rubyで書かれているらしいから、Rubyを解釈できるなら適切な形に書き換えると汎用性
アップするかも
0107login:Penguin
2010/05/18(火) 23:26:18ID:5Kw0K1CN0108login:Penguin
2010/05/19(水) 00:07:33ID:Abp89he5サンキュー
0109login:Penguin
2010/05/19(水) 01:29:49ID:OiNM5kLh幻滅もなにも、Googleはこれまで検索インデックスも検索アルゴリズムも公開していない。
(PageRank は公開したが、あれはもはや数千とも数万とも言われるランキングの特徴量の一つにすぎない)
Search Wiki で検索結果にみんなの知恵を合わせる方法も、去年一時期やっていたが止めた。
そもそも協力するという会社ではない。
オープンソースはばんばん利用して、少しだけ(20%ルールでやった部分)公開する。
もともとクローズドな会社でしょ。MS と同じくらい evil だって知らないで騒いでいるだけだよ。
Google 日本語入力はもう20%ルールではないし、公開できない部分が増えても当然。
0110login:Penguin
2010/05/19(水) 04:20:37ID:MWVh65MqF7
0111login:Penguin
2010/05/19(水) 08:20:38ID:f/GdZ3Wf>>110
mozcに限ったことではない。スレ違い氏ね。
0112login:Penguin
2010/05/19(水) 08:40:33ID:YHsJ/j49>>104
>>107
mozc-dictなんかバグってるね。なにをどうすればこんな単純ミスがスルーされたのか謎だけど。
ところでこれ消すのはどうするんだろう?
0113login:Penguin
2010/05/19(水) 09:06:43ID:7ZniSmP+0114login:Penguin
2010/05/19(水) 09:22:08ID:Abp89he5libprotobuf-dev libgtest-devだったと思う。
0115login:Penguin
2010/05/19(水) 09:26:47ID:7ZniSmP+うわーほんとだ! Wiki の依存項目も更新されてるのを見落としてた。
さんくす。
0116login:Penguin
2010/05/19(水) 14:34:36ID:bawMocvX> mozc-dictなんかバグってるね。なにをどうすればこんな単純ミスがスルーされたのか謎だけど。
> ところでこれ消すのはどうするんだろう?
修正および消去が実装された模様。
0117login:Penguin
2010/05/20(木) 23:06:32ID:GdrSg3LGmake install を実装したのはいいけど、ibus-setup-mozc 忘れてますよ(´・ω・`)
バグトラッカーにあげるのも躊躇するほどのアレだし…
0118117
2010/05/20(木) 23:21:12ID:GdrSg3LG0119login:Penguin
2010/05/21(金) 03:04:25ID:YmYjM0UNuimで実装してくれ。
0120login:Penguin
2010/05/21(金) 08:17:43ID:2eer+h5sこれもibusの問題かなあ。
あと、候補リストの矢印アイコン。あれ、いらんやろ。
0121login:Penguin
2010/05/21(金) 11:06:48ID:ivOBc5wp誰がチェックしたかもしれない辞書による、余計なお世話の予測変換は虫唾がはしる。
日本史辞典の水準で人名と固有名詞が登録されている辞書なら欲しいんだけどな。
カタカナ単語は、変換後に慣用語として自動登録してくれりゃいい。
0122login:Penguin
2010/05/21(金) 17:19:42ID:9H77kE5p0123login:Penguin
2010/05/22(土) 07:00:25ID:vjYfauX/0124login:Penguin
2010/05/23(日) 02:07:57ID:UspU2FkDすぐ忘れてる気がする
0125login:Penguin
2010/05/23(日) 15:50:41ID:FDXRwsL40126login:Penguin
2010/05/25(火) 20:03:59ID:D0kMVtAD0127login:Penguin
2010/05/26(水) 11:44:05ID:tVqPx3QC変更するってのは検索すればみつかるんだけど。
ことえり準拠?
それでもよくわからんです^^;
と、skkばかりつかってる人間です。
0128login:Penguin
2010/05/26(水) 19:31:15ID:ttKtttaQ「Google でインターンをしませんか?」のRTの嵐。
全然役に立たねえ。
0129login:Penguin
2010/05/27(木) 02:12:08ID:8D3Mnw580130login:Penguin
2010/05/27(木) 04:01:18ID:A7Erm6S6カラムとボタンの文字が日本語じゃないのは何ででしょう
0131login:Penguin
2010/05/27(木) 12:37:26ID:6uBEpbK/0132login:Penguin
2010/05/27(木) 13:40:36ID:rhN036Jjttp://googlejapan.blogspot.com/2010/05/google-ver-01136510x.html
ちょっとビルドしてくる
0133login:Penguin
2010/05/27(木) 14:03:04ID:MgqFshjqまだunstable にもはいってないよ
0134login:Penguin
2010/05/27(木) 14:54:09ID:oxCJ8BjKmozc-config 短い命だったなあ。
> # Google 日本語入力と同様、変換エンジンを別プロセス化することにより、
> 他のインプットメソッドフレームワーク (SCIM 等) と共存しやすくしました。
+ +
∧_∧ +
(0゚・∀・) ワクワク
(0゚∪ ∪ + テカテカ
と__)__) +
0136login:Penguin
2010/05/27(木) 16:20:41ID:oGq87vUm結局、品詞を細かく処理するより辞書に放り込む方が効率的なのか
0137login:Penguin
2010/05/27(木) 16:25:06ID:cGg44XXv0138login:Penguin
2010/05/27(木) 16:51:15ID:6tiTtwJ6mozc-configってgtk系じゃなかったっけ。
qt4依存が嫌な人にはいいかもしれないよ
0139login:Penguin
2010/05/27(木) 16:54:00ID:n0R4gbiR0140login:Penguin
2010/05/27(木) 16:58:01ID:oxCJ8BjKqtが必要なのはビルド時だけ、ということになっている。
0141login:Penguin
2010/05/27(木) 17:19:35ID:oxCJ8BjK俺うぶんちゅじゃないから関係ないけど。
0142login:Penguin
2010/05/27(木) 17:45:50ID:YRoffuhFちょっと教えて下さい。
ibus_mozc は ibus-engine-mozc へ
mozc_server, mozc_tool は何にリネームすればよし?
0143login:Penguin
2010/05/27(木) 18:06:00ID:oxCJ8BjK0144login:Penguin
2010/05/27(木) 18:19:27ID:YRoffuhF/usr/lib/mozc を作成してそのまま放り込むのね。
/debian/rules 読んで解決しますた。
0145login:Penguin
2010/05/27(木) 18:21:48ID:rhN036JjMozc 辞書ツール
/usr/lib/mozc/mozc_tool --mode=dictionary_tool
Mozc プロパティ
/usr/lib/mozc/mozc_tool --mode=config_dialog
0146login:Penguin
2010/05/27(木) 19:26:45ID:DRUPPUiv1回全部消して再ビルドしても同じだった。
# debuild -uc -us
dpkg-buildpackage -rfakeroot -D -us -uc
dpkg-buildpackage: set CFLAGS to default value: -g -O2
dpkg-buildpackage: set CPPFLAGS to default value:
dpkg-buildpackage: set LDFLAGS to default value: -Wl,-Bsymbolic-functions
dpkg-buildpackage: set FFLAGS to default value: -g -O2
dpkg-buildpackage: set CXXFLAGS to default value: -g -O2
dpkg-buildpackage: source package mozc
dpkg-buildpackage: source version 0.11.365.102
dpkg-buildpackage: source changed by Yasuhiro Matsuda <mazda>
dpkg-buildpackage: host architecture i386
dpkg-checkbuilddeps: Unmet build dependencies: libqt4-dev gyp
dpkg-buildpackage: warning: Build dependencies/conflicts unsatisfied; aborting.
dpkg-buildpackage: warning: (Use -d flag to override.)
debuild: fatal error at line 1340:
dpkg-buildpackage -rfakeroot -D -us -uc failed
0147login:Penguin
2010/05/27(木) 19:28:15ID:DRUPPUiv0148login:Penguin
2010/05/27(木) 19:28:27ID:v0MonnWY0149login:Penguin
2010/05/27(木) 19:32:45ID:DRUPPUiv>>148
これからチェックします。
0150login:Penguin
2010/05/27(木) 19:38:48ID:rhN036Jj>dpkg-checkbuilddeps: Unmet build dependencies: libqt4-dev gyp
これは入れなくていいのかな
0151login:Penguin
2010/05/27(木) 19:40:49ID:cGg44XXv僕はそれをapt-get installしてコンパイルとインストールをしたよ。
0152login:Penguin
2010/05/27(木) 19:53:47ID:6Y+ANOvv0153login:Penguin
2010/05/27(木) 20:05:53ID:DRUPPUivスレ汚し申し訳ないです。
0154login:Penguin
2010/05/27(木) 21:36:13ID:uPQpxNci0155login:Penguin
2010/05/27(木) 21:38:22ID:dxF6D4ZXアイコンないの?
0156login:Penguin
2010/05/27(木) 21:43:58ID:Q5Q/OSyKあなたがデザインして送ればいいじゃないか。
0157login:Penguin
2010/05/27(木) 21:54:18ID:izabMx5Y/usr/share/ibus-mozc 下?
0158login:Penguin
2010/05/27(木) 21:57:34ID:dxF6D4ZX他力本願w
Chromeに対するChiromiumのように、青を基調になにかないかねぇ。
Google検索に間違って登録されてる朝昇龍が辞書ツールのお陰で朝青龍になってウマー
>>153みたいになったけど、何か必要なパッケージが増えたんだろうと思って素直に
sudo apt-get install g++ python libibus-dev libcurl4-openssl-dev libssl-dev zlib1g-dev libdbus-1-dev libglib2.0-dev libprotobuf-dev protobuf-compiler libgtest-dev subversion devscripts debhelper qt4-dev-tools gyp
やったら、ずらずらと追加されて、ビルド通ったから、コンパイル通らないとここで書くようなヘマしなくて済んだ。
0159login:Penguin
2010/05/27(木) 22:02:26ID:izabMx5Y今回のリビジョンではその辞書が有効になっていない様な気がする。
0160login:Penguin
2010/05/27(木) 22:06:57ID:YRoffuhF>今回のリビジョンではその辞書が有効になっていない様な気がする。
\(^o^)/オワタ
大丈夫、有効になってる。
0161login:Penguin
2010/05/27(木) 22:09:36ID:izabMx5Yあ、俺だけかorz
0162161
2010/05/27(木) 22:16:37ID:izabMx5YUTUMIさんの辞書も有効になった。ヨカッタ∩( ・ω・)∩
0163login:Penguin
2010/05/28(金) 02:59:18ID:SzcMjVflで止まった。
0164login:Penguin
2010/05/28(金) 03:00:35ID:SzcMjVfl0165login:Penguin
2010/05/28(金) 15:23:31ID:XhIFu/as辞書を組み込みは以前と同じように dictionary1.txt でいいの?
0166login:Penguin
2010/05/28(金) 17:37:36ID:M6g8oFq5いいよ。
本家uimもmozc対応に動いてるみたいね。
0167login:Penguin
2010/05/28(金) 17:58:58ID:M6g8oFq50168login:Penguin
2010/05/28(金) 18:04:24ID:mJqoHRFqz+, ‥
z+. …
z+/ ・
z+h ←
z+j ↓
z+k ↑
z+l →
0169login:Penguin
2010/05/29(土) 00:32:58ID:yDWgz2cr「カーソルを右 (左) へ移動」に割り当てたキーを押すと、右端 (左端) へ行ってしまう。
ibus-mozcだと問題なさげ。
しかし、俺って今までどんだけアホなIM使ってたんだよと、しみじみ感じている。
文章打つのがたのしくて仕方ない。
0170 [―{}@{}@{}-] login:Penguin
2010/05/29(土) 02:01:59ID:AyL6o9sVソース漁って見つけた。
ツールのアイコンは
/usr/share/ibus-mozc/unknown.ico
でいけた。中身はpngでいけた。
この先もコロコロ変わるんだろうけど。
0171 [―{}@{}@{}-] login:Penguin
2010/05/29(土) 02:08:24ID:AyL6o9sVのリンク貼ってもいけた
0172login:Penguin
2010/05/29(土) 04:26:35ID:AyL6o9sV./unix/ibus/main.cc:const char kEngineIcon[] = "product_icon.png";
./unix/ibus/path_util_test.cc: const string &icon_path = GetIconPath("test.png");
./unix/ibus/path_util_test.cc: const string kExpected = "/test.png";
./unix/ibus/mozc_engine.cc:const char kMozcToolIconPath[] = "unknown.ico";
./gui/about_dialog/about_dialog.cc: product_image_.reset(new QImage(":/product_logo.png"));
./gui/about_dialog/version_image_widget.cc: pixmap_.reset(new QPixmap(":/update_uptodate.png"));
0173login:Penguin
2010/05/29(土) 05:05:05ID:HpwUbVkD0174login:Penguin
2010/05/29(土) 05:55:26ID:AyL6o9sVhttp://gazo.pandoravote.net/src/1275079999785.png
0175login:Penguin
2010/05/29(土) 06:02:32ID:AyL6o9sV・エンジンロゴアイコン /usr/share/ibus-mozc/product_logo.png
・ツールアイコン /usr/share/ibus-mozc/unknown.ico
・なにやら用途不明 update_uptodate.png test.png
ファイル形式はとりあえず、png svg など?
0176login:Penguin
2010/05/29(土) 07:17:39ID:BVlp1Ywhアイコンはmozc iconsとかで画像でググると・・・・
(gogle以外から取るのが憚れるのなら、本来linuxでは使えない本家をダウンロードしようとしてキャンセルすると右側に・・・)
ツールアイコンは、seahorceのアイコンを使えば・・・
0177login:Penguin
2010/05/29(土) 07:21:55ID:BVlp1Ywhごめん
ツールアイコンは>>171使えばいいのか
0178login:Penguin
2010/05/29(土) 07:36:25ID:BVlp1Ywh0179login:Penguin
2010/05/29(土) 07:47:20ID:AyL6o9sV0180login:Penguin
2010/05/29(土) 07:52:21ID:BVlp1Ywhそれを使ってるんだが、うまくいかない。
32ピクセルじゃないと駄目なのかなと思って、変換したんだけど、変換しても駐車禁止マークのままだorz
0181login:Penguin
2010/05/29(土) 08:13:57ID:AyL6o9sV×エンジンロゴアイコン /usr/share/ibus-mozc/product_logo.png
○エンジンロゴアイコン /usr/share/ibus-mozc/product_icon.png
0182login:Penguin
2010/05/29(土) 08:18:55ID:BVlp1Ywhconst char kEngineDescription[] = "Mozc Japanese input method";
const char kEngineIcon[] = "product_icon.png";
const char kEngineLanguage[] = "ja";
product_logoじゃなくてproduct_icon>>172じゃないか
いけた!
0183login:Penguin
2010/05/29(土) 08:21:57ID:BVlp1Ywhthx!
0184login:Penguin
2010/05/29(土) 14:43:55ID:owr+HVq8こりゃ、まだ手を出すには早そうだw
0185login:Penguin
2010/05/29(土) 15:14:57ID:yDWgz2cr> uim-mozcって、変換前入力中のカーソルの左右移動がおかしくない?
> 「カーソルを右 (左) へ移動」に割り当てたキーを押すと、右端 (左端) へ行ってしまう。
これ直った。中の人ありがとう。
0186login:Penguin
2010/05/29(土) 16:13:55ID:BVlp1Ywhここの人名辞書と、追加名詞辞書、郵便番号辞書を書いてある通りに辞書書き換えてからビルドすると、google日本語入力と遜色ないね。
アイコンも表示させちゃったし満足。
0187login:Penguin
2010/05/29(土) 16:24:48ID:Wy6TIjrtところがまだ当分、アップデートはおおいんじゃない?めんどくさそうだよ。
0188login:Penguin
2010/05/29(土) 16:50:31ID:BVlp1Ywhそのうち各ディストリビューションで標準で使えるようになるでしょう。
Chromiumブラウザも最初は酷いもんだったし、それと同じ様に完成していく過程を楽しめばよい。
0189login:Penguin
2010/05/29(土) 18:47:37ID:WFFijhq6ユーザー辞書にインポートすればok。
186のURLから入手できる辞書ファイルは、ユーザー辞書用とはデータのパターンが違うが、
書き換えればいける。
個人的にはAnthyで作ってたユーザ辞書を変換してmozcで使えるようにしたから、
完全に乗換ちゃった。
0190login:Penguin
2010/05/29(土) 19:15:21ID:ZqFe9xLlユーザー辞書にインポート
↓
辞書が更新
↓
さらにインポート
↓
重複した単語が増えて無意味に辞書が膨れ上がる
と、ならないか?
0191login:Penguin
2010/05/29(土) 19:30:12ID:yDWgz2crあるとしても当分先なのでは。
0192login:Penguin
2010/05/29(土) 19:47:39ID:3OqiOhkTこの間の更新では7万語ほど追加された
0193login:Penguin
2010/05/29(土) 21:17:05ID:yDWgz2crまじで? そういうの Commit Log に残らないのかな?
7万語ものdiff見せられても困るけど。
0194189
2010/05/29(土) 22:43:57ID:WFFijhq6重複することは考えてなかったけれど、重複はしてるんでしょうね。
ただ、実際に使っていて、気にはならないよ。
むしろ、今まで育ててきた辞書に登録してある単語が変換できなくなる方が困る。
辞書が脹れ上がったばあい、何が問題になるの?
0195189
2010/05/29(土) 22:57:54ID:WFFijhq6~/.mozc にあるユーザー辞書へのインポートだから、mozc本体をアップデートしても
再インポートにはならないです。
0196login:Penguin
2010/05/29(土) 23:10:09ID:yDWgz2cr例えば、
$ grep "ILO条約" *.txt
dictionary1.txt:あいえるおーじょうやく 2310 2239 7323 ILO条約
mozc-meisi-20100516ut.txt:あいえるおーじょうやく 2239 2239 14771 ILO条約
ついでに、UITUMIさんの辞書自身の内部にも重複があったりした。
例えば、
$ grep "0741273.*北海道深川市音江町" *.txt
mozc-zipcode-20100513.txt:0741273 3004 3004 10000 北海道深川市音江町
mozc-zipcode-20100513.txt:0741273 3004 3004 10000 北海道深川市音江町
読みと漢字は同じだが、真ん中の数字が違うのがオリジナルの辞書にあったりするから、
正確な重複数までは確認できてない。
0197login:Penguin
2010/05/29(土) 23:16:18ID:yDWgz2cr> 辞書が脹れ上がったばあい、何が問題になるの?
その程度次第だけど、重複していることがわかると、
「どのくらい重複しているのか」
「果たしてこの追加辞書にどれだけの追加する価値があるのか」
とかいろいろ気になってしまう。
0198login:Penguin
2010/05/29(土) 23:54:45ID:yDWgz2cr納得できんな。
0199login:Penguin
2010/05/30(日) 00:17:22ID:72nIDqZ2あとユーザー辞書でベクターにあったカタカナ語辞書入れてみたらいい感じだな。
Book Offはあるのにbookがないとかはまああるけど。
0200login:Penguin
2010/05/30(日) 00:24:14ID:ctRryZlG3357 / 105793 (約3%)
mozc-meisi-20100516ut.txt とオリジナル辞書との重複
8452 / 96378 (約9%)
0201login:Penguin
2010/05/30(日) 00:34:41ID:AWGjLpyv0202login:Penguin
2010/05/30(日) 01:00:44ID:ysTkCy8z0203login:Penguin
2010/05/30(日) 01:50:49ID:ctRryZlG付属辞書を全部置き換えるとか言われるとちょっと躊躇しちゃうなあ。
付属辞書が今後更新されたときどうすべきか悩む。
0204login:Penguin
2010/05/30(日) 02:06:32ID:SVG1hTFg0205login:Penguin
2010/05/30(日) 07:33:37ID:nCq3cr+oapply-mozcdic-ut.shが
#! /bin/sh
cat mozcdic-ut-*.txt edict-katakanago/mozcdic-ut-*.txt ../data/dictionary/dictionary1.txt > dictionary1.txt.new
cp -f dictionary1.txt.new ../data/dictionary/dictionary1.txt
になってるので、展開した ~/src/mozcdic-ut-20100530からみて、位置が異なるので、
../data/dictionaryの部分を../mozc/src/data/dictionaryのように書き換えてから実行するといいと思う。
0206login:Penguin
2010/05/30(日) 08:20:01ID:nCq3cr+oごめん、~/src/mozc/srcに展開すればいいだけの話だね。
0207login:Penguin
2010/05/30(日) 09:27:18ID:/q37kFvx0208login:Penguin
2010/05/30(日) 09:35:37ID:nCq3cr+oコマンド書いてあるだけだから、それもありだね。
0209login:Penguin
2010/05/30(日) 09:38:04ID:nCq3cr+o0210login:Penguin
2010/05/30(日) 10:50:29ID:YvZiFHSEGoogleの辞書っぽい
0211login:Penguin
2010/05/30(日) 17:07:00ID:72nIDqZ2最長一致とかの方式だと文節変えないと出ないとかあるけど、
mozcで出ない場合はむしろ基本単語に漏れや頻度データの間違いがあるだけな気がする。
特定熟語が頻出すぎてそれ以外の組み合わせの頻度が低いと、それが辞書から落ちて
変換できなくなってるケースがあるんじゃない?
0212login:Penguin
2010/05/30(日) 17:29:24ID:uJai2QSuちなみに、
$ /usr/lib/mozc/mozc_tool --mode=dictionary_tool
とコマンドで打てばあるので、辞書登録はできるっぽいです。
バーを出すにはなんかやる必要があるのでしょうか?
ちなみに、憩いの場さんのとこのリポジトリから9.10のをとりました。
0213login:Penguin
2010/05/30(日) 17:34:15ID:IJqAauuC「iBusの設定」の言語パネルの表示が表示しないになってるんじゃね
0214login:Penguin
2010/05/30(日) 17:38:32ID:ctRryZlG> ところで、間違いや重複でなければ、わざわざ単語を削る必要はないと思うんだけどどう思う?
もしかしてUTSUMIさんの私家版辞書のこと言ってるなら、もう削ってないよ。
0215login:Penguin
2010/05/30(日) 17:59:01ID:uJai2QSuiBusの設定のそれは「when active」になってます。
入力時のバーが
[mozc|あ|☆]
しか出てなくて、調べてみると本家は
[mozc|あ|@|☆]
と、@のところに、propertyやらdictionaryがあるみたいなんです。
0216login:Penguin
2010/05/30(日) 18:20:19ID:nCq3cr+o憩いの場氏の使ってるんだったら、前バージョンのは非公式なツールが悪さしてるんじゃないかな?
鍛えた辞書が勿体ないが、~/.mozcを消してみるといいのかも。
0217login:Penguin
2010/05/30(日) 18:24:09ID:/q37kFvx自前ビルドしてみると幸せになるかも。
0218login:Penguin
2010/05/30(日) 18:33:14ID:RB6LrfSr0219login:Penguin
2010/05/30(日) 19:12:32ID:uJai2QSu.mozcを消しでみましたがかわりませんでした。
>>217
ビルドはちょっと…
もう一つのパソがビルドでうまくごちゃごちゃになってしまったので、こっちは憩いの場さんに頼らせていだだいたというわけです。
0220login:Penguin
2010/05/30(日) 22:53:10ID:XBBIE1D1chromiumはBSDライセンス(3-clause)でubuntu ppaのCopyrightはChromium Authorsになってる。
ようしらんけどppaのはわざわざCopyrightをChromium Authorsにかえてるのかそうでないのか。
あるいはmozcもgoogle以外のコードが入った時点でCopyrightを変えるのか。
ま、わりとどうでもいいけど。
0221login:Penguin
2010/05/31(月) 03:17:09ID:OxheF7APバージョンは0.11.365.102となってる?
一度synapticでmozcとなのつくもの全てアンインストールして入れなおしてみたら?
0222login:Penguin
2010/05/31(月) 03:20:02ID:OxheF7APsudo apt-get remove mozc-server mozc-utils-gui ibus-mozc
sudo apt-get update
sudo apt-get install mozc-server mozc-utils-gui ibus-mozc
0223login:Penguin
2010/05/31(月) 03:27:36ID:u2z9heZ1もう面倒なのでこれでいれちゃうよ?
0224login:Penguin
2010/05/31(月) 07:43:28ID:XQ2ccCmp再インストールしても同じ。
0225login:Penguin
2010/05/31(月) 08:54:01ID:4NQTaTq8信用できないから自分でビルド
憩いの場のSawa氏のリポジトリも、Modified Anthyに変わるということで、
>勝手に変えるなバカヤロー、という人は使わないでください
と言ってるので自分でビルド
0226login:Penguin
2010/05/31(月) 11:17:54ID:7jMwOMF4担保される。
元ソースと差分も表示されるので、野良ビルドと比べて比較にならないほど安心できる。
0227login:Penguin
2010/05/31(月) 16:14:30ID:FTkWWhkFPPAも野良と同じだろ
PPAもその辺のユーザが作っていて、他のと変わりないと思うが?
まともにメンテされてないパッケージの多いこと多いこと
GPG署名が入ってれば改変されているか分かるし。
違いはdiffの提供ぐらいか
0228login:Penguin
2010/05/31(月) 16:38:48ID:wf2jYEJDpreeditテキストが表示されない
ほんまにテストしてリリースしてんのか?
0229login:Penguin
2010/05/31(月) 17:04:45ID:HeOjte/Kqt4関連入ってんの?
0230login:Penguin
2010/05/31(月) 18:38:45ID:1o5Z8GAqbuildにつかったlibibus-devのバージョンがmozcで使うibusのバージョンより
古いとpre editが表示されなかった
だからdebian sid(ibus 1.3.x)相当の環境でubuntu 10.04(ibus 1.2.x)でbuild
されたパッケージ使おうとするとそういうこと起こるかも
自分でbulidしてだめだったら分からんが
0231login:Penguin
2010/05/31(月) 21:18:42ID:Ol5eUFSTで、それと知らず使ってる人が誤解するのを危惧してる。
0232login:Penguin
2010/05/31(月) 21:20:46ID:Ol5eUFSTSF.netのフィードの配信遅すぎ。
0233login:Penguin
2010/05/31(月) 22:27:56ID:G2NqXecX候補選択ショートカット を A-Lにしても
候補表示窓では1-9になっちゃってるね。
実質A-Lは使えないみたい。
0234login:Penguin
2010/05/31(月) 23:53:43ID:HhhYtfRc昨日はいろいろと、mozc関連のファイル消したりしましたがダメでした。(もちろん0.11.365.102です)
>>229
qt関連は入っておりません。
mozcの設定に関して重要なのでしょうか?
texが使えないので10.04には当分のあいだ手を出せません…
0235login:Penguin
2010/05/31(月) 23:57:49ID:4NQTaTq8Sawa氏のやめて自分でビルドして入れろ。
0236login:Penguin
2010/06/01(火) 08:58:36ID:Khp/NcXq鯖というより、パッケージングしてる人かな?
パッケージングしてる人が複数いるようだけど、ばらばらにやるのではなくチームとしてやってくれるといいんだけど。
それまでは素性のわからんやつのPPAは躊躇する。
0237login:Penguin
2010/06/01(火) 09:22:43ID:Khp/NcXqブロガーの義務でもなんでもないのに、UTSUMI氏の辞書入りPPAを紹介して、UTSUMIに迷惑かけなきゃいいけど。
0238login:Penguin
2010/06/01(火) 09:24:13ID:Khp/NcXq最後の敬称が抜けてた。
UTUMIに迷惑かけなきゃ→UTSUMI氏に迷惑かけなきゃ
0239login:Penguin
2010/06/01(火) 12:43:06ID:4zExM02R自分でビルドするから楽しいんだろうが。
自分でやれ。
0240login:Penguin
2010/06/01(火) 12:53:30ID:XI8koRaqそこまで書くなら url書けよ。
0241login:Penguin
2010/06/01(火) 13:34:08ID:Khp/NcXqだから自分でビルドしてると言ってるじゃん。
>>240
書こうと思ったけど、ブログ主に迷惑掛かると思ったからやめた。
そのくらいggrks
0242login:Penguin
2010/06/01(火) 13:35:45ID:Khp/NcXq>>235もおれな。
0243login:Penguin
2010/06/01(火) 13:41:31ID:XI8koRaqだったら、ブログへの愚痴をここに書くなよ。
わけわからん。
0244login:Penguin
2010/06/01(火) 13:55:12ID:Khp/NcXq一般論として捉えればいいこと。
例えば、Sawa氏が、UTUMI氏の趣旨を理解して辞書を同梱したとして、ホームページにその旨を書いたとしても
それを紹介する第三者が、単にリンクとか手順だけ紹介したら意味はない。
これはたとえ話なので、はてなのブログの話はSawa氏のリポジトリのことではないが、趣旨はそういうこと。
0245login:Penguin
2010/06/01(火) 14:42:35ID:XI8koRaq? かなり自己中だとおもう。
0246login:Penguin
2010/06/01(火) 16:16:29ID:0n41Qhbrhttp://twitter.com/taku910/status/15075896507
通常どんなIMEでもデフォルト状態が一番性能が高いように設計されています。
はてな辞書などをデフォルトで有効にしていいものをしていないのは、
精度が下がるからです。
手元で実験していますが基本デフォルト状態が一番良くて
ユーザ辞書でもなんでも余計な物を突っ込むと精度が落ちます。
6:13 PM May 30th webから
ただ文章表現って多様だから、
とあるケースでの精度がいかに良くても、
ある人にとっては全体としてイマイチだったりすることもある。
「基本デフォルト状態が一番性能が高い」とはちょっと思い上がりかもなあ。
ちょっと前まで県名を変換できなかった完成度だし、
はてな辞書にしても、単純に全部足したら精度は落ちるけど、
選別したうえで必要なものを足せばそれなりに使える。
なによりGoogleの秘密版の辞書って余計なものの盛り合わせじゃね?
辞書は色々あっていいと思う。ハッカーにしてみればうぜーのかもしれないが。
ただ今はバグ出しとか必要なので、デフォルトで使ってみるのも大事。
ディストリ標準で非公式辞書を最初から埋め込むのはまだ早い。
メーリングリストで注意喚起したって見てるやつほとんどいねえしな。
アイコンがないのも現状の完成度を暗示してると思うので、
あえて足すことはない。
あ関係ないけどHideaki ABEさんmozc-configの開発お疲れ様でした。
公式版はQt依存めんどくせえのでちょろっと使わせていただくかもしれません。
ABEさん自身が使ってるのであればフリーズすることもないのでは。
それとGoogleのひとIssues報告放置しすぎ(出張中か?)
0247login:Penguin
2010/06/01(火) 16:23:50ID:Khp/NcXqは?なにが?
0248login:Penguin
2010/06/01(火) 16:31:12ID:XI8koRaq辞書の育成はセンスもあるからな。
作者が最適化している辞書だとしても
それより優れたものは現れるかもしれない。チューニングする人しだいだね。
ま、遺伝的アルゴリズムみたいなもんだからね。
良いセンスの人がチューニングした辞書がオープンソースとして公開されたら
たすかるからね。
0249login:Penguin
2010/06/01(火) 16:34:29ID:Khp/NcXqID:XI8koRaqみたいなアホが知らずにgoogleとは違う辞書を使ってフィードバックするようなことがあれば、迷惑な話。
0250login:Penguin
2010/06/01(火) 17:17:22ID:X3cZthyjそもそもデフォルト状態って、大規模コーパス版のことだろ。
エンジンの設計が同じならIPADic使ってる時点で性能落ちてるんじゃないか?
そこから追加した微妙な部分が付属辞書にあってそれが肝だってことなら、
どういう方針で調整がなされたのか誰か差分取って調べてくれないかな?
ユーザー辞書は登録時に頻度情報が入れられないので変換精度が落ちるに決まってるじゃん
組み込み追加辞書の場合は頻度情報入ってるから全然違うと思うけど。
しかしその頻度情報の精度というのが母集団、つまりコーパスデータによるから
まんべんなく集めてるグーグルより桁が落ちるかもとか、統計学的にデータまぜるなきけん、
って話なだけでしょ。
結局、GPSのわざと下げられている精度をどうやって向上させるかみたいな話なんだから、
中の人なら否定するに決まってる。
0251login:Penguin
2010/06/01(火) 17:19:24ID:+xUAPRzh戦時に精度低下があれば補正値知ってると良いかもしれないけど
0252login:Penguin
2010/06/01(火) 17:22:17ID:6lXEiumK0253login:Penguin
2010/06/01(火) 17:39:27ID:XI8koRaq粘着お断りです。ごめんね。
0254login:Penguin
2010/06/01(火) 18:15:44ID:Khp/NcXq0255login:Penguin
2010/06/01(火) 18:28:50ID:0n41Qhbr> そもそもデフォルト状態って、大規模コーパス版のことだろ。
そうなのかな?
Google辞書だったら開発者が意図しようがしまいが、
「はてな辞書」の語彙は収集されて有効になってると思う。
まあ直接聞かないと分からんが
0256login:Penguin
2010/06/01(火) 18:29:31ID:0n41Qhbr0257login:Penguin
2010/06/01(火) 18:55:15ID:X3cZthyj追加単語そのものより、漏れが出る事が問題な気がする。
>>252とかもそうでしょ。
0258login:Penguin
2010/06/01(火) 19:24:49ID:XI8koRaq英英辞典とか そのへんの言葉が漏れてたりもするし、
いまはこまめに辞書を育てるしかないなぁ。とはおもってるよ。
それでもanthyよりは使い易いけど、
0259login:Penguin
2010/06/01(火) 19:40:59ID:iRw/MYCqいちいちめんどくさいよね。
「はりつけて」で「貼り付けて」がでない。
0260login:Penguin
2010/06/01(火) 19:47:12ID:biQ6ox7/0261login:Penguin
2010/06/01(火) 19:53:01ID:iRw/MYCqそんなこと言い出したら何でもそうじゃん。
UTSUMIさんの名詞辞書をもってしても「ポルチオ」がないのはしょうがないかなとは思うが。
0262login:Penguin
2010/06/01(火) 20:01:56ID:biQ6ox7/0263login:Penguin
2010/06/01(火) 20:26:01ID:2EYeyyHjあれがないと話にならん
0264login:Penguin
2010/06/02(水) 00:05:59ID:qoQj5wV4誰か!
0265login:Penguin
2010/06/02(水) 01:29:17ID:HiSOFHLtそういう話を当のブログにコメントで書いてあげたら?
URL 書けないならそれができるのは君しかいないんだから。
0266login:Penguin
2010/06/02(水) 01:40:28ID:408ZUOE4っていうか>>200のツール教えて欲しいな。
0267200
2010/06/02(水) 02:05:04ID:w3pItDF+辞書ファイルの読みと漢字だけを sed で抽出して sort -u したものを、
sort -m して uniq -d して wc -l しただけ。だったはず。
ていうか、細かいこともうすっかり忘れてて愕然としている俺がいる。
0268login:Penguin
2010/06/02(水) 02:33:17ID:nCOjwefRGoogle日本語入力、ATOKやことえり辞書のインポートに対応
http://internet.watch.impress.co.jp/docs/news/20100319_355796.html
Google IME/Mozcのユーザ辞書は同じ形式のはずだから、
Windowsで何とかインポートしてLinuxに持っていけば使えるはず。
LSD(なんつう名前だ)はMS-IMEシステム辞書形式だから、
バイナリエディタでいじらないとインポートできないかもな。
>>266
meisiは0601では重複ないはず。
jinmeiは重複チェックしてないはず。
同じのをModified Anthyでも使ってるから。
の割には重複少ないな。
まあ収録数多いから比率的に小さくなるか。
> SKKのスモール辞書辺りの単語は網羅されているのか比較
くだらねー。
それに単に網羅したって意味ないよ。
要らない単語削って頻度指定して…とやらないとな。
ためしにユーザ辞書として一律にインポートしてみれば。
しかしこんな「要望」によく応えたもんだよ。「当然のこと」とか「絶対対応するべき!」とか。
日本のLinuxユーザのレベルを示したスレ↓。
> Linuxユーザーにこそ必要なものです。
http://www.google.com/support/forum/p/ime/thread?tid=4d9cb7b1ce293ed1&hl=ja
> Linuxユーザは共同でプロジェクトをより良いモノに完成させたい意識は
> マックやWindowsのユーザよりも高く、
経験的にはWindowsユーザのほうが人数多いぶん反響あるし、
より良くしたいという人も多いんじゃねえかなー
0269login:Penguin
2010/06/02(水) 03:07:20ID:HDGBUJC9そりゃ単純に母数が大きいだけじゃないか?
Linuxは開発コミュニティへの貢献意識が強いユーザが多いというより
そういう人間しかLinuxを使ってないという側面がある
0270login:Penguin
2010/06/02(水) 03:26:40ID:fMpvOFIK> そういう人間しかLinuxを使ってないという側面がある
それはないわ
0271login:Penguin
2010/06/02(水) 03:32:32ID:7kI2YFS9LSDは確かことえり形式の辞書がダウンロードできたはず。
ちなみに名前はあえてそういうのを狙ったんだとさ。
0272login:Penguin
2010/06/02(水) 06:43:02ID:02i5Uj0Jコメントしましたがなにか?
きみに言われる筋合いはない。
0273login:Penguin
2010/06/02(水) 06:46:10ID:02i5Uj0Jで、Google側は辞書の提供はなく、ユーザ側は辞書よこせだったわけだw
もうアホかと。
0274login:Penguin
2010/06/02(水) 07:10:05ID:5crcoY3W> しかしこんな「要望」によく応えたもんだよ。…
そりゃ 戦略上のことをいうとgoogleって自社osつくるんだし
日本での普及を考えたらimeは無視できないのは当然かと。
web tvがどんなことになるのかわからないけど、こっちでも
重要な役割でしょうしね。
また、脱msのものを普及させようと思ったらこの辺の周辺のことって
無視できないからね。
だから、答えたとしても利益があるんだろうね。
まるでウインドウズユーザーのような連中の声って、その辺を
機敏に感じるにはよいのかもね。
ないものは作れという思想のもとでlinuxを利用しているものから見れば
苦笑いの連中だけど、それだけ昔よりは普及してきているという証でも
あるんだろうね。彼らを蔑んでみるのはわからんでもないけどね。
0275login:Penguin
2010/06/02(水) 10:03:44ID:HiSOFHLtならいいけど。
「なにか」とか言われても URL わからないから
コメントしたかどうかおれにはわからなかったよ。
0276login:Penguin
2010/06/02(水) 14:43:48ID:SuZRONSuhttp://linux.ikoinoba.net/index.php?UID=1275323887
のことを言っているのか
ここの「またまた帰ってきた某所の匿名」と「ID:Khp/NcXq」は同一人物だろう
「某はてなのブログ」がどこかはわからなかった
0277login:Penguin
2010/06/02(水) 15:02:37ID:02i5Uj0J某はてなはそこではない。
0278login:Penguin
2010/06/02(水) 15:40:49ID:SVlKWBuX0279login:Penguin
2010/06/02(水) 15:44:09ID:HiSOFHLt禁止はしてないでしょ。
0280login:Penguin
2010/06/02(水) 16:32:49ID:SVlKWBuXこれで配布したら
作者の気持ちを考えないなんてサイテー
と喚く馬鹿が大量発生する
0281login:Penguin
2010/06/02(水) 16:51:06ID:KEng9W8y0282login:Penguin
2010/06/02(水) 16:57:43ID:5crcoY3Wあまり褒められたものではないとは思うよ。
ありとかなしじゃなくて記述しているかしてないかだけが意味するのにね。
ライセンスってそうゆうもんだって理解してたんだが。
鬼車のrubyマージ騒動みたいになっちゃうよ。
0283login:Penguin
2010/06/02(水) 17:00:56ID:1sMEC1wh自身の著作物にコメントするのは何も問題ない
0284login:Penguin
2010/06/02(水) 17:04:19ID:5crcoY3Wうん。そこをトラブルしないために、自分の著作物に新たなライセンスを加えて
しまえばいいというのは当然だとおもうよ。加えないのに別のお願いをする場合
そのライセンスと矛盾するならば当然作者に問題があるし、矛盾しないならば
なんのトラブルもならないだろう。
0285login:Penguin
2010/06/02(水) 17:19:02ID:QoktT3oRGoogle曰く「Mozcのバイナリ配布は避けてください」
0286login:Penguin
2010/06/02(水) 17:22:49ID:02i5Uj0J0287login:Penguin
2010/06/02(水) 17:40:27ID:nCOjwefRソースパッケージに突っ込むのは勝手だけど、
有効にするのは各自でビルドオプション付けてねってことでしょ。
「意識的に」各自でやってもらわないと、
Googleにワケの分からないことを報告するバカが大量発生するから。
何よりも今は開発初期段階だから、デフォルト状態での報告が欲しい。
Googleにしてみればこう。
ユーザ「Mozc最高だぜ」
Google「(うんうん)」
ユーザ「人名xxxxもアレな名詞xxxxも出てくるぜ」
Google「(ん???)」
Google発表「基本的にはデフォルトで使うのが一番精度が高いのであります」
それに非公式辞書追加を知らずして
「Googleさん辞書追加ありがとー!!」とか言われても、
Googleも辞書作者も甲斐がないだろ?
>>278
debianだと2ch辞書を選択制にしたりとか、
gentooだとmplayerとか?のビルドオプション選ばせたりとか。
「各自で意識的に選んでね」というのはよくある方式よ。
文句あるなら選択ダイアログ出せばいいじゃん。
辞書がアドオン形式ならパッケージ名で明確に分割できるけど、
Mozcは全部一体だからしょうがない。
バイナリ禁止自体は昔LAMEで見たような気がする
0288login:Penguin
2010/06/02(水) 17:51:17ID:02i5Uj0JAnthyよりmozcの方が変換精度が高いとか言ってるやつらはみんなそれだよな。
同じ辞書を追加した状態でのAnthyとmozcは大差ないだろ。
0289login:Penguin
2010/06/02(水) 18:01:18ID:grruSKdq今回の問題とは若干違うような。
>「意識的に」各自でやってもらわないと、
>Googleにワケの分からないことを報告するバカが大量発生するから。
>何よりも今は開発初期段階だから、デフォルト状態での報告が欲しい。
これはほぼ同意。
0290login:Penguin
2010/06/02(水) 18:02:11ID:nCOjwefR非公式版であることをハッキリさせたいのであれば、
デフォルトのバイナリパッケージ+差分パッチぐらいか?
パッチで非公式バイナリを意識的に「再現」させるという形。
しかし自分好みにしたいんだったら自分でビルドくらいは当たり前じゃねえの?
それに辞書作者の意向つうかMozcプロジェクトの現状レベル考えたら、
今はデフォルト状態でテストしたほうがいい。
原作者が「余計な辞書入れたら精度下がる」つってんだしさ
0291login:Penguin
2010/06/02(水) 18:50:57ID:9TUUxqr00292login:Penguin
2010/06/02(水) 19:06:18ID:/GEmtGf2辞書作者もそう思ってるだろうが、
それならなんでバイナリ配布OKのライセンスで配布するのか分からない
0293login:Penguin
2010/06/02(水) 19:26:14ID:O5aiTgdT聞き分けのいい人じゃなくてタコ以外使うわけないだろ。
特にubuntuなんでデフォルトで対応しているのに、作っておきながら
組み込んでますなんて意味不明だ。
しかも、バグ報告は送るなといってるけど、じゃあ誰に送るんだ?
お前が引き受けろよ、そうでなければ公開すべきじゃない。
0294login:Penguin
2010/06/02(水) 19:29:49ID:1sMEC1whもとはModifiedAnthy向けに公開されていた辞書だから
Mozc用に改めてライセンスをいじっても仕方ない
0295login:Penguin
2010/06/02(水) 19:37:51ID:CGmWTyeQ誰に言っているのか知らないが、俺のubuntuで
apt-get install ibus-mozc
とやってもインストールできない。本当にデフォルトで対応してるの?
0296login:Penguin
2010/06/02(水) 19:44:23ID:x5YErinu日本語が不自由な人のような
0297login:Penguin
2010/06/02(水) 20:00:24ID:OEd5PW/Nすまん、意味不明すぎて何をいってるのかさっぱりわからん。
0298login:Penguin
2010/06/02(水) 20:00:48ID:9DErp56YCurrently, we only support Ubuntu 9.10 and 10.04 for building Mozc.
http://code.google.com/p/mozc/wiki/LinuxBuildInstructions
0299login:Penguin
2010/06/02(水) 20:02:49ID:t70gHhyqリポジトリは加えなくてはダメ
加えても性能のいいModifiedAnthyは使うなといわれた
初心者にはibus-mozicの魅力が薄れた
いまここ
0300login:Penguin
2010/06/02(水) 20:04:18ID:L1cbISCc0301login:Penguin
2010/06/02(水) 20:07:31ID:w3pItDF+0302login:Penguin
2010/06/02(水) 20:08:54ID:fe2DcE2M0303login:Penguin
2010/06/02(水) 20:17:47ID:RpWCZxYd0304login:Penguin
2010/06/02(水) 20:41:06ID:HiSOFHLtそんな話どこで読んだの?
0305login:Penguin
2010/06/02(水) 20:48:51ID:408ZUOE4ども、UNIX的手法だったんですね。全然身についてないなあこういう即席データ処理。
>>268
>> SKKのスモール辞書辺りの単語は網羅されているのか比較
>くだらねー。
>それに単に網羅したって意味ないよ。
>要らない単語削って頻度指定して…とやらないとな。
>ためしにユーザ辞書として一律にインポートしてみれば。
なにが言いたいのかさっぱりです。
デフォルト辞書で網羅してたら辞書インポートする必要無いのでは?
その場合の追加辞書という意味では、まあ確かに意味が無いですが、
判断の為の辞書内容の分析が下らないというのは意味不明です。
抜けている単語を抽出して、それが本当に変換出来ないのか確認してみるのは、
やみくもに探したり、ひたすらバグ報告を待つより早いのでは?
0306login:Penguin
2010/06/02(水) 21:22:35ID:408ZUOE4そもそも、純正版と改造版を共存できるようにしたほうがわかり易いんじゃないですかね?
ビルドしない人にとっては意識できないままで、単純に退化したとしか思わないでしょうし。
0307login:Penguin
2010/06/02(水) 21:31:19ID:RpWCZxYdあー、ごめん、VJE使ってるのはYahoo!の方だったわ。
0308login:Penguin
2010/06/02(水) 21:35:29ID:408ZUOE40309login:Penguin
2010/06/02(水) 21:58:00ID:nCOjwefRだからさ、やってみりゃいいじゃん。
S辞書とMozcデフォルト辞書の差分だろ?
SKK辞書は動詞の形式が特殊だから、
単純に比較できるのは名詞系だけかもな。
> デフォルト辞書で網羅してたら辞書インポートする必要無いのでは?
網羅してるかどうか分からんのでしょ?
試しにやってみて動作を確認すればと言ったわけよ。
Mozcのユーザ辞書のシステム辞書に対する優先度は知らないんだけど、
「漏れてる」と判断された短い単語がたくさんあれば、
おかしな変換結果が大量に発生して、
単純差分じゃ意味がないことがすぐに分かると思ったから。
実際どうなるかは俺も知らん。
Mozcのデフォルト辞書は長年編集されてきて収録数も膨大なIPAdicでしょ?
> SKKのスモール辞書辺りの単語は網羅されているのか比較
こんな発想おれにはないよ。「スモール」辞書と比較?
バカだなあ、と思いつつも、
>>305が意外な発見をして本家に有益な貢献をするのかもなあ
0310login:Penguin
2010/06/02(水) 22:35:24ID:nCOjwefRとりあえずやってみた。
雑にやったものだからソースとかは出さねえよ。
確認したのは「存在しない表記」だけな。読みは無視。
SKK-Sには重複除いて4581の表記がある。
このうち単漢字・アルファベット・記号以外で
Mozcデフォルト辞書に入っていないのは次の通り。
仮名漢字変換
全角仮名
半角仮名
半角片仮名
日帰
最寄
相変
見掛
見落
記事選択
以上。
単漢字は自分で探してくれ。
記事選択とかは分けて変換できると思うので、
全部網羅されてると言っていい。
じゃあな
0311login:Penguin
2010/06/02(水) 22:41:13ID:408ZUOE4詳しいやり方がわかりませんので、簡単にできるなら是非どうぞ。
とりあえず茶筅やメカブの辞書をgrepして眺めているだけですが、
IPAdicはあくまで形態素のコーパスで、熟語は音声処理用かなんかの逆変換で使いにくい
短い単語とかは結構足りないんじゃないかって気がします。
例えば宮城県で探しても大学の名前しかでてこなくて県名単体すら入ってない。
Mozcの辞書も傾向は似ていますが、unicodeな単語とかも入ってて
多少改善してる感じは気のせいでしょうか?
0312login:Penguin
2010/06/02(水) 23:00:23ID:408ZUOE4>>310
どうもです。とりあえず予想通りって事ですよね。
単漢字の漏れというのはどうなんですかね?
まあ扱いは難しそうですが。
0313login:Penguin
2010/06/03(木) 00:50:31ID:0C19uf7wなにがしたいのか意味が分からないのだけど
「宮城」「県」が入っていれば
「宮城県」は変換できる。
というか、個々のパーツで変換できるならそれを辞書に登録しておく意味はない。
ディスクの無駄だし。
短い単位で解析できるように、というのが UniDic。
自分でクロールしてきたデータに UniDic の MeCab をかけてコーパス作ればいいんじゃないかな
0314login:Penguin
2010/06/03(木) 00:59:29ID:wmng9tJYそもそも大規模コーパスというのはそういう方針とは思えませんが?
パーツの頻度を掛け算した予測頻度を実際の頻度が上回るのであれば登録するべきでしょう。
0315login:Penguin
2010/06/03(木) 09:15:19ID:1uwN98gG私家版辞書追加して、さすがGoogleって言ってる馬鹿約2名発見しますた。
0316login:Penguin
2010/06/03(木) 09:29:34ID:1uwN98gGそれとも午後の紅茶と打って、の紅茶を削るか?w
もうアホかと。
0317login:Penguin
2010/06/03(木) 10:29:33ID:cLHYQIlMつきはWakame(ワカメ)だな
0318login:Penguin
2010/06/03(木) 11:03:56ID:yHIg/azl0319login:Penguin
2010/06/03(木) 11:43:56ID:8rrDcIso0320login:Penguin
2010/06/03(木) 12:20:21ID:r9B8lAgG0321login:Penguin
2010/06/03(木) 12:38:19ID:dyOLzhIN0322login:Penguin
2010/06/03(木) 13:37:11ID:u1itOj+Lhttp://code.google.com/p/macuim/source/browse/trunk/Mozc/build
0323login:Penguin
2010/06/03(木) 14:11:44ID:zicLG5/cmozcの辞書はどこに置いてあって
どうやってplaintextに変換できるわけ?
0324login:Penguin
2010/06/03(木) 15:01:06ID:bG0s/qhN0325login:Penguin
2010/06/03(木) 15:07:37ID:0C19uf7wそうか? 「宮城県」は「宮城」と「県」であって、
「宮城(固有名詞)」の左に来る品詞と「県(接尾辞)」の右に来る品詞は違うのに、
登録してしまうと区別できなくなってしまう。
連接コストまで考えると単語の頻度だけで簡単に決まるものではないので、
なんでもかんでも登録するとむしろ精度悪化することもあるんじゃないかなあ。
(くっつけても品詞が変わらないものはくっつけたものを登録してもいいと思うが)
0326login:Penguin
2010/06/03(木) 16:11:34ID:uFbeO/duUbuntuで使ってるけど、はじめからあるAnthyよりはMozcの方がよさげだけど
0327login:Penguin
2010/06/03(木) 16:30:35ID:AE+ltDI6anthyは開発停止してたんじゃなかったっけ?
mozcは開発公開が始まったばかり。
かなり初期の段階だから、開発協力者だけにしたい状態じゃないかな。
だから、辞書のバイナリうんぬんの話もでる。
stableちかくまで普通は待ったほうがいいだろうね。それでもanthyよりmozcの
ほうがいいように思う。
0328login:Penguin
2010/06/03(木) 16:50:09ID:8XZFMkrD> anthyは開発停止してたんじゃなかったっけ?
再開したよ。
http://sourceforge.jp/projects/anthy/lists/archive/dev/2010-May/003705.html
0329login:Penguin
2010/06/03(木) 17:30:21ID:xiIjB+Inanthyは親指シフトに対応している
0330login:Penguin
2010/06/03(木) 18:24:16ID:u1itOj+L文章で変換すれば違いは一目瞭然。
0331login:Penguin
2010/06/03(木) 18:26:44ID:wmng9tJY県の後ろにつながるの品詞と、宮城県の後ろにつながる品詞は大差ない。
つまり語頭と語尾の文脈IDを継承すれば済む話。
0332login:Penguin
2010/06/03(木) 18:28:03ID:wmng9tJY0333login:Penguin
2010/06/03(木) 19:31:44ID:HrnMknGo筋がいいのはMozcだけど、
IPAdicのせいか文章を細かく区切りすぎるような感じはしてる。
「ご|ご」とか「する|シ」みたいな感じで。
ある程度の長さを入力すれば改善するけど、
やっぱりちょっと細かい感じはするな。
語尾とか複合語の切り方がおかしくなるときがある。
Anthyだとdepgraphだったか語のつながりをある程度まとめてくれるので、
「細かい」って感じはしない。
複合語もcompound.tか何かに大量登録されてるしな。
IPAdicは文章を単語に分割するツールでも使われてるんだっけ。
短い単語に比重がかかりすぎな感じがちょっとする。
複合語を大量追加+短い単語の優先度をちょっと下げる、
くらいの調整はいるかもね。
ちょっと使った感想なんで勘違いかもしれん
0334login:Penguin
2010/06/03(木) 19:59:43ID:AE+ltDI6そうだなぁ。検索するときには文章をキーワードにすることはないから、
検索屋さんが作ってるだけに、切り替えみたいなのは欲しいかも。
ibusのプラグインでSKK一発切り替えがあればなぁ。と変態的に思ってる。
mozcの一番良い使い方はおおよそ感じ取れるようになったけど、
やっぱり文節ごとに変換させるのはあまり良くなさそうだな。
0335login:Penguin
2010/06/03(木) 20:00:21ID:eXkP2joF0336login:Penguin
2010/06/03(木) 20:56:17ID:0C19uf7wあなた中国出身? (煽りじゃなくてね)
後ろにつながる品詞は同じだが、
県の前に接続する品詞と、宮城の前に接続する品詞が違うという話。
「宮城県に出張に行った」は言うけど「県に出張に行った」は言わないでしょ?
あと、確かに左文脈と右文脈は別々に定義できるようになっているけど、
実際の辞書は左文脈ID=右文脈IDなので、やっぱり区別できないと思うよ。
0337login:Penguin
2010/06/03(木) 21:44:04ID:PxaC1S8F0338login:Penguin
2010/06/03(木) 21:52:20ID:pPPT4Ls/0339login:Penguin
2010/06/03(木) 22:26:56ID:wmng9tJY宮城県に
県に
言うでしょ。
0340login:Penguin
2010/06/03(木) 23:00:05ID:wmng9tJYそれとも、変換エンジンが無視しているって話?
0341login:Penguin
2010/06/04(金) 01:57:57ID:ZO43vMX/これは酷い
http://mozc.googlecode.com/svn/trunk/src/data/dictionary/suggestion_filter.txt
0342login:Penguin
2010/06/04(金) 02:06:05ID:kzCJPyMQ0343login:Penguin
2010/06/04(金) 02:14:04ID:ZO43vMX/mozcってLinuxだけだよね?
Windows用のプログラムも混じってない?
0344login:Penguin
2010/06/04(金) 04:21:19ID:4TzFfVhZ0345login:Penguin
2010/06/04(金) 06:17:40ID:mBX7YmR00346login:Penguin
2010/06/04(金) 10:04:52ID:NpMgVDdo0347login:Penguin
2010/06/04(金) 11:01:45ID:sE1oayZo0348login:Penguin
2010/06/04(金) 13:00:07ID:mBX7YmR0>>345
0349login:Penguin
2010/06/04(金) 17:15:10ID:YpJdVChbmozc/ipc/win32_ipc.ccだと名前付きパイプ(CreateNamedPipe)使っているけど、
ローカルソケット(socket AF_UNIX)をwindowsでそのまま使わなかった理由はなんなのだろう。
0350login:Penguin
2010/06/04(金) 19:08:43ID:YpJdVChb1.IPスタック
WindowsのAF_UNIXソケットはIPスタックを回避できない
2.セキュリティ上の問題
WindowsのgetsocketoptはSO_PEERCREDが使えないため、
アクセス元の情報を取得出来ない
これを避けるには名前付きパイプを使えばいいのか...な...たぶん
0351login:Penguin
2010/06/04(金) 19:38:47ID:2qDpkCoq0352login:Penguin
2010/06/04(金) 19:46:47ID:ov5hWS+Q藻屑はインストール出来て設定まで出来ているのに・・・・・ @SUSE
0353login:Penguin
2010/06/04(金) 20:06:23ID:QQcLRn+n0354login:Penguin
2010/06/04(金) 22:07:20ID:kzCJPyMQ0355login:Penguin
2010/06/05(土) 02:12:01ID:lBoLIUKF0356login:Penguin
2010/06/05(土) 06:19:24ID:D5PsWP6Umozcの辞書がいいのではなく、UTUMIさんの辞書がいいだけ。
それを勘違いしてGoogleってスゲーって言ってるバカが、変換効率がいいとかいってるだけの話。
0357login:Penguin
2010/06/05(土) 06:49:54ID:xabQhbJdmozc使う人は素のmozcの能力を見極めて
改良に努めるべき。
0358login:Penguin
2010/06/05(土) 08:30:41ID:g/NHqkpUしつこいなanthy君w
0359login:Penguin
2010/06/05(土) 09:10:15ID:r9Lhvdmg「べっさつ」と入力して方向キーの↓を押し続けると、
別冊すてき
別冊家庭画
別冊花
別冊すてきな奥さん、家庭画報、花とゆめ、が途中で切れたのかな。
べびーざら 2239 2318 6181 ベビーザら
「ベビーザらス」だな。
未知語の自動収集精度が良くないのかもなあ。
いや全体的にはそこそこの精度なのかもしれないが、
ノーチェックで収録してしまう感覚がまずいのかも。
わかりやすいのは「ん」ではじまるやつ。
ンコ気持、ンコさん、ンコたち、ンコちゃん、ンバーワン、ンピングカー、
ンブラー、ンプ場...
全くチェックしてないんだろうなあ。
きちんとしたIPAdic+雑な自動収集語という感じ。
頻度設定も怪しいところが。
「ふくらはぎ」と入力すると「フクラハギ」が第一候補。
よく使われるのは平仮名表記のはず。
何度か話でてると思うけど、短い文節だと極端に精度下がるのも気になる。
(入力終えて部分修正するときに、目的の表現がなかなか出てこないことがある)
「云い始めた」が第一候補になったり。
「そんな事を言い始めた」だと「言い始めた」になるんだが。
0360login:Penguin
2010/06/05(土) 09:19:22ID:fhMYXk7C0361login:Penguin
2010/06/05(土) 09:29:33ID:r9Lhvdmgわーほりいぎりす 2239 2239 8157 ワーホリイギリス
ーとくん 2239 2319 6228 ートくん
ーままさん 2239 2319 7097 ーママさん
ヾの 2239 2239 8280 ヾノ
ぇんと 2239 243 7023 ヴェンと
いきちやん 2303 2303 8986 益暢
けんてんのう 2303 2239 7136 謙天皇
(孝謙天皇?)
このごろろ 2290 2239 7931 このごろろ
こんじょうてんのう 2239 2239 7590 今上天皇
(きんじょう)
こんすか 2979 2239 7552 今スカ
こんすたじお 2979 2239 7788 今スタジオ
こんすたっふ 2979 2239 7540 今スタッフ
こんすとれす 2979 2239 7788 今ストレス
こんすぽーつ 2979 2239 7626 今スポーツ
こんすーぱー 2979 2239 7227 今スーパー
こんせいかつ 2979 2234 7293 今生活
こんせいふ 2979 2239 7841 今政府
こんせいり 2979 2234 7849 今整理
こんせいり 2979 2239 7392 今生理
こんせけん 2979 2239 6929 今世間
こんせっけい 2979 2234 7924 今設計
こんせっと 2979 2239 7746 今セット
こんせつめい 2979 2234 7180 今説明
こんせぶん 2979 2301 6735 今セブン
適切な表現も混じってるかもしれないが、収録するほどでもないだろと
0362login:Penguin
2010/06/05(土) 09:38:44ID:r9Lhvdmgまあなあ。
Google IMEの辞書ぐらい質を量で押し切ればいいんだろうけど、
現状だと中途半端な感じ
0363login:Penguin
2010/06/05(土) 10:12:08ID:D5PsWP6Uしつこいな変換精度くんw
辞書以外のところでmozcがどう変換精度が優れてるのか説明してみろ
0364login:Penguin
2010/06/05(土) 10:38:19ID:FvoE5wGr0365login:Penguin
2010/06/05(土) 10:43:36ID:GieRvdIi0366login:Penguin
2010/06/05(土) 11:44:27ID:r9Lhvdmg{こうたろう/ひろたろう} 2303 2303 5867 廣太郎
あとゴミっぽい収録語の続き
ヶせっと 2239 2239 8037 ヶセット
ヶらヶら 2239 2239 7784 ヶラヶラ
ぁでふぉるまにあこれくしょん 2239 2239 8118 ぁでふぉるまにあこれくしょん
んたーねっと 2239 2239 8085 ンターネット
んでぃーず 2239 2239 8230 ンディーズ
んぷさいと 2239 2239 8410 ンプサイト
んぷふぁいやー 2239 2239 8385 ンプファイヤー
んらんど 2310 2310 5391 ンランド
中黒付きの未知語は取れない?
ばらくおばま 2239 2239 7916 バラクオバマ
バラク・オバマ無し
変わった読みかたのチェックが甘い?
ばり 2239 2239 6859 尿
どこかで出てたご変換(「誤変換」が出ないし「誤」もなかなか出ない)
あいぱっど iPod
「がい 買い」も出にくい。「臥位」よりも後。
「あと 後」の優先度も低いなあ。
「よりも|あと」だと7番目。
「あと」単体でも「跡」より下になる。
0367login:Penguin
2010/06/05(土) 12:26:17ID:R3XOmDMPイって打ったあと、ンターネットって打ったりする人のために・・
0368login:Penguin
2010/06/05(土) 12:44:57ID:D5PsWP6U結局変換精度の説明は出来ないってことですね?w
0369login:Penguin
2010/06/05(土) 13:27:13ID:r9Lhvdmg「ち 日」出るのが早すぎ。そもそも必要?
「こ 子」なかなか出ない。
「だん 男」なかなか出ない。
「くん 組ん」出るのが早すぎ。「君」「くん」を優先。
「じん 腎」出るのが早すぎ。「人」を優先。
「かみ 上」最優先にするものではないと思う。「紙」「神」を優先。
「せい 生」全然出てこない。かなり下にある。
「とう 頭/冬/島など」なかなか出てこない。
「かい 回」なかなか出ない。
「きょう 強」なかなか出ない。
「じ 時」なかなか出ない。
「さる 申」「猿」を優先。
「そよぐ」普通に変換すると「そよぐ」になるが、
「戦ぐ」が第一にサジェストされるのはなぜ?
こういうケース結構ある。
「たんさん 単三」候補がない。
0370login:Penguin
2010/06/05(土) 14:58:33ID:7VLh6t0eそんなこと言ってると、mozcの変換精度が他と比べてたいしたことないってこと
説明してよと言いたくなるじゃないか。
0371login:Penguin
2010/06/05(土) 15:17:11ID:R3XOmDMP0372login:Penguin
2010/06/05(土) 16:19:04ID:SieYDk6Z0373login:Penguin
2010/06/05(土) 16:32:36ID:ZADDM2Q0ゴミとか言ってる奴は変換辞書を国語辞典かなにかと勘違いしてるんじゃないの?
基本的には自動収集で大は小を兼ねるって思想だよな、元々の辞書に比べて足りない方が問題。
ケチくさい奴は他の変換使ってればいいよ。
検索屋の発想だから、悪影響のあるゴミはルールで排除って感じでしょ?
結局そこんとこがグーグルの肝なのでフリーになってない訳で。
0374login:Penguin
2010/06/05(土) 17:21:43ID:rTZo1uGy「こせっと」「けらけら」の読みで変換できるといいね
ところで、「か」「が」「こ」で「ヶ」が出ない
0375login:Penguin
2010/06/05(土) 17:44:16ID:D5PsWP6U変換精度云々言い出したのは、Googleとmozcをマンセーしてるやつの方。
一般的には選択肢が増えた程度の認識しかない。
0376login:Penguin
2010/06/05(土) 18:00:55ID:r9Lhvdmg>>362 >>359
>>374
> ヶセットは〜個セット
そうだな。
しかし「けせっと」だと「毛セット」、
「こせっと」だと「小セット」になって、
「ヶセット」が出ない。
sannxkesetto、とかじゃないと出ないな。
Google IMEの辞書から秘密情報を取り除いて、
低頻度の表現をバッサリ削ったもののほうが、
精度としては良くなる気がする。
0377login:Penguin
2010/06/05(土) 18:13:22ID:r9Lhvdmgこれだけ早く設定ツール出すんだったら、
mozc-configの人もCUIまででやめてたんじゃないかな。
(止めてたんじゃないかな、が出ない。)
辞書をチェックするにしてもツール作るにしても
ムダデマ(無駄手間、が出ない)になる恐れがある。
あとで嫌な思いしないように(ように、の順位低い)、
眺める程度のことしかできない。
変換確認にしたって辞書がゴソッと変わったらイチからやり直しだもんな。
0378login:Penguin
2010/06/05(土) 18:31:21ID:ZADDM2Q0取り除いたら出なくなって駄目駄目だろ。
品詞別にフィルタでも掛けてたんじゃないの?
0379login:Penguin
2010/06/05(土) 18:42:40ID:ZADDM2Q0むしろ、最新研究てんこ盛りの筈のanthyの結果が振るわないのがおかしいんだよ。
辞書に関してはmozcに流用しただけで評価されているのだから問題は無さそうなのに。
0380login:Penguin
2010/06/05(土) 19:12:30ID:ZADDM2Q0選択肢を増やすことを、無駄手間と考えてしまうエコノミックアニマルこそ開発にとって問題なのかもしれない。
例えばGCCがあったからこそ他の開発ツールが対抗して無償化したりした訳で、それと同じだと考えればいい。
大体そんなこと言ってたら、gtkだのqtとかこそ無駄手間でバカバカしい。
0381login:Penguin
2010/06/05(土) 19:58:50ID:r9Lhvdmgそんなやつが痛な (いたな)
冷静な自分が板 (いた)
やっぱ人名弱いな。
損|正義
やっぱ中黒なしだけか。
ジョニーデップ
現時点での感想。
・ある程度の長さを入力した時の第一表記は筋がいい。
・しかしよくある第二表記を選ぼうとするとなかなか見つからないことがある。
・短い読み入力だと精度がぐっと落ちる。
・特に単漢字に関しては頻出語がなかなか出てこなかったり、
頻出語に変な読みを当てたものが上位に来たり。
(人がチェックしていないのでしかたない)
ちょっとずつ変換する人や、
推敲して部分修正を繰り返す人は、
変換精度のギャップに戸惑うかも。
テストはぜんぶ素もずくでやった。
他の人もテストしてくれるとありがたいな
0382login:Penguin
2010/06/05(土) 20:24:21ID:ZADDM2Q0実証は大切だけど、そもそも辞書眺めてれば気がつくよ。
ipadic辞書を人がチェックしてないということは有り得なくて、
元々変換とは逆の目的の、漢字を読み下したり解析するための辞書だったからってだけでしょ。
追加分も手動だとかどっかに書いてなかったっけ?
まあフィルタが封印されている以上、吟味するしかないんだろうけど。
0383login:Penguin
2010/06/05(土) 22:54:03ID:9mDSEu8Qそうやっていちいちダメ変換を調べること自体は悪くないんだけど、
やっぱりある程度のカバレッジを持ったテストデータを作って自動で評価できるようにしないとダメだと思うよ
細かい問題を直したら他のところがおかしくなるなんてざらにあるだろうし、
何でもほいほい辞書に足せば精度が上がるというものでもなかろう
0384login:Penguin
2010/06/05(土) 23:31:30ID:EmRTT+mMibusで使えたっけ
0385login:Penguin
2010/06/06(日) 00:45:41ID:OSNssyVe0386login:Penguin
2010/06/06(日) 02:57:14ID:7kplvdM/「いいました」がずれるのは、品詞が細かすぎるからかもなあ。
いい 1258 1258 3354 云い
いい 1258 1258 5388 謂い
いい 1259 1259 0 いい
いい 1268 1268 0 言い
1258 動詞,自立,*,*,五段・ワ行促音便,連用形,*
1259 動詞,自立,*,*,五段・ワ行促音便,連用形,いう
1260 動詞,自立,*,*,五段・ワ行促音便,連用形,いく
1261 動詞,自立,*,*,五段・ワ行促音便,連用形,おこなう
1262 動詞,自立,*,*,五段・ワ行促音便,連用形,おもう
1263 動詞,自立,*,*,五段・ワ行促音便,連用形,使う
1264 動詞,自立,*,*,五段・ワ行促音便,連用形,思う
1265 動詞,自立,*,*,五段・ワ行促音便,連用形,行う
1266 動詞,自立,*,*,五段・ワ行促音便,連用形,行く
1267 動詞,自立,*,*,五段・ワ行促音便,連用形,行なう
1268 動詞,自立,*,*,五段・ワ行促音便,連用形,言う
1269 動詞,自立,*,*,五段・ワ行促音便,連用形,買う
1270 動詞,自立,*,*,五段・ワ行促音便,連用形,違う
「いい/言い」を1258にしたら常に前に出るんだろうな、
少なくとも頻度的には。
前に言葉がないとき1259/1268が弱すぎるのかなあ
0387login:Penguin
2010/06/06(日) 07:05:02ID:icwZ8Ez7じゃないの?
0388login:Penguin
2010/06/06(日) 08:18:04ID:zbnKys/K0389login:Penguin
2010/06/06(日) 18:53:11ID:7kplvdM/そうかもと思ったが、違うかもねー。
品詞 2239/2291 言いま の頻度を上げたところで、
品詞 1258/1258 云い にはあまり影響しないんじゃないかな。
単純に同品詞の 1258/1258 言い を作るほうが確実に潰せる。
「他に影響あるかも」と不安になるのであれば、
0 みたいな極端な頻度じゃなく (元の頻度 + 2000) 言い ぐらいにしておけばいい。
何にしても品詞体系をもうちょっと簡素化するか、
1259以降の特殊品詞の項目を1258の一般品詞にも重複登録するほうが
いいんじゃないかと思った。
こんな感じ。
いい 1258 1258 2000 いい
いい 1258 1258 2000 言い
いい 1258 1258 3354 云い
いい 1258 1258 5388 謂い
いい 1259 1259 0 いい
いい 1268 1268 0 言い
抑えめの頻度で登録すればそれほど悪影響もないと思う
0390login:Penguin
2010/06/06(日) 19:07:38ID:icwZ8Ez7汎用品詞の登録を増やしても先祖帰りするだけでしょ。
接続コストの実測値でパターンが似通っているならクラスタ化しても問題ないと思うけど、
そんなデータあるの?
0391login:Penguin
2010/06/06(日) 22:07:07ID:NlLwXMcQ0392login:Penguin
2010/06/07(月) 03:47:24ID:szI55KPJlibqtなんて入れたくないんだよ
0393login:Penguin
2010/06/07(月) 04:18:46ID:9HlTgDD4KDEに乗り換える人が増えそう
0394login:Penguin
2010/06/07(月) 05:00:56ID:y4gOikguGtk版を作ればええやん
0395login:Penguin
2010/06/07(月) 22:43:32ID:mmfdo0Vn0396login:Penguin
2010/06/07(月) 22:53:41ID:P9Ov0s9m短いとやっぱ弱いのかな?
おもわんが重ワンとなるのに
そうはおもわんと入れるとそうは思わんとちゃんと変換される。
わりと区切って入力するのでちょっと戸惑う。
0397login:Penguin
2010/06/07(月) 23:08:44ID:LJSwkYCS思うとき
思えば
オモワン
なんだろうなこれ。
0398login:Penguin
2010/06/07(月) 23:29:43ID:LJSwkYCS0399login:Penguin
2010/06/08(火) 05:34:28ID:B/3137Xj0400login:Penguin
2010/06/08(火) 10:43:12ID:X+aW8Khr「思う」という動詞が他動詞で、必ずその前に節を持つからかな?
「思わん」も「ん」が否定の助動詞「ぬ」の音便化なら、未然形に活用してるだけで、
特に不思議でも難しくもないと思うけど。
思わ/ない(ぬ、ん)
思い/ます
思う
思う/とき
思え/ば
思え
0401login:Penguin
2010/06/08(火) 11:58:56ID:umojQr770402login:Penguin
2010/06/08(火) 15:53:25ID:M67rsOKg完成した文章を1文単位で分析して頻度を出した場合、
「xxxxである。思わん。xxxx。」みたいな表現はまず出てこない。
だから「思わん」単体だと全然優先されないのかも。
でも実際の入力では考え考え入力するわけだから、
1-3文節ずつぐらいで入力することが多いのだろう。
推敲の過程で「思わん」だけを入力することもよくあるはず。
1文単位で分析して語の結びつきを調べるだけでなく、
1-3文節ぐらいでの優先度も加味して辞書の頻度を出せたらいいのかもね。
まあこれを簡易にやるとしたら、
「思わん」の表記と頻度情報を
汎用動詞のところにも追加することかな。
(手元に資料がないので「思わん」の品詞がどうなってるかわからんけど)
>>389みたいな感じ
0403login:Penguin
2010/06/08(火) 20:56:27ID:M67rsOKgTODO 99件ですか。確かに大変そう。
trunk/src/converter/candidate_filter.cc
136: // This is a temporal workaround for fixing "おそう" => "御|総"
137: // TODO(taku): remove it after intorducing a word clustering for noun.
138: if (candidate_size >= 3 && candidate->nodes.size() > 1 &&
一時的とはいえ、場当たり的にフィルタ作ってもキリがないかも
0404login:Penguin
2010/06/09(水) 22:18:15ID:nAHqWJMVanthy 食う清めない
どっちも馬鹿だorz
0405login:Penguin
2010/06/09(水) 22:21:21ID:f1C41BBe変な日本語まで相手にしないといけないからIMって大変だよな。
0406login:Penguin
2010/06/09(水) 22:33:39ID:Ws4Lks8p0407login:Penguin
2010/06/09(水) 22:36:40ID:RIVNiz1o(そんなことは思っていません)
辞書いじったからかと心配したら、
デフォのもずくでもこうだった
>>404
「てにをは」抜きはユーザのバカもちょっとある。
リロードしたら>>405が書いてたか
0408login:Penguin
2010/06/09(水) 23:12:10ID:nAHqWJMVAnthy それは一理あるぜ
やっぱmozc馬鹿だ
変換精度とか言ってた馬鹿出てこい
0409login:Penguin
2010/06/09(水) 23:12:47ID:SiUAEJXWとりあえずオレのTENGAに謝ってくれるかね
0410login:Penguin
2010/06/09(水) 23:15:32ID:nAHqWJMVmozc そんなことは主っていません
Anthy そんなことは思っていません
やっぱmozc馬鹿だ
↓こういう馬鹿
364 名前:login:Penguin [sage]: 2010/06/05(土) 10:38:19 ID:FvoE5wGr
anthyがバカってことを認められないバカが一匹いるなw
0411login:Penguin
2010/06/09(水) 23:22:03ID:NYLHc+6y物を知らない奴とバカな奴は別だな。
0412login:Penguin
2010/06/09(水) 23:26:36ID:mucBmdtX0413login:Penguin
2010/06/09(水) 23:36:17ID:qhED6547あなたが使っているAnthyは「素」のAnthy?
それともUTUMIさんのModified Anthy?
私はmozcもAnthyもどちらか一方に肩入れするつもりは無いが、
変換精度とかいう話を持ち出すのであれば、どちらも「素」の状態で、
なおかつ、未学習の状態で比較すべきだと思うが。
0414login:Penguin
2010/06/09(水) 23:50:28ID:h+8Jcbr2その条件で比較する意味なくね?
例えばその条件でanthyの方が優れているとしても、
使うにつれ個人用の学習データが小さい素のanthyのが
素のmozcより使いにくく感じるだろうし。
0415login:Penguin
2010/06/10(木) 01:23:25ID:mbMJMOceお前が、それじゃ辞書の初期の重みづけを判別するだけってことすら理解出来ない
知能ってことは理解してあげた。
0416login:Penguin
2010/06/10(木) 01:25:38ID:rK/aqtCT日本語でおk
0417login:Penguin
2010/06/10(木) 01:38:32ID:f9YWW83E変換精度に辞書は関係ないと思うんだ。
UTUMI氏の辞書追加してGoogleってすげーってか。
0418login:Penguin
2010/06/10(木) 08:03:02ID:YeHzUdmw変換精度がどうのこうのの問題以前だw
0419login:Penguin
2010/06/10(木) 08:14:27ID:YW5C5UEVが出てこないで大さになるのには閉口した。
Rev28
0420login:Penguin
2010/06/10(木) 12:23:39ID:sjq9s/0mコテつけて他の人と区別できるようにしてから
二人で殴り合いしてくれないか
0421login:Penguin
2010/06/10(木) 18:04:01ID:f9YWW83Eバカじゃなくて馬鹿
ニホンゴじゃなくて日本語
かけない→書けない
確かにお前は日本語もまともに書けないね。
0422login:Penguin
2010/06/10(木) 18:26:27ID:fPMmYVAZ0423login:Penguin
2010/06/11(金) 18:00:40ID:7svKIEvM>>417が目糞で、>>418が鼻糞ですか?
0424login:Penguin
2010/06/11(金) 19:18:48ID:dbkzlWErいえ、耳くそですキリッ
0425login:Penguin
2010/06/11(金) 19:26:16ID:7svKIEvM耳糞さんも参戦ですか!?
目糞、鼻糞、耳糞の3竦みはどうなっているのでしょうか?
0426login:Penguin
2010/06/11(金) 21:31:44ID:HBiF4xvhUTSUMIさん辞書を追加した直後は、オレ的に一発目で9割以上思い通りに変換してくれるように
なった印象があったんだけど、最近ちょいちょい変な変換するようになってきたような気がする。
一発目でほぼちゃんと変換してくれるので文節とか全然気にしてなかったせいなのか、辞書を
追加した副作用なのかよくわからんけど。
なんかチャーリー・ゴードンを思い出したぜ。
0427login:Penguin
2010/06/12(土) 00:40:01ID:LX/B/Aqs0428login:Penguin
2010/06/12(土) 00:42:14ID:CoCYPUhz0429login:Penguin
2010/06/12(土) 00:47:55ID:g96ojhEY0430login:Penguin
2010/06/12(土) 02:45:59ID:vZS9Vjdk目糞乙。
>>429
鼻糞乙。
0431login:Penguin
2010/06/12(土) 09:24:21ID:HwPSTamaAnthy 筐体
ちょw
0432login:Penguin
2010/06/12(土) 09:37:18ID:Ba4d1iMj自大は変わる→anthy
0433login:Penguin
2010/06/12(土) 12:39:17ID:vZS9VjdkおれAnthyもmozcも無印じゃないから報告できないけど。
0434login:Penguin
2010/06/12(土) 12:46:22ID:g96ojhEYつまりおまえも、UTUMI氏の辞書で変換精度とか言ってる目糞くんか
0435login:Penguin
2010/06/12(土) 16:08:11ID:p2A/0vlumozc vs anthyのスレを作ってそっちに誘導してやって。
スレが作れないから。
0436login:Penguin
2010/06/12(土) 17:57:36ID:qhFozSGFで、公開版に含まれていないのは、自動収集の膨大な単語と、精密な頻度データと、ググル八分で有名なお得意の不正語フィルタ
って事で合ってる?
0437login:Penguin
2010/06/13(日) 02:42:49ID:JhkzJet+公開版のフォーマットは合ってるけど、
非公開版は何せ非公開なのでわからない。
http://sourceforge.jp/magazine/10/05/11/0335246
> Google日本語入力の辞書データはGoogle検索のランキング・
> インデクシングアルゴリズムを反映するような単語の頻度情報を含む
Google検索での単語ランキングとインデクス作成アルゴリズムは隠したい、
ということかな。
> 自動収集の膨大な単語と、ランキングデータ
これは入ってる。
> ググル八分で有名なお得意の不正語フィルタ
これは入ってるかどうかわからない。
短い読みを入力するとズタボロになるっていうのは、
MS-IMEがちょっと前に経験したことだよね。
MSがそれをどう克服したか、っていうのがヒントになるのかも。
変換アルゴリズム変更も含めていろいろ考えていらっしゃるようなので、
http://twitter.com/taku910/status/15785334647
まったりと期待
(Mozc以外のアルゴリズムのことかもしれないけど)
0438login:Penguin
2010/06/13(日) 06:12:08ID:IohsGueo0439login:Penguin
2010/06/13(日) 07:32:51ID:JhkzJet+Google社内の人だってWindowsとChrome OSとで同じ変換結果が欲しいだろう。
語彙数を減らしてランキング精度も落とした辞書なら、
公開に大きな支障はないんじゃないかな。
もともと及川さんは「辞書だけ配ったら」って言ってたようだし。
http://twitter.com/mamoruk/status/15055959325
> プロダクトマネージャの及川って人がいて、
> なんかIME作るの大変そうだから辞書だけ配ったら、と言ったんですね。
秋後半にChrome OSが出るんだっけ?
http://www.itmedia.co.jp/news/articles/1006/03/news022.html
てことは9月頃にはMozcがどういう形になるか確定するんじゃない
0440login:Penguin
2010/06/13(日) 13:36:49ID:SDyczpAN当て字の馬鹿よりはバカの方が自然だと思う。
莫迦。
0441login:Penguin
2010/06/13(日) 14:11:06ID:kc5+QLJBしらんケド
シランケド
白んケド
0442login:Penguin
2010/06/13(日) 14:13:03ID:kc5+QLJB白んけれど
知りませんわ
知りませんことよ
知らないです
知るかボケ
シーラ内
知らな言ったら
知っとるけ
0443login:Penguin
2010/06/13(日) 16:46:26ID:ubyQDCwZ0444login:Penguin
2010/06/13(日) 18:41:24ID:fkFT0NTC論文とかあったりする?
0445login:Penguin
2010/06/13(日) 19:06:30ID:voBenHq70446login:Penguin
2010/06/14(月) 20:37:05ID:cFzAXehZもっと、罵り合って欲しいな。
0447login:Penguin
2010/06/14(月) 20:44:38ID:itjtAE+X0448login:Penguin
2010/06/15(火) 09:56:22ID:WWgmOQND午後
五後
御後
碁後
伍後
さすがmozcの変換精度はすばらしいw
0449login:Penguin
2010/06/15(火) 16:53:38ID:eTqgSqS2なにそれ?
地方ローカルの変換精度??
0450login:Penguin
2010/06/16(水) 08:23:23ID:aoHW7luQごごをmozcで変換してみろよカス
0451login:Penguin
2010/06/16(水) 17:41:20ID:wWoolAjK午後
午后
ご後
ごご
ゴゴ
gogo
GOGO
gogo
自分で好きな辞書いれて使えばいいんじゃない?
ttp://www.geocities.jp/ep3797/mozc_01.html
0452login:Penguin
2010/06/16(水) 19:28:46ID:Gp0Lw4o30453login:Penguin
2010/06/17(木) 08:30:23ID:9frVqmCm私家版辞書で、Googleってすげー、mozcってすげーってか
mozcは私家版辞書で変換精度も向上しますキリッ
さすがmozcすげーぜwww
0454login:Penguin
2010/06/17(木) 08:44:24ID:9frVqmCmそうそう
毎度のことながらまたbuildに必要なソフトが増えてるから、そのままbuildしてbuildできねーとか書くなよな
とくにGoogle妄信的マンセー野郎はな
0455login:Penguin
2010/06/17(木) 11:30:57ID:nd3z9T0m0456login:Penguin
2010/06/17(木) 13:02:40ID:XA+wvXLt0457login:Penguin
2010/06/17(木) 13:56:54ID:9frVqmCmなんちゅう単純な思考
0458login:Penguin
2010/06/17(木) 16:48:51ID:7Jb8hXGr当たり前なことを興奮しながら言うな
気に入ったIMEと辞書を組み合わせて使えばいい
0459login:Penguin
2010/06/17(木) 16:53:19ID:mnF1tUm+0460login:Penguin
2010/06/17(木) 16:59:11ID:7Jb8hXGrそんなのGoogle次第じゃないの?
オープンソースのプロジェクトなんだし
派生版とか野良辞書とか組み合わせて使うほうがLinuxっぽくていいと思うけどね
何でも受身(デフォルト)で使うならLinuxなんていらないんじゃないか
0461login:Penguin
2010/06/17(木) 19:00:14ID:iNMpus7yGoogleのデフォルトの辞書の定義次第でしょ。
Googleが色々弄った辞書をデフォルトですって言われれば
それがデフォルトな訳だし。
さあ、もっと目糞と鼻糞の掴み合いの取っ組み合いを魅せてくれw
0462login:Penguin
2010/06/17(木) 23:37:35ID:O9N+TpoVなんでいまさらSCIM対応??
0463login:Penguin
2010/06/18(金) 01:45:02ID:IRUjfEYT0464login:Penguin
2010/06/18(金) 02:11:30ID:IRUjfEYTやってみた人居ないのかな?
0465login:Penguin
2010/06/18(金) 17:29:22ID:179siXes2chからのデータで頻度値を書き換える意味ってあるのか?
日本語を正しく使えない奴らの集まりだぞw
0466login:Penguin
2010/06/18(金) 17:37:11ID:CO7JxFy00467login:Penguin
2010/06/19(土) 03:52:58ID:zfGxTSJm例えば
寿司三昧
とかくのに、
すしざんまい
ではだめで、
すしさんまい
としないと変換出来ない。
何となくだけど、もとの辞書と変換アルゴリズムのコンボで起きてる希ガス
0468login:Penguin
2010/06/19(土) 13:31:46ID:Mym/g2aK$ ../../dictionary/gen_zip_code_seed.py --zip_code=KEN_ALL.CSV --jigyosyo=JIGYOSYO.CSV > ./zip_code_seed.tsv
../../dictionary/gen_zip_code_seed.py: line 43:
The tool for generating zip code dictionary.
Input files are shift-jis csv.
Output lines will be printed as utf-8.
usage:
./gen_zip_code_seed.py --zip_code=zip_code.csv --jigyosyo=jigyosyo.csv > zip_code_seed.tsv
Zip code sample input line:
01101,060: No such file or directory
../../dictionary/gen_zip_code_seed.py: line 46: __author__: コマンドが見つかりません
0469login:Penguin
2010/06/19(土) 14:31:04ID:l3MgG8Ojpython ../../dictionary/gen_zip_code_seed.py …
でやってみそ。
mozcのビルド関連のpythonスクリプトは1行目に #!/usr/bin/python 的なのが書かれてないのが多い。
もしかしたら全部書かれてないかも。
0470login:Penguin
2010/06/19(土) 16:53:26ID:iMfoCnRmdictionary.gypのパッチもあてたほうがいいかもしれない。
0471login:Penguin
2010/06/19(土) 19:16:12ID:l3MgG8Oj↓
オレも日本脳炎で忙しい。
「にほんおうえん」が「日本脳炎」て、辞書にはそんな情報ないんだけど。
正しい文法じゃないけど、あんまりじゃないか。
ていうか、n の打ち漏らしとかも意識してるんか?
0472login:Penguin
2010/06/19(土) 19:21:38ID:G/AvUYZNちゃんと変換されたぞ?
俺も日本応援で忙しい。
0473login:Penguin
2010/06/19(土) 19:37:06ID:CBTzBt9Mおれも472と同じだ。0.11.365.1 学習なし で利用してる。
バージョンはなに? どんな環境で使ってる?
0474login:Penguin
2010/06/19(土) 19:55:53ID:l3MgG8Ojmozc は r29、学習は有り。
ちょっとあとで ~/.mozc 消してやり直してみる。
もちろん、過去に日本脳炎と変換したことはなかったし、単に「にほんおうえん」
では「日本脳炎」という候補はあがってこない。
0475login:Penguin
2010/06/19(土) 20:18:56ID:Mym/g2aKなぜか似た様な変換で
おれはにほんおうえんでいそがしいは
俺は日本応援で忙しい
と正しく変換される
0476login:Penguin
2010/06/19(土) 23:24:46ID:kbul/T1y0477login:Penguin
2010/06/19(土) 23:34:45ID:l3MgG8Oj言い出すタイプ。
0478login:Penguin
2010/06/20(日) 00:53:48ID:sY951/ta0479login:Penguin
2010/06/20(日) 01:31:11ID:XLNwSoJz>>472
> 「にほんおうえん」が「日本脳炎」て、辞書にはそんな情報ないんだけど。
> 正しい文法じゃないけど、あんまりじゃないか。
> ていうか、n の打ち漏らしとかも意識してるんか?
多分、それ。ローマ字かな変換のキータッチのゆらぎに対応するのにややこしいことになってるっぽい。
これに慣れるとまとまった文を書き連ねる場合にSCIM-Anthyのローマ字かな変換の繊細すぎるのが使い物にならなくなる位便利だけど
0480login:Penguin
2010/06/20(日) 10:02:02ID:JCImfZ7gてす
日本農業新聞 ワラ
0481login:Penguin
2010/06/21(月) 00:55:00ID:0ZkvIPI4全く反応しなかったり入力途中で消えることがあるなぁ。
通常の使い勝ってはもうホント決定版だと思ってるので早くバグ潰して完成度を上げてください。>エロイ人
0482login:Penguin
2010/06/21(月) 01:19:36ID:pzeyIawFよく、サスペンドから復帰した後に、しかも3文字打って、その3文字を変換しようとした時に消えたりする。
0483login:Penguin
2010/06/21(月) 04:39:00ID:T/SvdD9EBaidu Type
http://ascii.jp/elem/000/000/528/528201/
Google 日本語入力
http://journal.mycom.co.jp/news/2009/12/08/069/
Googleのほうは女子力が足りないかも
おっさんばかりでむさ苦しい
男性女性で入力傾向違うと思うので、
(性差よりも個人差の方が大きいとは思うが、)
チームに女性をいれた方がいいかもね (もういるのかな)
端的にいえば「Mozc☆リリースしました!」とリリースノート書いたり、
かわいいツールバーを企画する人がGoogle IME/Mozcにはいなさそう
ブログ見ても女子色つよい
http://staffblog.baidu.jp/category/type/
スタッフ一同の写真?だよな、スタッフ証つけてるし
http://staffblog.baidu.jp/wp-content/uploads/2010/06/IMG_2867-300x225.jpg
ASCIIのBaidu Typeの記事はなかなか興味深い
> Google 日本語入力と比較されることが多いのですが、
> 実際ユーザー様からの要望などを見ていると、やはり、
> よりライトで、カジュアルな使い方をされている方が多いという印象です。
> かなり短い文節や単語単位で変換を行っている傾向が見てとれ、
> そこからもカジュアルユース中心であると推測しています。
> 『MS-Wordでは他のIMEを使い、ブログやチャットなどでは
> Baidu Typeを使う』というコメントもありました。
Linux版が出たら使い分けできて楽しいかもね
アイコンとかもかわいい感じかつ差し替え可能になったりして
0484login:Penguin
2010/06/21(月) 04:41:31ID:T/SvdD9E再現手順かいてMozcのIssuesに投げとけば。
http://code.google.com/p/mozc/issues/list
開発者日本人だから日本語でOK
0485login:Penguin
2010/06/21(月) 04:55:47ID:T/SvdD9Ehttp://googlejapan.blogspot.com/2010/06/google.html
あんまり愉快な発想が出そうな感じがしない
0486login:Penguin
2010/06/21(月) 05:03:42ID:cPfJbWjU偏見かもしれんが、例えば江沢民市ねとか
変換したら、その日から何かに脅えて
暮らすことになったりするのかな
0487login:Penguin
2010/06/21(月) 06:42:13ID:T/SvdD9Eそりゃ偏見だし、
Googleだったら安心かというとそうでもない
というか入力すること自体のリスクは極めて小さい
問題なのは入力した文章を公開すること
>>486の文章をMS-IMEで書こうがMozcで書こうがSKKで書こうが、
公開してしまえば最大のリスクが等しく降りかかる
MS-IMEで書いて投稿したらリスクが減るってもんじゃない
いままで「Baidu Typeで『〜』って書いたらまずいことになるんじゃない」
みたいな書き込みは何度も見た
その投稿自体に全てのリスクがあるのになあ
つうわけで>>486は今日から
何かに脅えて暮らすことになったりするのかも
0488login:Penguin
2010/06/21(月) 07:13:41ID:40qedJmiそれともスレ違いと言えばいいのだろうか
0489login:Penguin
2010/06/21(月) 07:58:13ID:T/SvdD9E許容度が小さすぎるぞ
> 中の人宣伝乙
Baidu Typeは初期にちょっと使ったけど、
長文変換が弱すぎたのですぐ消した
なにより基本的にLinux使ってるので動かせない
まあ記事中でGoogle日本語入力の話もちょろっと出てたし、
Mozcが短い入力に弱い→
意外とユーザは短い文節で入力してるみたい(Baidu Typeは特にそうなのかも)
とういうのが興味深かったのよ
0490login:Penguin
2010/06/21(月) 07:59:18ID:ylQvidjt怖いしなんかキモいし
0491login:Penguin
2010/06/21(月) 09:05:18ID:iwCpYBpi百度の話題ならこちらへ
日本語入力総合スレッド 4
ttp://pc11.2ch.net/test/read.cgi/linux/1151823044/l50
0492login:Penguin
2010/06/21(月) 10:50:05ID:shlRNFY2http://blog.goo.ne.jp/minoh_edubuntu/e/632a79175331b039aa116109b76a6378?fm=rss
これまでanthyで苦労していたので助かった。
googleは嫌いだけど。
0493login:Penguin
2010/06/21(月) 18:18:12ID:R7JTwQ8ktesterのmozcは辞書もなにも弄ってないbuildかな?
0494login:Penguin
2010/06/21(月) 18:24:24ID:iwCpYBpijaチームとしてのものだから、弄っていないはず
というか、弄ってあっちゃまずい
ubuntu公式に限りなく近い野良ビルド
0495login:Penguin
2010/06/21(月) 18:35:17ID:w8Pl4equ「きょにゅう」は辞書にないのはいいとして、それを一文節にすると、
「居に夕」、「虚に夕」…と、「きょにゆう」になってる。
うーん、バグ報告しづらい事例だなあ。
0496login:Penguin
2010/06/21(月) 18:42:00ID:QhOxbV10ちょっと待てw
r30 ツルシ辞書 学習あり
きょにゅう → 巨乳ちゃん
しか候補に来ないw
そんな変換した記憶はないのだが…
0497login:Penguin
2010/06/21(月) 19:00:35ID:w8Pl4equ「巨乳ちゃん」は辞書にあるよ。
0498login:Penguin
2010/06/21(月) 19:49:24ID:+Vw920Rk0499login:Penguin
2010/06/21(月) 19:51:01ID:3Pda7xvX0500login:Penguin
2010/06/21(月) 20:09:37ID:R7JTwQ8kなぜか変換出来る
ネタとしてNG
0501login:Penguin
2010/06/21(月) 20:19:40ID:KDWRbYvc変な区切りしてるような気がするんだけど。
0502login:Penguin
2010/06/21(月) 21:19:50ID:w8Pl4equ同感。俺は学習に問題があるのかなあとか思ってたんだけど。
0503login:Penguin
2010/06/21(月) 22:08:17ID:O0BxWBxz0504login:Penguin
2010/06/21(月) 22:10:41ID:Wiq3Lzso細切れ変換しやすいかな。
ずいぶんなれたけどさ。
0505login:Penguin
2010/06/23(水) 07:45:52ID:JOhAuhsdJapanese team のppaからMozc いれたら、火狐で表示する一部サイトのアルファベットのフォントが変わってしまった。
解決方法を知っている人がいたら教えてもらえないだろうか?
0506login:Penguin
2010/06/23(水) 07:52:48ID:+DGSrOjN0507login:Penguin
2010/06/23(水) 08:41:19ID:JfXd+1awfirefoxのフォント関係の設定は全部確認した?
0508login:Penguin
2010/06/23(水) 11:45:50ID:pC1bACa4ppa なんか使っちゃーいかんな。
0509login:Penguin
2010/06/23(水) 11:52:19ID:hLzgIJgE0510login:Penguin
2010/06/23(水) 11:56:24ID:5255hG7t0511login:Penguin
2010/06/23(水) 17:32:42ID:pC1bACa40512login:Penguin
2010/06/23(水) 18:36:17ID:ReoAaQ2htesterなら知ってるけどさ。
0514login:Penguin
2010/06/24(木) 02:35:58ID:sjChCSOS「testerの意味のわかる人だけ使ってください」って書いてたでしょ。
不具合報告は提出してもいいけど対処法を教えてくれとか全く意味わかってないじゃん。
0515login:Penguin
2010/06/24(木) 07:32:17ID:33cH6iYm酷いディストリばかりなんだね(苦笑
0516login:Penguin
2010/06/24(木) 19:45:16ID:icPu4CVC使える。
libcとか依存するライブラリ揃えて、ar とtar で deb の中身を
展開して、適切に設定したら、別のトリでもいけるだろ。
0517login:Penguin
2010/06/24(木) 20:08:53ID:YIW19YhL0518login:Penguin
2010/06/24(木) 20:35:20ID:icPu4CVCソースがあるから、ライセンス条件に従えるなら、
>577の方法でいいとは思うが、しょーもない煽り
だったので、上記で答えた。ウソではないからね。
0519login:Penguin
2010/06/24(木) 20:47:17ID:5qxOtEj80520login:Penguin
2010/06/24(木) 20:48:04ID:3yGS5Qoa困るね世界標準じゃないディストリ使いは
0521login:Penguin
2010/06/24(木) 21:00:08ID:YIW19YhLナイーブなやつだな。
オレなら>>516のあとに一言>>517を付け加えるけどね。
そのほうがよりマシな回答になるだろ?
うーむ、
「その|ほうが」で「その|方が」がでてこない。
0522login:Penguin
2010/06/24(木) 22:55:44ID:CkCzMIm30523login:Penguin
2010/06/24(木) 23:21:36ID:wGZ7Y5MZ誰かツッコんでやれw 放置でカワイソウじゃないか。
0524login:Penguin
2010/06/26(土) 18:52:05ID:Xg08UkVD辞書の作り直しとかやってるのかな
http://googlejapan.blogspot.com/2010/06/google-ver-011382x.html
> ユーザーフォーラムでのフィードバックをもとに、
> ローマ字ルールの評価方法を改良しました。
これで日本応援→日本脳炎が解消するのかな
> ローマ字のタイプミスの修正機能を拡充しました
> (例:にゅりょく→入力, しゅりじょうしゅりちゅう→首里城修理中)
これは余計なお世話になりそうな予感
念のためだけどMozcには変化なし
> オープンソース版は更新されず
レポートするならMozcのIssuesよりヘルプフォーラムのほうがいいのかも?
Issuesは放置気味だしな
> ヘルプフォーラムをご利用ください。
0525login:Penguin
2010/06/26(土) 19:13:52ID:Z6prY9icおれは
にほんのうえん→日本脳炎
だぞ。私家版Mozc辞書入れてるからな。
どうせお前は淹れ方分からないんだろwwww
へたれwww
0526login:Penguin
2010/06/26(土) 19:30:45ID:ECr4l6RM日本脳炎の件だけど、変換前が”にほんのうえん”になってる?”n”が足りてなかったりしない?
意識してないタイプミスのせいだと思うんだけど
その辺の問題があって、 > ローマ字のタイプミスの修正機能を拡充しました。て、ことじゃないかな
たぶん、> ローマ字ルールの評価方法を改良しました。 よりも
タイプミスの修正機能の方が、ユーザーにとっては嬉しいと思う
面倒なんでupdateしてない”Mozc-0.11.356.0”だけど
ちゃんと”にほんのうえん→日本脳炎”になってるよ
0527login:Penguin
2010/06/26(土) 19:31:48ID:lGgUdOwJ>>471氏のとおり、「にほんのうえん」だけの変換では正しく変換される
「おれもにほんおうえんでいそがしい」と入力すると
俺も日本脳炎で忙しい
となる
これは私家版辞書が追加されてるとか関係なさげ
0528526
2010/06/26(土) 19:42:20ID:ECr4l6RM横からごめん。上記バージョンで、ちゃんと一文丸々一発変換された
おれもにほんおうえんでいそがしい→俺も日本応援で忙しい
辞書は全く弄ってない。変換時に文節区切ってない
過去に、この文を変換したことないんだが
0529login:Penguin
2010/06/26(土) 20:17:29ID:zqTu1dTqにほんおうえんで 日本脳炎で
おうえんで 応援で
・・・なんだろうね。
0530login:Penguin
2010/06/26(土) 20:25:58ID:zqTu1dTqこれが怪しいな
0531login:Penguin
2010/06/26(土) 21:11:38ID:7kGVyWfJ全部ちゃんと応援になる
脳炎となるのは誤字して学習させただけと思うが
履歴クリアしてみれば
0532login:Penguin
2010/06/26(土) 21:16:40ID:lGgUdOwJ~/.mozc消してビルドしたてのmozcでなるわけだが?
誤字の履歴も関係ない
0533login:Penguin
2010/06/26(土) 21:24:33ID:tZ6xhvBL0534login:Penguin
2010/06/26(土) 21:33:17ID:UNe+Fxsqにほん|おうえん 日本応援
にほんおうえん 日本脳炎
で、デフォルトは「にほん|おうえん」の区切り。
おれも|にほん|おうえんで|いそがしい
で普通に変換されたけど。日本脳炎言ってるやつは
どんな区切りで打ってるんだ?
0535login:Penguin
2010/06/26(土) 21:43:40ID:kzVXlbYu「俺も日本応援で忙しい」
「俺も日本の応援で忙しい」
どう考えても日本語的に、「日本の応援」だろw
正しい日本語も分かってない奴がクレーム付けてもどうしようもないだろ!
0536login:Penguin
2010/06/26(土) 21:56:25ID:tZ6xhvBL>>471 を一字一句音読してこい。
0537login:Penguin
2010/06/26(土) 22:32:33ID:kzVXlbYuだからよ、「おれもにほんおうえんでいそがしい。」って打ってる時点で日本語変だろw
変換する前に気がつけよw
ブラインドタッチしてたら気が付くだろ変な日本語打ってるの。
こんな変な日本語音読する方が恥ずかしいわw
0538login:Penguin
2010/06/26(土) 22:37:09ID:tZ6xhvBLだから>>471は文法的におかしいと分かっている上で書いている。
そして文法的におかしいからと言って、それが「にほんおうえん」→「日本脳炎」という
誤変換のエクスキューズにはならない。
早く宿題済ませて寝ろ。
0539login:Penguin
2010/06/26(土) 22:54:32ID:kzVXlbYu* 入力補助機能の改良点
o ローマ字のタイプミスの修正機能を拡充しました (例:にゅりょく→入力, しゅりじょうしゅりちゅう→首里城修理中)
この機能の副産物だろ。それをグチャグチャ言ってる時点で可笑しいんだよw
タイプミス時の修正機能のロジックなんて、お前等に合わせて組んでたら一生掛かっても完成しないだろ。
お前も>>471も揚げ足を取って笑ってる愉快犯じゃねーかw
お前こそママのおっぱい吸ってさっさと寝ろw
0540login:Penguin
2010/06/26(土) 22:58:01ID:kzVXlbYuおいw顔と耳真っ赤だぞw
0541login:Penguin
2010/06/26(土) 23:02:58ID:tZ6xhvBLワロスw
俺はおまいがモニタの前で顔真っ赤にしてるメガネっ子の女子校生とみなしてるから
全然構わんぞ。
0542login:Penguin
2010/06/26(土) 23:15:44ID:kzVXlbYu揚げ足も取れなくなりましたかw
まあ、「日本脳炎」にこだわる小さい人間だから仕方ないかw
0543login:Penguin
2010/06/27(日) 00:59:51ID:CTEwBljB(((;-д-)=3ハァ?
日本語的なんて日本語があると思ってるの?
典型的な間違った現代語じゃねぇか。
0544login:Penguin
2010/06/27(日) 01:17:45ID:wU0enjNjてき【的】(接尾)
名詞に付いて、形容動詞の語幹をつくる。
1.そのような性質をもったものの意を表す。「文学―表現」「詩―発想」
2.それについての、その方面にかかわる、などの意を表す。「教育―見地」「政治―発言」「科学―方法」
3.そのようなようすの、それらしい、などの意を表す。「大陸―風土」「平和―解決」「徹底―追求」
日本語ちゃんと勉強ちまちょうねw
馬鹿なのがばれまちゅよw
0545login:Penguin
2010/06/27(日) 01:58:49ID:+QfA3FbBそんな事態になったら焦るよ
同情します
0546login:Penguin
2010/06/27(日) 02:02:28ID:pwuJ8VLEオマエら m9(^Д^)プギャーーーッ
http://twitter.com/taku910/status/17096522332
> Anthyでもそうだったらしいのですが、MeCabもMozcもソフトウェアの動作だ
> けを見て、憶測だけで動作アルゴリズムを「さも専門家のように語る」
> Linuxユーザは本当に勘弁して欲しい。たいてい間違ってるし。オープンソー
> スなんだからソース読んでほしい。
0547login:Penguin
2010/06/27(日) 02:08:45ID:ZR0jbQ7bリーナスだってlinuxの全部のソースは知らないって教育テレビで言ってたよ。
0548login:Penguin
2010/06/27(日) 02:09:35ID:toNIO6Zdマジレスすると、Linuxはオープンソースなんだからソース読めと言うのは
ソースが読めなければLinuxを使ってはいけないと言う意見なのかね?
頭悪すぎるだろう。
0549login:Penguin
2010/06/27(日) 02:15:00ID:a0nWQ38hということだね
0550login:Penguin
2010/06/27(日) 02:15:04ID:+QfA3FbB宛先は誰だよ?
>>1-1000にして自分入れるの忘れるなよ
0551login:Penguin
2010/06/27(日) 02:18:01ID:YrTT2Rln0552login:Penguin
2010/06/27(日) 02:19:41ID:ZR0jbQ7b0553login:Penguin
2010/06/27(日) 02:21:38ID:a0nWQ38h0554login:Penguin
2010/06/27(日) 02:23:33ID:ZR0jbQ7b0555login:Penguin
2010/06/27(日) 02:31:13ID:a0nWQ38h0556login:Penguin
2010/06/27(日) 02:38:10ID:ZR0jbQ7b0557login:Penguin
2010/06/27(日) 02:44:07ID:a0nWQ38h0558login:Penguin
2010/06/27(日) 02:46:38ID:+QfA3FbB「よそく」と入力した時点で第一候補に「予測変換」と出るけど
日本語文章で予測変換が続くことは、ほぼあり得ない
携帯辞書も似た様なもんだけど
この辺は設定で変えられたらいいなと思う
さっきの日本応援も一度変換しちゃうと
次は「にほ」で日本応援が第一候補だし
0559login:Penguin
2010/06/27(日) 02:48:20ID:ZR0jbQ7bで、それをソースで確認するのってどうやるの?
0560login:Penguin
2010/06/27(日) 02:49:49ID:a0nWQ38h0561login:Penguin
2010/06/27(日) 02:51:34ID:ZR0jbQ7bじゃあ実演しといて
0562login:Penguin
2010/06/27(日) 02:53:30ID:a0nWQ38h0563login:Penguin
2010/06/27(日) 02:57:12ID:+QfA3FbBバカの馴れ合いに挟まっちゃった
寝よ
0564login:Penguin
2010/06/27(日) 02:57:30ID:a0nWQ38hみたいな、日本語変換は難しいよねきっと
0565login:Penguin
2010/06/27(日) 02:57:31ID:ZR0jbQ7b0566login:Penguin
2010/06/27(日) 02:58:40ID:a0nWQ38h0567login:Penguin
2010/06/27(日) 03:00:47ID:a0nWQ38h0568login:Penguin
2010/06/27(日) 03:10:23ID:ZR0jbQ7bマシンの中に虫なんか居ないから、意図はともかくプログラムは誰かの書いた通りに動いているわけで。
0570login:Penguin
2010/06/27(日) 03:47:20ID:wU0enjNj0571login:Penguin
2010/06/27(日) 03:56:56ID:UWF/v0LL入力時点ではとりあえず「にほんおうえん」と表記されるが「ん」をn一個でやっちゃったんじゃないかと
思ってくれる親切設計なんじゃないかな。
「官能的」なんかも「かんおうてき」で変換できるんじゃ内科医。
0572login:Penguin
2010/06/27(日) 04:17:38ID:ZR0jbQ7b>>546によるとソース読まなければ語るのは勘弁してくれだそうですよ。
しかし日本語関連の人間ってライセンス以外の制約付けるの好きだなあ。
0573login:Penguin
2010/06/27(日) 04:34:48ID:a0nWQ38hバカ丸出しで語るオマエはOK
0574login:Penguin
2010/06/27(日) 04:50:50ID:LwleNs7Bnihonnouenn と入力してスペースキー押すと「日本応援」になり、
そこから shift+方向キー右 を押すと「日本のうえん」になる。
nihonn|ouen → nihonno|uen → にほんの|うえん
この挙動は意図的なものなんだろうけど、
ぱっと見不思議な感じがするのでIssuesにもレポートが上がってる
入力補助機能の弊害についてはヘルプフォーラムで話が出てる
http://www.google.com/support/forum/p/ime/thread?tid=0441973e77355bc8&hl=ja
> 「しんじよう」と入力すると、サジェストの先頭が「新庄」になってます。
>>546
せめて「〜という記述を見かけたのですが」と書いておけば、
誰が間違ってるのか勘弁して欲しいのか分かるのにな
ああいう書き方だと「本当に勘弁して欲しい」相手はしゃべり続け、
役に立つことを書いてる人は気を遣って黙っちゃう
> 憶測だけで動作アルゴリズムを「さも専門家のように語る」
> オープンソースなんだからソース読んでほしい。
「ソース読んでほしい」じゃなく「この解説文読んでほしい」
にならないのは残念
読める文章がないから怪しい解説にみんな食いつくのでは
0575login:Penguin
2010/06/27(日) 07:04:46ID:iCru6Fog七打すればいいだけなのに馬鹿じゃないかと思うよ
おまえら
悪い頭を良い頭に取り替えてかな入力すればすむ話じゃねーか
身体障害者なのか精神薄弱なのか知らないがバカ入力選んでバカ入力の話を無限ループかよ?
0576login:Penguin
2010/06/27(日) 07:11:27ID:a0nWQ38h0577login:Penguin
2010/06/27(日) 09:29:43ID:AB/w4Yqfにほんおうえん→日本応援
にほんおうえんで→日本脳炎で
にほんのうえんを変換したいわけではない
勘違いバカはすっこんでろ
0578login:Penguin
2010/06/27(日) 09:33:15ID:EYDo0gAo訂正機能で自分の意図と違う変換結果になったからって文句を言うのはアホ。
0579login:Penguin
2010/06/27(日) 09:47:35ID:AB/w4Yqf0580login:Penguin
2010/06/27(日) 10:09:48ID:ZR0jbQ7b0581login:Penguin
2010/06/27(日) 10:14:21ID:a0nWQ38hnihon nouen
区切りなしに判別するのは論理的に不可能
日本脳炎という単語が辞書にあるからサジェストされるのが当たり前
わかったか?
0582login:Penguin
2010/06/27(日) 10:20:37ID:ZR0jbQ7b0583login:Penguin
2010/06/27(日) 10:23:17ID:a0nWQ38h0584login:Penguin
2010/06/27(日) 10:24:56ID:a0nWQ38h0585login:Penguin
2010/06/27(日) 10:27:05ID:a0nWQ38h使ってりゃ学習するんだから
おまえはちっとも学習しないみたいだけどな
0586login:Penguin
2010/06/27(日) 10:31:09ID:AB/w4Yqf0587login:Penguin
2010/06/27(日) 10:32:50ID:a0nWQ38h0588login:Penguin
2010/06/27(日) 10:40:55ID:AB/w4Yqf>nihonn ouen
>nihon nouen
やっぱりこの馬鹿わかってなかった・・・
にほんおうえんで
にほんおうえんで
にほんおうえんで
・ ・
・ ・
100回変換してろ
0589login:Penguin
2010/06/27(日) 10:44:43ID:Z9uQG43omozcのルールでは、厳密に言えば”ん=nn”
な行の前の”ん”はnnで入力しないと、文節の判定がうまくできなかった
Atokが優秀なのは、それを含めてユーザーのタイプミス等を予想して変換に組み入れていたから
今回、ローマ字のタイプミスの修正機能を拡充したので
少しはイメージ通りの変換に近くなっているはず
0590login:Penguin
2010/06/27(日) 10:44:44ID:AB/w4Yqfhttp://www.sponichi.co.jp/soccer/news/2010/06/12/14.html
高円宮妃久子さま 日本脳炎で私的に南ア訪問
mozcで書いたら馬鹿誤植になったわけだ
0591login:Penguin
2010/06/27(日) 10:51:08ID:ZR0jbQ7b個人的には、シングルクリックで開く並に余計なお世話だと思う。
まあ設定できれば別にデフォルトでも気にしないけど。
0592login:Penguin
2010/06/27(日) 10:51:09ID:a0nWQ38h0593login:Penguin
2010/06/27(日) 10:52:31ID:a0nWQ38h0594login:Penguin
2010/06/27(日) 10:54:56ID:ZR0jbQ7b0595login:Penguin
2010/06/27(日) 10:56:21ID:pDidW01sそれで?
絶対にどこかのアフォが辞書引いて反論すると思った。
辞書のコピペだけで勝った気になる能無し乙。
その定義のどれを使っても、
「日本語的」「世界的」とか、変な用法の正しさは証明できない。
むしろ、「的」は中国語で「of」に相当するから、
日本語でも誤った用法が定着してるけど、
適当に漢字や熟語を並べても漢語としては主張できるけど、
日本語の熟語には認められない。
大学の教授も同じこと言ってたけど、中学でも習って知ってた。
0596login:Penguin
2010/06/27(日) 10:57:30ID:pDidW01s0597login:Penguin
2010/06/27(日) 11:02:23ID:zdDUWrPs所詮馬鹿ばっかりしかいないし、馬鹿と遊んでたって時間の無駄だし、なにより貴方様まで馬車になるよ
0598login:Penguin
2010/06/27(日) 11:08:11ID:a0nWQ38h言い掛かりや嫌がらせに近い
そんくだらないパラメータをいちいち加えていたらプログラムが煩雑になるだけ
そんなバカな話をもっともらしく語る始末
>>546の人の気持ちも分かる
0599login:Penguin
2010/06/27(日) 11:35:03ID:tn5sadQBバカほど大きい声で言い切るしね。
分かっている人は控えめで謙虚だ。
0600login:Penguin
2010/06/27(日) 11:38:53ID:ZR0jbQ7b0601login:Penguin
2010/06/27(日) 13:41:53ID:LwleNs7BAnthyでは
nihonnouenn で shift+→ すると、
にほんお|うえん になる
この挙動で苦情は出なかったと思うし、
個人的にも自然に思える
しかしtakuさんの逆鱗に触れたの誰だろ
直前にこれ↓を読んでたので対照的だなあと思った
http://staffblog.baidu.jp/2010/06/25/baidu-type-022/
> さすがブロガーの皆さん、アウトプットする言葉の正確さや、
> 入力しやすさに非常に関心・ご要望をお持ちで、大変参考になるお話をいただきました。
ユーザが勘違いなことを書くのはある意味当たり前
有益と思える部分だけすくい取っていけばいい
誤解があると思うならドキュメントを書いて説明することも大事
ID:ZR0jbQ7b (14)
ID:a0nWQ38h (20)
書きすぎ
0602login:Penguin
2010/06/27(日) 13:45:27ID:zdDUWrPs平日に20とか行ってたらちょっと書きすぎって言ってもいいだろうけど
0603login:Penguin
2010/06/27(日) 15:10:45ID:8AXtkjxO0604login:Penguin
2010/06/27(日) 15:14:02ID:iIFZfXGC弱いのが勘違いしてるだけなんだから
0605login:Penguin
2010/06/27(日) 16:00:35ID:AB/w4Yqfまたそうやって、出来ないことは必要ないことであると脳内変換するのか?
例えば、我々はDRMが必要なのではない。
Gyao!がDRMを使わなくても見れるならそれでいいのだ。
出来なくても構わないが、代わりのものが整備されてこそだと思うのだが。
0606login:Penguin
2010/06/27(日) 16:25:36ID:1lb4fVSL0607login:Penguin
2010/06/27(日) 16:53:47ID:IDzQ/UyC俺も是非知りたいな。
0608login:Penguin
2010/06/27(日) 22:20:33ID:rwYplf+A0609login:Penguin
2010/06/27(日) 22:45:58ID:a0nWQ38h0610login:Penguin
2010/06/28(月) 19:05:29ID:YjEsd8O20611login:Penguin
2010/06/28(月) 20:50:04ID:6R0fDxVd変ないする
ローマ字かな変換の話なので、
日本語としての正しさとか辞書のスコアがどうとかは別の話
つまり、
hennaisuru と入力した人が、
区切りを変更しただけで「へんないする」が出たときどう思うか
Anthyみたいなほうがいいんじゃね?と
しかしtwitterでMozcスレ読んでます的なこと書くの恥ずかしいぞお前ら
Aさん
> mozcスレ、おれもにほんおうえんでいそがしい。→オレも日本脳炎で忙しい。
> でどんだけレス消費してるんだ
Bさん
> 2ch の mozc スレが全く不必要に荒れていて
> どんどん ID をあぼーんしていったらスカスカのスレになってしまった!!。
> もう読むのやめよう。
0612login:Penguin
2010/06/28(月) 20:55:47ID:6R0fDxVd> Mozcの「日本脳炎」の話は、UTSUMI氏の辞書に
> 日本脳炎が4206という低いコストで登録されていて、
> 日本応援のコストよりスペルチェックしたほうが有利に働いただけ。
そういう話だったのかな?
スペルチェックそのものがどうなのかという話かと思ってた
> 同氏の辞書を入れない通常のコストは6529と大きくこの問題は発生しない。
> 適当なコスト付けだと副作用が起きる典型例
あー、takuさんが怒ってたのはこれか
素人がコードも読まずに変換精度語るなよ的な
まーMozcが今後どういうふうになるかわからんしね、
mozc-configみたいにさっさと引くのが正解だね
「ぼくに」→「ボク妊娠」
「おれは」→「オレハマッテルゼ」
「すーし」→「徐煕[女弟]」
たまに面白いサジェストが出てきて救われる
笑いって大事ね
0613login:Penguin
2010/06/28(月) 20:58:54ID:Ig8ewDwa変換前はひらがななわけで、ローマ字ではない。
しかも、nが3つ続くことを意識して打ってるわけでもない。
多分、Direct inputでも同じだろう。
ローマ字ではへんないだが、へんあいと表示されたのを見て変換してるわけだ。
なのになぜ未だにこういう勘違い馬鹿がいるのか不思議でならない。
0614login:Penguin
2010/06/28(月) 21:36:39ID:vE1RuP2O要するに使ったコーパスが偏ってて日本脳炎の出現頻度が不当に高すぎるって話?
そうじゃないなら頻出語が登録されてない暫定辞書の問題じゃないの?
でもそれはこの話の本質的な問題じゃないんだよね。
大体ソース見たってそんな事はわからないもの。
大規模コーパス版のソースが見れれば別かもしれないけど。
0615login:Penguin
2010/06/28(月) 21:47:30ID:teKDYFoAそんなのソース以前の問題だろw
いかにここがバカの集まりだって遠回しに言われてるの気がつけよw
もう、お前等が日本脳炎にかかってしまえよw
0616login:Penguin
2010/06/28(月) 21:56:24ID:vE1RuP2O学習すればバカになるって言っているのと同じ事だし。
そもそも間違っても仕方がないと思うような間違いなら誰も騒がないんだよね、
0617login:Penguin
2010/06/28(月) 22:09:34ID:to9RUFmG人名辞書はありがたく使わせてもらってたんだけど、仕方ないか。
0618login:Penguin
2010/06/28(月) 22:15:16ID:vE1RuP2O本応援と打とうとしたら本農園が出るのは変わらないし。
0619login:Penguin
2010/06/28(月) 22:19:06ID:rfPkQ9oX自分でコンパイルしたの入れてたから日本脳炎とか分からなかった。
0620login:Penguin
2010/06/28(月) 22:26:52ID:YjEsd8O2もう死んでしまえよw
【日本脳炎】
日本脳炎ウイルスの感染によって起こる脳炎。法定伝染病の一。
コガタアカイエカの媒介によるため、夏に流行する。感染しても症状の現れないことが多いが、
発病すれば致命率が高く、治っても重い後遺症を残す。
まるで今のお前等のようだwww
0621login:Penguin
2010/06/28(月) 22:41:02ID:vE1RuP2Oそういう話が出てくるのはむしろ熱心なユーザーに恵まれてるんだと思ったほうが良いと思うんだけどなあ。
0622login:Penguin
2010/06/28(月) 22:52:10ID:rfPkQ9oXUTSUMIとか言うのがジャストなんとかの手先だったらおもしろいけど
0623login:Penguin
2010/06/28(月) 23:05:53ID:vE1RuP2Oサンプルが熱心なファンが作ったものに差し変わった途端に評判が段違いに高まるソフトとかはよくある話じゃない?
でも逆は無いね。
0624login:Penguin
2010/06/28(月) 23:21:26ID:kV4nwtmV重ねうちの数をミスるとか打ち損じで不要な子音が混ざるとかは
よくあるミスなので自動補正が掛かる動作のほうがまとも。
0625login:Penguin
2010/06/28(月) 23:28:29ID:sPL4dOyN0626login:Penguin
2010/06/29(火) 01:10:39ID:6VqNbmThだってそんな事言わなくたって、じゃあ原因突き止めてパッチ出してねで済む話なんだし。
0627login:Penguin
2010/06/29(火) 01:18:07ID:YfC2OShb0628login:Penguin
2010/06/29(火) 01:28:02ID:6VqNbmTh結局>>246のやっかみだね。
0629login:Penguin
2010/06/29(火) 01:38:07ID:R344iBrK粘着するような話じゃないし、バグでもない
0630login:Penguin
2010/06/29(火) 01:44:41ID:6VqNbmTh0631login:Penguin
2010/06/29(火) 01:52:03ID:R344iBrKバグだバグだと喚き散らす
もういい加減にしてほしい
0632login:Penguin
2010/06/29(火) 01:57:00ID:6VqNbmThじゃあなんで無視できないのさ?
中の人なの?
0633login:Penguin
2010/06/29(火) 01:58:34ID:R344iBrK0634login:Penguin
2010/06/29(火) 01:59:31ID:TiCyv9WP0635login:Penguin
2010/06/29(火) 02:08:59ID:R344iBrK私家製辞書のせいで「日本脳炎」とサジェストされるわけだけど
おばかさんはその結果で決定してるから、いつまでも「日本脳炎」が上位のまま
おれもUTSUMI辞書を取り込んでるけど、
一回ちゃんと変換すれば日本脳炎なんてでない
0636login:Penguin
2010/06/29(火) 02:12:54ID:SRaABgeP0637login:Penguin
2010/06/29(火) 02:15:26ID:R344iBrK「クサイ、クサイ」と喚き散らしながら
自分でウンコ漏らしてることにいつまでたっても
気づかないような欠陥人間
0638login:Penguin
2010/06/29(火) 02:19:02ID:6VqNbmTh0639login:Penguin
2010/06/29(火) 02:20:36ID:R344iBrK0640login:Penguin
2010/06/29(火) 02:23:50ID:6VqNbmTh0641login:Penguin
2010/06/29(火) 02:28:27ID:R344iBrKその「臭い」についてきちんと説明してみたらどう?
実際おれの環境じゃもうnihonnnouenと打たないかぎり
「日本脳炎」なんてでないからね
0642login:Penguin
2010/06/29(火) 02:34:39ID:R344iBrK0643login:Penguin
2010/06/29(火) 04:00:09ID:TiCyv9WP>>630
0644login:Penguin
2010/06/29(火) 04:17:25ID:RAWQ0/Y10645login:Penguin
2010/06/29(火) 04:20:14ID:RAWQ0/Y1小分けに変換してるからか全然変換アルゴリズムに不満は感じないな
0646login:Penguin
2010/06/29(火) 04:20:44ID:R344iBrK解決方法を指南してあげてるのだから
排除される筋合いはありませんね
それでもダメというなら
自分の状況をきちんと説明するべきです
0647login:Penguin
2010/06/29(火) 05:59:08ID:+TY4WfENむしろ間違った時に救済されることを感謝したい気もします。
設定でこの機能がオンオフ出来ればもっとよいのでしょうね。
0648login:Penguin
2010/06/29(火) 07:29:56ID:3uyU/vOlローマ字入力するやつ市ね
0649login:Penguin
2010/06/29(火) 07:43:27ID:R344iBrK再現しない例ですが
きほんおうりょくで
基本応力で
「基本能力」は内蔵辞書にあります
0650login:Penguin
2010/06/29(火) 08:37:33ID:ttl/G4LE0651login:Penguin
2010/06/29(火) 13:38:46ID:74Hv5Pp4泥舟vineのあなたには関係ないことですねw
0652login:Penguin
2010/06/29(火) 17:59:43ID:51I9Kix30653login:Penguin
2010/06/29(火) 18:02:45ID:TiCyv9WP0654653
2010/06/29(火) 18:04:11ID:TiCyv9WP原因がわかったあともバグだと言ってるやつってどこにいるんだ?
0655login:Penguin
2010/06/29(火) 21:15:16ID:hXbNgCIt結局、分節句切りすら晒してない。
それに便乗して偉そうに語った日本脳炎信者w
結局、Googleの中の人怒らせるわ、UTSUMI氏には迷惑かけるわ…
もうね、死んでしまえよw
>>595みたいな知ったか振りも死んでしまえw
上げたら切りがないな…
0656login:Penguin
2010/06/29(火) 21:17:15ID:hXbNgCIt結局、分節句切りすら晒してない。
それに便乗して偉そうに語った日本脳炎信者w
結局、Googleの中の人怒らせるわ、UTSUMI氏には迷惑かけるわ…
もうね、死んでしまえよw
>>595みたいな知ったか振りも死んでしまえw
上げたら切りがないな…
0657login:Penguin
2010/06/29(火) 21:18:46ID:D7+eznK60658login:Penguin
2010/06/29(火) 21:46:52ID:KBAUeBKshttp://code.google.com/p/mozc/issues/detail?id=16
よかったよかった
0659login:Penguin
2010/06/29(火) 21:59:15ID:D7+eznK6なるほどね
0660login:Penguin
2010/06/29(火) 22:14:34ID:KBAUeBKs第一候補 南アで
第二候補 ナンナで
不自然な感じがするのでたぶん無効にするかな
0661login:Penguin
2010/06/29(火) 22:23:40ID:/XiPgLe+本家辞書が充実してくれるのを期待するしかなさそうだね。
0662login:Penguin
2010/06/29(火) 22:31:26ID:D7+eznK6下手に一緒にコンパイルかけて一体化させるから勘違い野郎が増える。
0663login:Penguin
2010/06/29(火) 22:34:21ID:ozzcNwln0664login:Penguin
2010/06/29(火) 22:51:45ID:yJjHv7qAせっかくLinuxでまともな日本語入力がフリーソフトで開発されているのに開発者側も利用者側も不快になるような書き込みばかり。
もう少し楽しい話題をしないか?
0665login:Penguin
2010/06/29(火) 22:54:57ID:OS6yFplC楽しい話題を提供してくれ
0666login:Penguin
2010/06/29(火) 23:05:02ID:6VqNbmTh勘違い野郎とか言う方が勘違いしてる。
バイナリの動作に不満だったらそいつが自分でソース修正してコンパイルすればいいだけの話。
その為の情報を探しているんだろうから周りがごちゃごちゃ言う必要は何もない。
0667login:Penguin
2010/06/29(火) 23:08:26ID:yJjHv7qAそれもそうだな…
少なくともanthyのようなとんちんかんな文節区切りが無いのと、枯れた最小コスト法(コスト最小探索?)アルゴリズムでMS-IME程度の文節区切りを実現している点が良い。
俺は常用していてもう手放せないと感じている。
0668login:Penguin
2010/06/30(水) 07:36:56ID:LCHbCgjYRT @taku910: 憶測だけで動作アルゴリズムを
「さも専門家のように語る」Linuxユーザは本当に勘弁して欲しい。
たいてい間違ってるし。オープンソースなんだからソース読んでほしい。
アルゴリズムは語らない方がいい
>>667がソースを熟読した専門家ならいいけど
それに「MS-IME程度の文節区切り」ってのは感覚でしかないでしょ
自動テストして正解率を比較したのならあれだけど
開発者がいろんな考えを持つのは自由として、
「ですよねー」的な?RTをしている人たちばかりなのが気になった
0669login:Penguin
2010/06/30(水) 07:45:15ID:LCHbCgjYsrc/data/test/stress_test/sentences.txt
src/data/dictionary/collocation.txt
「ねこをかいたい」を変換すると「猫を解体」になる
0670login:Penguin
2010/06/30(水) 10:56:52ID:ituddthA何がいいたいのだ?
「アルゴリズムはソースコード読まないなら専門家以外語るな、と開発者がtwitterでつぶやいている。」
と
「MS-IME程度の文節区切りってのは感覚でしか無い。自動テストして正解率を比較したのならあれだけど」
との発言は矛盾していないか?
Mozcを利用する人はソースコード読まない&専門家以外は黙って使っていろという結論も出せるぞ。
日本語入力の利用者は変換効率を感覚で「良い」「悪い」と捉えるのが普通だと思ったが。
開発者が…のくだりは読解できなかった。
Mozcのストレステストの例は、「ねこをかいたい。」と句読点を入れたら「猫を飼いたい。」と正しく変換された。
まあ専門スレだから技術中心の話題をしたいということか?
行間から俺が勝手に読み取っただけだが。
0671login:Penguin
2010/06/30(水) 11:49:27ID:POSxyKofそのmozcは公式から落としてきて、自分でコンパイルした物?
それとも、非公式な所から落とした野良ビルドの物?
0672login:Penguin
2010/06/30(水) 12:46:27ID:LCHbCgjY空行そんなに入れなくていいよ
> 枯れた最小コスト法(コスト最小探索?)アルゴリズムで
?とかいってるから、
憶測で動作アルゴリズム語ると怒りだすかもしれんよと。
まあひょっとしたら>>667が専門家でソースも読んでいて、
MS-IMEとの比較も自動テストなり何かして確かな根拠があるのかもしれないけどさ。
なんにしてもその書き方じゃまた切れるかもしれんよと
ただ基本的なことを言うと、
takuさんのコメントは1つの考え方だけど私は賛同しないし、
「そーですねー」的に?RTしてる人たちばかりで
諌めるっちゅうか違う意見を言う「専門家」が誰もいないのが
ちょっと気になったなーというか気持ち悪いなーというか
素人ユーザにしてみりゃ変換結果が全てで、
そこからアルゴリズムっちゅうか何かの憶測をするのもありきたりな話で、
それが大外れだとしてもある意味あたりまえというか、
「本当に勘弁して欲しい」とは小せえなあと。
誤解があるならドキュメント書くなりして説明すりゃいいじゃん
> 「ねこをかいたい。」と句読点を入れたら「猫を飼いたい。」と正しく変換された。
Mozc-0.11.383.102 (「ばーじょん」と入力して変換) だけど変換されないよ。
~/.mozc を削除して再起動して変換してみて。
(知らずに非公式版使ってんじゃねえかなあ)
0673login:Penguin
2010/06/30(水) 12:51:49ID:Rcg/NbLp他力本願だな。
0674login:Penguin
2010/06/30(水) 15:33:01ID:ukEf+Mdo細かいことは気にすんな。
0675login:Penguin
2010/06/30(水) 15:37:09ID:doYQnZyx0676login:Penguin
2010/06/30(水) 15:48:58ID:r/2ENvNO0677login:Penguin
2010/06/30(水) 16:09:17ID:doYQnZyxまあ、その内実装されるでしょう。多分w
0678login:Penguin
2010/06/30(水) 18:00:18ID:pwJmuJKzソース読まない奴は語るなとかいう開発支援スレが2chに欲しいのならム板にでも立てたら良いと思うんだけど。
0679login:Penguin
2010/06/30(水) 18:07:13ID:doYQnZyxいやいや認識おかしいでしょ。
デフォルト以外の辞書入れて、バグだなんだと騒ぐ方がおかしいわけで。
デフォルト版で検証しないで騒ぐこと自体が間違い。
Googleの人だって、私家辞書落としてきて調べたりしてくれてるんだし、
使う人が他力本願なのが根本的に間違ってるんだよ。
ここで騒ぐことで開発が遅れてしまってるって事を少しでも考えたほうがいいと思う。
0680login:Penguin
2010/06/30(水) 18:10:56ID:JNIOOCJkおれも無効にするな。
ていうか、ローマ字タイプミス修正機能はいいとして、変換候補に混ぜこむんじゃなくて、サジェスト的に
表示すりゃいいのに。
>>672
「そーですねー」と思わない人は黙ってるんだと思うよ。2chじゃないんだし。
カッコとカッコ閉じの、片方を変えるともう片方を自動で合わせてくれるのが何気に嬉しい。
0681login:Penguin
2010/06/30(水) 18:11:40ID:pwJmuJKz公式に乗り込んでいって騒ぐのはバカだけど。
0682login:Penguin
2010/06/30(水) 18:16:15ID:KlM7I6oY0683login:Penguin
2010/06/30(水) 18:16:59ID:doYQnZyxじゃなかったら、コメント出すとは思えないし。
公式で初期の頃にだしてる要望とかバグ報告に回答寄せてないのあるのに
日本脳炎だけ、コメント出すって事は見てるんだよ。
0684login:Penguin
2010/06/30(水) 18:18:27ID:pwJmuJKz0685login:Penguin
2010/06/30(水) 19:39:11ID:ukEf+Mdoまあディレクトリをリネームして試せばいいと言いたいのだろう。行間を読んでみたが。
野良ビルドだろうが公式ビルドだろうが自前ビルドだろうが個人的にmozc日本語入力自体は使いやすいから開発者には感謝している。
いったい何を議論しているんだ?
0686login:Penguin
2010/06/30(水) 19:41:00ID:pwJmuJKzデフォルトで報告しろというのは、開発者(ハッカー)が環境を再現するため。
いじっていなければ責任があるだのそんな話のほうがおかしい。
もしなにかお仕着せたいのなら、当然そういうライセンスにしているだろう。
0687login:Penguin
2010/06/30(水) 19:42:51ID:TBI0xEi8感謝してるとかそういう話じゃないことは確か
0688login:Penguin
2010/06/30(水) 19:50:54ID:ukEf+Mdo了解。
0689login:Penguin
2010/07/01(木) 02:04:58ID:O1Rx4a6P0690login:Penguin
2010/07/01(木) 17:11:32ID:eMXnGfuNが出ねぇ
既存設備
既存顧客
なんてのは出る
辞書にないだけ?
0691login:Penguin
2010/07/01(木) 17:31:56ID:80xQIa/W0692login:Penguin
2010/07/01(木) 17:33:01ID:oD/W1S7fきそんでやってみろ
>>辞書にないだけ?
こんなこと書くと袋だたきにあうぞ
神はソースを見れるやつ以外は発言するなと言っている
↓
http://twitter.com/taku910/status/17096522332
0693login:Penguin
2010/07/01(木) 17:35:59ID:JQPkG31latokx3に切り替えれば幸せになれるよ
0694login:Penguin
2010/07/01(木) 17:37:35ID:oD/W1S7f変換について文句があっても、ソースを見てアルゴリズムを理解した奴以外は
黙ってろ。わかったな
0695login:Penguin
2010/07/01(木) 17:47:37ID:eMXnGfuN0696login:Penguin
2010/07/01(木) 17:51:28ID:8YRnsdtB> 「きぞん」と読むのは、本来は誤り。
なんだってよ。
ttp://dic.yahoo.co.jp/dsearch?enc=UTF-8&p=%E3%81%8D%E3%81%9D%E3%82%93&dtype=0&dname=0na&stype=0&pagenum=1&index=05088804253700
ついでにmozc r31でてる。
相変わらず何が変わったかわからないログ。
ソース読めってことですね、失礼しました。
0697login:Penguin
2010/07/01(木) 17:51:46ID:u6t0dJ7U0698login:Penguin
2010/07/01(木) 17:52:58ID:u6t0dJ7U・・・あれ?
0699login:Penguin
2010/07/01(木) 18:02:00ID:u6t0dJ7Udictionary1.txt:きぞんせつび 2234 2234 7728 既存設備
dictionary1.txt:きぞんこきゃく 2234 2239 7298 既存顧客
dictionary1.txt:きぞんじゅうたく 2234 2239 7271 既存住宅
dictionary1.txt:きぞんてんかぶつ 2234 2318 7746 既存添加物
じゃあこの辺は削除でおk?
0700login:Penguin
2010/07/01(木) 18:09:37ID:8YRnsdtBそーだねー。
ついでに既出だけど、
dictionary0.txt:ふいんき 2239 2239 5645 雰囲気
も削除してもらったほうがいいよねー。
ネタで使えないから。
ま、決めるのはオレじゃないけど。
0701login:Penguin
2010/07/01(木) 18:23:32ID:WtGrFZjB別に変換できてもいいんじゃない。
0702login:Penguin
2010/07/01(木) 18:24:08ID:jk6rV2dr* Ver. 0.12.402.102 on 2010-06-30
-- Yasuhiro Matsuda <mazda> Wed, 30 Jun 2010 13:22:54 +0900
mozc (0.11.383.102) lucid; urgency=low
* Ver. 0.11.383.102 on 2010-06-16
-- Yasuhiro Matsuda <mazda> Wed, 16 Jun 2010 15:39:33 +0900
mozc (0.11.365.102) lucid; urgency=low
* Ver. 0.11.365.102 on 2010-05-25
-- Yasuhiro Matsuda <mazda> Tue, 25 May 2010 16:54:03 +0900
mozc (0.11.354.100) lucid; urgency=low
* Ver. 0.11.354.100 on 2010-05-17
-- Yusuke Sato <yusukes> Mon, 17 May 2010 19:22:54 +0900
mozc (0.10.288.102) jaunty; urgency=low
* Ver. 0.10.288.102 on 2010-03-09
-- Hiroyuki Komatsu <komatsu> Tue, 09 Mar 2010 16:01:11 +0900
changelog ブッ飛んでんなぁ…
0703login:Penguin
2010/07/01(木) 19:19:55ID:dA7ZCbkv何故か変換出来るのに変な基準だ
0704login:Penguin
2010/07/01(木) 21:23:58ID:QNOaF+w5『憶測だけで動作アルゴリズムを「さも専門家のように語る」』のがダメなんだろ、
動作アルゴリズムを語るならソース読めってことだ。
0705login:Penguin
2010/07/01(木) 23:05:29ID:8YRnsdtBそれネタにマジレスってやつじゃないのか。
0706login:Penguin
2010/07/01(木) 23:48:10ID:NXCs2WvM無効になるのはshift+左右で区切りを変更した時だけ。
これはOK。
nihonnouenn => shift+右 => にほんお|うえん
これはNGのまま。
nannade =>
第一候補 南アで
第二候補 ナンナで
必死で「ローマ字スペル修正を無効にする」の項目を探しちまった
0707login:Penguin
2010/07/01(木) 23:58:29ID:8YRnsdtB> 無効になるのはshift+左右で区切りを変更した時だけ。
http://code.google.com/p/mozc/issues/detail?id=16
ではそういうことになってる。
「r32でやったお」と書かれてるが、実際はr31。
0708login:Penguin
2010/07/01(木) 23:59:06ID:NXCs2WvM朝昇竜
ごご
郵便番号辞書がちゃんと作られるようになったのと、
credits_*.html が追加されたのと、
バイナリの生成先がout_linuxになったのと、
xmlファイルの生成位置が変わったのと、
/lib/ibus-mozc/ibus-engine-mozc にパスが変わったのと、
ぐらいか。
debian/ubuntu以外でパッケージ作る人は毎回振り回されるのお
0709login:Penguin
2010/07/02(金) 00:08:36ID:rmeJlg4T0710login:Penguin
2010/07/02(金) 00:08:53ID:89cUsAe4そう。issue 16読み直したらそういうことかとがっかりした。
あそこ反応遅いし下手なこと言ったら揉めそうだしなあ
0711login:Penguin
2010/07/02(金) 00:18:23ID:89cUsAe4結構な勢いで飛んでった
賢い時とひどい時の差が激しいなあ
間隔が空いたんで辞書に大変更があるかと期待していたんだが
0712login:Penguin
2010/07/02(金) 00:33:47ID:c2/62KOPググッても朝昇竜ってのが出てくるからな。
馬鹿が大勢いるようだ。
馬鹿は死ね
0713login:Penguin
2010/07/02(金) 00:35:33ID:nMrk595a0714login:Penguin
2010/07/02(金) 01:13:12ID:fNK5e64Z> /lib/ibus-mozc/ibus-engine-mozc にパスが変わったのと、
/usr/lib/ibus-mozc/ibus-engine-mozc のままじゃね?
>>709
だからそれはwikiの更新だと何度言えば (ry
0715デムパゆんゆん@ルーピーズ
2010/07/02(金) 01:15:03ID:nEU/qQll朝立ちが収まらず嫁のパンツ引きずり下ろすんだろ
若い夫婦によくあること
0716login:Penguin
2010/07/02(金) 16:26:08ID:6ZhhasPq0717login:Penguin
2010/07/02(金) 18:56:58ID:tmua+Inw朝青龍
朝青龍明徳
しか出ない
0718login:Penguin
2010/07/02(金) 23:01:29ID:NGCZVs6o疑問に思うならソースを読め
0719login:Penguin
2010/07/03(土) 00:02:35ID:fNK5e64Z朝青龍、朝青龍明徳はもはやアンタッチャブルな雰囲気の例の人名辞書にある。
0720login:Penguin
2010/07/03(土) 00:02:52ID:DSeRllmA0721login:Penguin
2010/07/03(土) 03:23:29ID:mJCm1+DYubuntuユーザの線がつよいな、間違えて喚いているのは。
0722login:Penguin
2010/07/03(土) 03:46:57ID:osDO+o7j単語のコストを15000ぐらいの低めにすると変換候補に出てこない場合があるのですが
いくら以上だったら確実に候補に出てくるのでしょうか?
0723722
2010/07/03(土) 03:51:54ID:osDO+o7jぞうとう 2239 2239 15273 増頭
が出てきません。
0724login:Penguin
2010/07/03(土) 08:03:34ID:Gayxgvn6たまにはgentooさんのことも思い出してあげてください
0725login:Penguin
2010/07/03(土) 09:30:48ID:/RusR1qf「贈答」のスコア+100ぐらいだったら出るんじゃないですか。
憶測で語るなと怒られそうだけど。
自分で1000ずつスコアを減らして試してみてください。
10数回やれば答えが出ると思いますよ
誰の私家版辞書か知りませんが公式辞書以外を語ると
やっぱりGoogleさんが苦い顔をするので勘弁
0726login:Penguin
2010/07/03(土) 11:29:21ID:ijDcKIcn歴史辞典に載っているクラスの有名人だけでいい。
夜露死苦みたいな当て字のDQN人名なんか絶対いらね。
0727login:Penguin
2010/07/03(土) 13:29:07ID:i0Hzsx4Q巫山戯んな。そういうのは日本語変換の話をわざわざ英語で話すような場所にでも書いとけ。
公式ったってそもそも単なるIPADICの加工品で別に純正でもなんでもないだろ。
しかしICOT条項とやらは関係しないのかねえこれ。
0728login:Penguin
2010/07/03(土) 17:05:55ID:xhrL1imBくらかろ 2680 2680 9957 蒙かろ
つよう 2710 2710 12383 勍う
けっか 2234 2234 11491 缺課
も変換できないな。他にも沢山ある。
別の同音の言葉が沢山あっても変換できる場合もあれば
同音の言葉がないのに変換できない場合もある
0729login:Penguin
2010/07/03(土) 17:22:24ID:Gayxgvn6私家版辞書で使ってる奴は、それを作った奴のところで話をしろというだけの話だと思う
私家版辞書の変換候補の登録順位の問題までgoogleに押し付けるのはダメだろ
0730login:Penguin
2010/07/03(土) 17:31:13ID:i0Hzsx4Qここは林檎屋でも検索屋でもないよ。
それともキャッシュでここを見ていて勘違いでもしてんの?
0731login:Penguin
2010/07/03(土) 19:26:06ID:6kwkatsd他に優先度が強烈に高い単語があると、
多少のことでは他の単語がでなくなるね。
まあバランスを見て候補数を適当に絞るとそういうことになるんだろうね、
って推測で語るなって言われそうだが
0732login:Penguin
2010/07/04(日) 17:44:55ID:rTB+DtcVしてみるとか
と打とうとすると、なぜか途中でmozcが死亡する。
ので旧ビルドに戻した。
0733login:Penguin
2010/07/04(日) 17:55:58ID:/oZBUpT30734login:Penguin
2010/07/07(水) 02:21:37ID:gfyG56xquim-mozcでユーザー辞書ってどう反映させるの?
/usr/lib/mozc/mozc_tool --mode=dictionary_tool で辞書ツールに単語を
登録しても、肝心の uim-mozc の変換候補に反映されない……
0735login:Penguin
2010/07/07(水) 09:54:08ID:LbLHp4YOうちでは問題ないな。
0736login:Penguin
2010/07/07(水) 10:59:15ID:7/lcNwPK0737login:Penguin
2010/07/07(水) 12:30:25ID:5hffJYd60738login:Penguin
2010/07/07(水) 13:04:51ID:0T6OZxc7獲る/とる がない。
0739login:Penguin
2010/07/07(水) 13:51:17ID:LbLHp4YO0740login:Penguin
2010/07/07(水) 13:57:23ID:dhaU/Avr「とる」が間違いとも言えないんじゃね。
http://dic.yahoo.co.jp/dsearch?enc=UTF-8&p=%82%C6%82%E9&dtype=0&index=15681013538700
には「「穫る」「獲る」とも書く」とある。
0741login:Penguin
2010/07/07(水) 15:48:00ID:arkDi++C獲
〔音〕カク〈クヮク〉
〔訓〕える
とあるな。
0742login:Penguin
2010/07/07(水) 15:53:30ID:ibgrwrRpMozcに関して正しい日本語っていうのは、ギャグにしか聞こえないなw
0743login:Penguin
2010/07/07(水) 16:21:44ID:eoJolC+Y0744login:Penguin
2010/07/07(水) 16:24:21ID:CFzMSs9E0745login:Penguin
2010/07/07(水) 17:32:57ID:2tU+hFGz0746デムパゆんゆん@ルーピーズ
2010/07/07(水) 17:38:03ID:Nq72GyjF0747login:Penguin
2010/07/07(水) 17:59:59ID:x0DmD9TD0748デムパゆんゆん@ルーピーズ
2010/07/07(水) 18:04:56ID:Nq72GyjF0749login:Penguin
2010/07/07(水) 18:52:04ID:LbLHp4YOうん、わかってて書いてます。
>>742 と同感で、皮肉を込めて。
0750login:Penguin
2010/07/07(水) 18:54:32ID:dhaU/Avr0751login:Penguin
2010/07/07(水) 20:24:07ID:DUPoVHAZhttp://pc12.2ch.net/test/read.cgi/tech/1240851827/
0752login:Penguin
2010/07/07(水) 21:20:30ID:gfyG56xqごめんなさい。
uim を入れ直したときに、mozc が unregisuter されて
いつの間にか anthy になってたというオチでした。
そら反映されんわな……
0753名無しさん@そうだ選挙に行こう
2010/07/11(日) 18:44:57ID:fnG/9xmH切り替わらないな。変換自体はちゃんと次ページ以降の候補が選べるんだけど。
0754名無しさん@そうだ選挙に行こう
2010/07/11(日) 18:55:41ID:oYxx0F+Euim 1.5.7 のリリースバージョンだとその症状だった。
svn 先端では修正されてるはず。
0755名無しさん@そうだ選挙に行こう
2010/07/11(日) 19:57:06ID:fnG/9xmHヘー、uimの問題なん?
Anthyだと問題ないんだけど。
ちょっとHEADでやってみっか。
サンクスコ。
0756login:Penguin
2010/07/12(月) 20:28:19ID:jl3YeuYq変更点ですか?
モードアイコンのモード表示に変更があったようですけど、
その他のたくさんの修正点はソースを見てください。
0757login:Penguin
2010/07/14(水) 14:32:21ID:KzaUL5HE公開停止にしたことでUTSUMIさん辞書搭載版mozcがゾンビ状態で出回ってどっかでトラブったんかな。
人名辞書はユーザ辞書にして重宝してたので個人的にはありがたい。
システム辞書に入れる気はないけど。
0758login:Penguin
2010/07/16(金) 14:58:58ID:3jcOIbqL0759login:Penguin
2010/07/17(土) 11:49:53ID:Fp+heB0t0760login:Penguin
2010/07/24(土) 14:28:32ID:1IbcTVQB0761login:Penguin
2010/07/24(土) 14:55:40ID:HvKMLpfC過去 debian で firefox 仕様にしていたら
"check off"[update] でも seamonkey に成る…
あちら系の関係ですか?
0762login:Penguin
2010/07/24(土) 18:55:08ID:9gH7KxjX0763login:Penguin
2010/07/24(土) 19:15:44ID:HvKMLpfC当時 directory 把握は error を見ながら訂正したのですが…
0764login:Penguin
2010/07/28(水) 20:29:16ID:D6c+m0Eo0765login:Penguin
2010/07/30(金) 17:54:09ID:GffOAF0Dたぶん1桁は足りない。
0766login:Penguin
2010/07/30(金) 18:22:07ID:99W6fMHU良かったな。
0767login:Penguin
2010/08/01(日) 16:48:41ID:5pdxa+aPそれはない
0768login:Penguin
2010/08/06(金) 20:59:20ID:sTZtUQm70769login:Penguin
2010/08/06(金) 21:08:57ID:jE+lZ2jQ辞書データも全然甘いし。
はっきり言えば、SKKのほうが使いやすい。
0770login:Penguin
2010/08/06(金) 23:03:40ID:0lOPlxTvあれですか? どっかの野良ビルドを使ってらした方ですか?
0771login:Penguin
2010/08/06(金) 23:08:10ID:sTZtUQm7アイコンだったけど今はオレンジ系に統一されてる。
0772login:Penguin
2010/08/06(金) 23:26:54ID:0lOPlxTv誰が用意したPPAか知らないけど、r36 までは公式アイコンはなかった。
今のオレンジのが公式のやつ。
今までGoogle日本語入力と同じアイコンだったなら、ライセンス違反だっただろそれ。
どーでもいいけどGoogle日本語入力って略称とかないの?
0773772
2010/08/06(金) 23:28:01ID:0lOPlxTv○ r35 までは公式アイコンはなかった。
0774login:Penguin
2010/08/06(金) 23:29:09ID:0lOPlxTvやだもう死にたい。
0775login:Penguin
2010/08/06(金) 23:31:46ID:0lOPlxTvスレ汚しスマヌ。
0776login:Penguin
2010/08/08(日) 01:31:45ID:51xMySObノアやホノカはダメだった。
0777login:Penguin
2010/08/08(日) 06:52:24ID:IfBBRBOq俺はもうmozcは捨てることにした。バイバイ。
0778login:Penguin
2010/08/08(日) 11:33:19ID:PGVmySnkどーせGoogle日本語入力用にまとも(?)な辞書があるから、こっちはまじめにやる必要
もないしね。
そいでもってローマ字入力修正機能みたいなどーでもいい機能のせいで外部の
辞書作成の敷居が上がってるし。
品詞IDが固定じゃないのもさらに上げてんのかな?
ソース読んでもわかんないからテキトーなこと言ってますけどね、ええ。
それにしても学習するとだんだん馬鹿になってくるような気がしてならない。
こっちもソース読んでませんすいません。
0779login:Penguin
2010/08/08(日) 21:37:40ID:Z4ZB7QcGローマ字入力修正はどーでもいい機能じゃないと思うけど。
本気出してコストをつける気がない人が適当にコストつけた辞書のせいで、
変な変換になったということでしょう。
誰が本気出すか次第じゃないかね。
0780login:Penguin
2010/08/08(日) 21:46:42ID:y1VeXr1c「変換エンジンが起動できなかったからリブートしてくれ」ってメッセージが
出るようになったんだけど、俺だけ?
0781login:Penguin
2010/08/08(日) 21:51:11ID:KlWggXGJ0782login:Penguin
2010/08/08(日) 22:06:33ID:y1VeXr1c> 36-1: If mozc fails in activation with message "Cannot start
> conversion engine. Please restart your computer."/"変換エンジンプログラ
> ムの起動に失敗しました。新しい Mozcを利用するためにコンピュータを再起動
> してください。", try to reboot your system.
って書いてんだよね。既知の問題か、少なくとも起こり得る可能性は予想されてる
問題っぽいんだけど、同じ症状の人いないのかな。
0783login:Penguin
2010/08/08(日) 22:12:46ID:PGVmySnkメッセージのとおりリブートしてからは発生してない。
0784login:Penguin
2010/08/08(日) 22:14:17ID:PGVmySnk0785login:Penguin
2010/08/08(日) 22:18:14ID:45Sd/+yE0786login:Penguin
2010/08/08(日) 22:29:44ID:y1VeXr1c今ちょこっと調べてみたら、どうやら .mozc 以下にある .session.ipc というファイルを
消せば一応起動することがわかった。
消さずにパーミッション(デフォでは400)を変えてみたりしたが、それではだめだった。
これは一々消していいもんなんだろうか?
0787login:Penguin
2010/08/08(日) 22:43:23ID:PGVmySnkソース読めないんから細かい言及はできないんで。
> ローマ字入力修正はどーでもいい機能じゃないと思うけど。
いろいろ理由を書こうと思ったけど、長くなったのでやめた。
それにいらねえと言ってもなくならなさそうだし。
せめてオプションでオン・オフできるようにはして欲しい。
> 本気出してコストをつける気がない人が適当にコストつけた辞書のせいで、
> 変な変換になったということでしょう。
ローマ字入力修正機能がなければ、変換効率や性能が落ちたとしても、くだんの
変な誤変換はしなかった。
品詞IDが固定じゃない件はよくわからないのでノーコメント。
UTSUMIさんの辞書を取り込むことは可能と思ってるらしいから、そのへんうまく
やってほしいなと思ってる。
0788login:Penguin
2010/08/08(日) 22:51:44ID:lbbBc1Zrビルドは何事もなく終了してるんだが・・・
.mozc消してもダメだ、タコな俺にはお手上げw
0789login:Penguin
2010/08/09(月) 01:46:55ID:JUJOlGhxhttp://code.google.com/p/mozc/issues/detail?id=19&can=1
0790login:Penguin
2010/08/10(火) 16:04:41ID:0Od+yftI「ファイル」「タバコ」「イクラ」などカタカナ言葉の日本語を原語のアクセントで読むのは間違い。
これらのアクセントを間違えて発音していると日本人である事を疑われるので気を付けるように。
0791login:Penguin
2010/08/10(火) 17:54:14ID:ucwzsgm30792login:Penguin
2010/08/11(水) 11:00:04ID:iYJXMA6nオプションでオンオフできるようになっているといいというのは分かる。
予測入力はオンオフできるので、そうすればいいと思うけどね。
ローマ字入力修正機能がなければ変な誤変換がない、というのは誤解で、
そもそも変な誤変換が起きた原因は適当にコストをつけたせい。
ローマ字入力修正機能がなくても(あそこで露見しなかっただけで)変な誤変換をするはず。
砂の上に城を建てて地震で全部壊れて「地震が起きたせいだ」と言うようなものだが、
そもそも砂の上に建てるのが悪いわけで。
品詞IDを固定にしないのは、まだ精度が向上できると思っているからでしょう。
「精度はもうこんなものでいいからメンテナンス性を上げてくれ」という要望はあるだろうが、
「もっと精度を上げてくれ」という要望もあるんじゃないかな?
いま品詞増やしているところなんだから、落ち着くまで待ってみては。
0793login:Penguin
2010/08/11(水) 12:05:43ID:k5+025hu> ローマ字入力修正機能がなければ変な誤変換がない、というのは誤解で、
いやいや、「くだんの変な誤変換」というのは、日本脳炎の件ようなことを指していて、
ある一定の条件で「にほんおうえん」が「日本脳炎」に変換されるというのは、
コスト付けが適当だったせい+ローマ字入力変換機能のワンツーパンチで発生した。
> いま品詞増やしているところなんだから、落ち着くまで待ってみては。
うん、待ってる。
だけど、それってmozcのため "だけ" の作業なのであんまし期待してない。
そっちよりDebian (ていうかNIIBEさん) が引き継いだAnthyの方に
ひそかに期待してる。
0794login:Penguin
2010/08/11(水) 17:56:10ID:RKWCzkwj辞書をつくるためのコーパスの量を数ケタ上げるしかない。
でも、そんな量のコーパスを用意するのは、
google IMEでは可能でも、mozcでは不可能。
残念でした。
0795login:Penguin
2010/08/12(木) 01:20:10ID:R2+IxwA80796login:Penguin
2010/08/12(木) 04:20:34ID:vRk0mlkLhttp://code.google.com/p/mozc/issues/detail?id=21&can=1
を参照。
次のアップデートでなおる模様。
0797login:Penguin
2010/08/12(木) 12:33:25ID:jxSVdslBいやいや、つまりそもそもコスト付けを適当にしなければ発生しないわけで。
両方の条件が揃ったときに発生するのはその通りだけど、
直すべきは適当なコスト付けのほうであり、ローマ字入力訂正機能ではないと。
品詞体系の整備は別に Mozc のためだけじゃないと思うよ。
統計的な IME であればどれでも恩恵があるはず。
事実上統計的でオープンソースな IME 自体が少ないので Mozc のためだけになるかもしれないけど…
0798login:Penguin
2010/08/14(土) 02:37:15ID:e75fvtZ6そして、不具合直った!
中の人GJ!
0799login:Penguin
2010/08/27(金) 06:20:41ID:JNfYRWcD0800login:Penguin
2010/08/27(金) 09:25:27ID:Y8H/0QBmなんで?
0801login:Penguin
2010/08/27(金) 09:57:03ID:4AwcYRnahttp://bugs.debian.org/cgi-bin/bugreport.cgi?bug=591731
0802login:Penguin
2010/08/28(土) 04:29:10ID:3/mAytNoコスト付け直すのは対症療法って気がするけどね。
訂正機能使いたい人はトレードオフでいいけど、
そもそも余計なお世話だとしか思えない人にはすっきりしない話だと思うんだ。
0803login:Penguin
2010/08/28(土) 04:49:18ID:3/mAytNoもしかして>>727辺りの話が不明確って事なんだろうか?
この際、フリーな変換辞書データの決定版を目指すプロジェクトでも立ち上がらないものかな?
wikipedia辺りは使えるんだろうか?
0804login:Penguin
2010/08/28(土) 05:40:00ID:JuoBlAAnUIも他のIMEのモノマネでしかない。
どこがいいの?
0805login:Penguin
2010/08/28(土) 07:54:44ID:ivXPl8T9プラシボ
0806login:Penguin
2010/08/28(土) 13:54:28ID:+rnQGJGEAnthyよりはずっと良いじゃん
0807login:Penguin
2010/08/28(土) 14:17:08ID:sk8QD7aO単文節変換ばっかしする人は辞書があれだからダメな子になってしまうかも。
UIにオリジナリティが必要かどうかはさておき、SCIMが死んだ今、まともなGUI
設定ツールがあるのは珍しい方なんじゃない?
0808login:Penguin
2010/08/28(土) 14:42:58ID:l8RYa1bV0809シベリアより代筆
2010/08/28(土) 15:16:50ID:0GiDpPnI問題にされているのはmozcが使っているmecab-ipadicは、ICOT projectの
成果を含んでいて、そのICOT projectのsoftwareのlicenseにdebianが問題と
している箇所が含まれている、ということ[1]
mecabの開発者さんの見解としては[2]から始まるスレッドで見ることが出来る。
Fedoraではfreeという扱いになっている[3]
[1] http://code.google.com/p/mozc/issues/detail?id=20
[2] http://sourceforge.jp/projects/mecab/lists/archive/devel/2007-March/000053.html
[3] http://pkgs.fedoraproject.org/gitweb/?p=mecab-ipadic.git;a=blob_plain;f=LICENSE.Fedora;hb=HEAD
0810login:Penguin
2010/08/28(土) 15:33:26ID:k7yOs/j40811login:Penguin
2010/08/28(土) 19:38:05ID:z5KVaVXE辞書データのライセンスが混在していて分離されていない、分離できない、というのも問題みたいだね。
0812login:Penguin
2010/08/28(土) 19:59:01ID:Zaq5K9Ul.mozc消したら直った。
0813login:Penguin
2010/08/31(火) 07:17:18ID:jJOblZ05http://sourceforge.jp/projects/naist-jdic/wiki/FrontPage
0814login:Penguin
2010/08/31(火) 18:05:08ID:RLfgoPrYmozcのバグ報告みれ
0815login:Penguin
2010/09/05(日) 23:36:40ID:xp7KhwGHr38 再コンパイルもエラーで終了。
俺可哀想過ぎるorz
0816login:Penguin
2010/09/07(火) 23:24:50ID:CwjV4LZ+> 俺可哀想過ぎるorz
べつにかわいそうでもないけどw
0817login:Penguin
2010/09/09(木) 01:22:31ID:TQLx6zsN0818login:Penguin
2010/09/10(金) 12:33:50ID:1Kd4Yrgy0819login:Penguin
2010/09/10(金) 18:04:59ID:SFywMLYY0820login:Penguin
2010/09/11(土) 07:33:29ID:yAZGOqGd0821login:Penguin
2010/09/17(金) 17:32:26ID:WcFBVINN0822login:Penguin
2010/09/17(金) 17:36:21ID:ByukVjC9「きょにゅ」でもいいけど
0823login:Penguin
2010/09/17(金) 18:35:24ID:GG5LMtePきょにゅ→巨乳ちゃん
なるほど…
0824login:Penguin
2010/09/17(金) 18:59:49ID:8/VWxC/+2010 年 9月 17日 Posted by 小松弘幸 (ソフトウェアエンジニア)、Google 日本語入力チーム
IME の開発に興味はありませんか? Google 日本語入力のソースコードを、
ぜひ一緒にレビューしましょう!
http://googlejapan.blogspot.com/2010/09/google-techtalk-2010.html
0825login:Penguin
2010/09/22(水) 20:26:31ID:X/9cekMi- Google Japan Blog: Google 日本語入力の開発版をアップデートしました。(0.13.481.10x)
http://googlejapan.blogspot.com/2010/09/google-01348110x.html
0826login:Penguin
2010/09/22(水) 21:43:49ID:F0l06Qmnオープンソース版の変更点
* Emacs 版のクライアントを追加しました。
ぉう、これほんと?
見つかんないんだけど...
0827login:Penguin
2010/09/22(水) 22:06:27ID:pWIvGOYpもともとuim.elつかってたので戻す。
0828login:Penguin
2010/09/22(水) 23:02:21ID:rgyB8Mm0問題はこのマシンにemacs が入っていないので試せねー。
0829login:Penguin
2010/09/23(木) 18:07:52ID:SBBdUYRw0830827
2010/09/23(木) 18:40:50ID:quxmjrz/ibusでr41の動作確認したときにやってみてたんだけど、アップデートが
ちゃんと出来てなかったのかも。
スレ汚しスマヌ。
そしてやっぱりibusきらい。
0831login:Penguin
2010/09/24(金) 17:34:14ID:3DEFrRRxただしイケメンに限る
0832login:Penguin
2010/09/24(金) 19:20:54ID:BC9Pkfca0833login:Penguin
2010/09/24(金) 20:09:36ID:1LIkZb8Uhttp://www.youtube.com/watch?v=Th6FlAZ_ahI
0834login:Penguin
2010/09/25(土) 07:53:41ID:RCTzX7GQ0835login:Penguin
2010/09/25(土) 09:49:18ID:2adu9YVq0836login:Penguin
2010/09/25(土) 15:12:18ID:wQkN7rAV0837login:Penguin
2010/09/25(土) 15:12:38ID:VRp9GGyi0838login:Penguin
2010/09/25(土) 17:42:57ID:khuwLGQ0とにする。つうかキーバインドがよくわからん。
0839login:Penguin
2010/09/25(土) 18:46:54ID:2adu9YVq0840login:Penguin
2010/09/25(土) 23:12:45ID:nGKHzadd0841login:Penguin
2010/09/26(日) 13:29:05ID:hX7i4Dgr"なら" -> "平城"って変換できるぉ!
0842login:Penguin
2010/09/26(日) 13:40:16ID:vCUB+uv70843login:Penguin
2010/09/26(日) 13:53:14ID:/Glmu/y/data/dictionary/dictionary04.txt:なら 2314 2314 4579 奈良
2個も入ってるけど。
0844login:Penguin
2010/09/26(日) 14:31:02ID:eSCwk+520845login:Penguin
2010/09/26(日) 15:34:05ID:6TiQ5RJJ普通に一発目で奈良だけど?
0846login:Penguin
2010/09/26(日) 16:27:28ID:WmRYH9FB0847login:Penguin
2010/09/26(日) 16:51:16ID:rsEgOLfv辞書構築がしやすいわけでもないし、
変換精度が高いわけでもないし、
UIが優れているわけでもない。
俺には、mozcを使う理由なんて全く思い浮かばないのだが。
0848login:Penguin
2010/09/26(日) 16:53:37ID:Ymi6r02Y0849login:Penguin
2010/09/26(日) 17:11:42ID:9+UCu5v3ネットスラングと誤用がそのまま採用されているところ
0850login:Penguin
2010/09/26(日) 17:15:31ID:KT4cqV400851login:Penguin
2010/09/26(日) 17:26:03ID:rsEgOLfvつまり、ちゃんとした文章を書くためには、
役に立たないどころか誤用に誤変換してしまう危険があるわけね。
やっぱ使わないほうがよさそうだ。情報ありがと。
0852login:Penguin
2010/09/26(日) 17:26:52ID:Hf1lPK+Z0853login:Penguin
2010/09/26(日) 17:34:27ID:9+UCu5v3向き不向きだと思う。
ビジネス文書ならATOKなど。
ネットで友達とチャットなら向いているんじゃないかな。
0854login:Penguin
2010/09/26(日) 17:36:16ID:/Glmu/y/0855login:Penguin
2010/09/26(日) 18:56:00ID:rsEgOLfv0856login:Penguin
2010/09/26(日) 19:04:07ID:aUx6Fguuメリットが無いと感じたり、メリットがわからないなら
使わなくていい。今使っているIMを使えばいいだけ。
0857login:Penguin
2010/09/26(日) 19:54:01ID:ald5QX3uUbuntu 10.10で動く
0858login:Penguin
2010/09/26(日) 23:31:20ID:2rGf+/wd0859login:Penguin
2010/09/27(月) 15:11:45ID:OqBUobBY0860login:Penguin
2010/09/27(月) 16:05:55ID:8gPT3rDI動くことは無いですよね?
0861login:Penguin
2010/09/27(月) 17:53:14ID:UG87n7WPそんなの候補として出されても邪魔なだけじゃん。
1文まるまる使えるパターンなんて、シグとかぐらいなもの。
そんなものIMで処理するもんじゃないでしょ。
0862login:Penguin
2010/09/27(月) 18:00:43ID:J340F3gD0863login:Penguin
2010/09/27(月) 23:25:11ID:SZMlYcZR脳弱乙w
0864login:Penguin
2010/09/28(火) 00:42:37ID:2Yr+n8GJ「ブルガリアのリズムによる6つの舞曲」とか「弦楽器、打楽器とチェレスタのための音楽」とかまるっと出してくれて地味に便利。
0865login:Penguin
2010/09/28(火) 01:33:57ID:RrY3TIFh「文相」と「分掌」しか出ないんだけど辞書に入ってないわけじゃないよね
0866login:Penguin
2010/09/28(火) 01:36:21ID:P1oAQUGt0867login:Penguin
2010/09/28(火) 01:36:43ID:L5X8WWGg0868login:Penguin
2010/09/28(火) 01:41:46ID:P1oAQUGt0869login:Penguin
2010/09/28(火) 02:10:40ID:l4n47dOtdata/dictionary/dictionary02.txt:ぶんしょう 2249 2249 7633 文相
data/dictionary/dictionary02.txt:ぶんしょう 2249 2249 4144 文章
data/dictionary/dictionary04.txt:ぶんしょう 2244 2244 6243 分掌
0870login:Penguin
2010/09/28(火) 03:51:39ID:RrY3TIFh辞書から消えた場合の解決方法ってある?
0871login:Penguin
2010/09/28(火) 04:28:36ID:gLaQasZLあと非公式版を使ってないか確認。
0872login:Penguin
2010/09/28(火) 10:53:22ID:l4n47dOt公式版で、かつ、>>871で「文章」が出てくるようになったら、~/.mozc.bakを添えてバグ報告。
0873login:Penguin
2010/09/28(火) 21:35:39ID:Q6wOgmtu俺もなった。
昨日、バッテリ切れで電源落ちたから、
~/.mozc/*.dbのどれかが壊れたのかも。
ところで、
「Google 日本語入力 Cloud API」公開、ウェブアプリから利用可能に
http://internet.watch.impress.co.jp/docs/news/20100928_396586.html
0874login:Penguin
2010/09/28(火) 21:54:51ID:l4n47dOt今日だまってMac対応のアップデートがあったのはここで発表するためか。
0875870
2010/09/29(水) 03:17:29ID:ns6tiDTL>>871-872
憩いの場さんのレポジトリからとってるけどこれって「非公式」なのかな
(ubuntu japanese testersのは更新履歴見てビルドが遅いっぽいので躊躇してる)
~/.mozcを消して再起動かけてみたけど「ぶんしょう」はやっぱり「分掌、文相」になってる
>>873
治った?
俺は*.db削除しても治らないから別のところに問題があるのかなーと漠然と思ってる
0876login:Penguin
2010/09/29(水) 03:38:29ID:QKubjNqg0877login:Penguin
2010/09/29(水) 04:34:21ID:6KSIPXlcうんUbuntu なら以下の一番下の「Build and install debian package」ってとこ見ながらやれば簡単にbuild 出来るよ
http://code.google.com/p/mozc/wiki/LinuxBuildInstructions
でなけりゃpkg 作った人に聞かないとどうしようもないかも
0878login:Penguin
2010/09/29(水) 05:32:55ID:/glgyfL2他にも何かやってるのか?
0879login:Penguin
2010/09/29(水) 12:14:27ID:2lLk13eq0880login:Penguin
2010/09/29(水) 12:36:04ID:t8J7jq8M~/.mozcの再作成、再ログインは保留して、ちょっと調べてみたら、
mozc_serverが二つ起動してるのが原因だったみたいです。
pidが近かったので、たぶんほぼ同時に起動されたのでしょう。
そうなった原因、辞書がおかしくなる原因は、
調べてみても良く分からなかったです。
~/.mozc/.server.lockとかあるのに謎。
0881870
2010/09/29(水) 13:04:33ID:cP9zlQ0uここ見てたならホント申し訳ない
0882login:Penguin
2010/09/29(水) 17:12:32ID:DtUJOvfH>>870
0.13.464.102は「文章」が変換できなかった
「奈良」も変換できなかった
「女子高生」も変換できなかった
他にもいろいろ変換できなかった
http://code.google.com/p/mozc/issues/detail?id=25
0.13.481.102で直った。それだけ
これからはバージョンも書こうね
0883login:Penguin
2010/09/29(水) 17:37:20ID:yxSbb7LS0884login:Penguin
2010/09/29(水) 17:39:51ID:x/IXVaqTおk!
バージョン、で変換
Mozc+dict-0.13.492.102-20100925
0885login:Penguin
2010/09/29(水) 18:43:43ID:/eGHMNbBこんなかんじかな。JD用から流用。
[バージョン] ※「バージョン」で変換すると出てきます。
[ディストリ ]
[入手先 ] ※自分でビルドしたか、他の某かを利用したか
[IMフレームワーク] ※ ibus/scim/uimとそのバージョン
[ DE/WM ]
[ そ の 他 ]
0886login:Penguin
2010/09/29(水) 19:13:57ID:9J3vX4Lw[ディストリ ] Vine Linux
[入手先 ] Vine Linux
[IMフレームワーク] わかりません
[ DE/WM ] わかりません
「にほんおうえん」で変換すると「日本脳炎」になります
0887login:Penguin
2010/09/29(水) 19:41:07ID:ns6tiDTL了解
自分の環境も伝えずにお騒がせして申し訳ない
>>886
DEはデスクトップ環境(GNOME/KDE/Xfce/LXDEなど)
WMはウィンドウマネージャ(*box/Enlightenmentなど)
0888login:Penguin
2010/09/29(水) 21:27:26ID:/glgyfL2だったか?
治ってるやん
0889login:Penguin
2010/09/29(水) 22:21:30ID:/eGHMNbB0890login:Penguin
2010/09/30(木) 04:00:54ID:ce6BiX+Aなにこれひどい
mozcしょぼ
0891login:Penguin
2010/09/30(木) 05:57:07ID:Gp8vwa0f日本語の教科書の内容を英語で話し合うGHQみたいな感じだよな
0892login:Penguin
2010/09/30(木) 12:01:35ID:xa1VTI2uぜひそれを教えて欲しいものだ。
0893login:Penguin
2010/09/30(木) 12:32:11ID:PWQlmZSZ0894login:Penguin
2010/09/30(木) 13:35:44ID:U9PQ1yqe0895login:Penguin
2010/09/30(木) 19:04:16ID:Nb6AHyv3いんすとーるごはさいきどう
↓
インストール|ごは|再起動
インストール|語は|再起動
インストール|五は|再起動
↓
「後は」が候補にないので文節を区切る
↓
インストール|五|は|再起動
↓
インストール|後|A|再起動
(勝手に「は」が「A」に変わる)
↓
インストール|後|は|再起動
(Aを戻してようやく完成)
「インストール後は再起動」を出すのにこんな苦労をするとはwww
0896login:Penguin
2010/09/30(木) 19:32:45ID:9b3vWA+vそんなわけないだろ
と思って実際やってみたらその通りだったので
もう寝る
0897login:Penguin
2010/09/30(木) 20:56:27ID:ih442tF7普通の変換なら出来るんだけど。
0898login:Penguin
2010/09/30(木) 21:31:43ID:d7Y12y38>>890
お前ちょっと前のレスすら読めないのか?
0899login:Penguin
2010/09/30(木) 22:09:47ID:d7Y12y38インストール後に再起動って一発で出ますけど?
Mozc-0.13.492.102
わざわざ学習履歴クリアしたり、~/.mozc変名したりさせられちゃったぜ。
バグの数や内容とかは別にいいんだが、バグトラッカーをまともに扱ってくれない
開発の姿勢は気に入らないな。
0900login:Penguin
2010/09/30(木) 22:09:57ID:CHT68SLm0901899
2010/09/30(木) 22:17:27ID:d7Y12y38いろいろスマヌ。
0902login:Penguin
2010/09/30(木) 22:55:31ID:h9klHe/Xインストール後に再起動
どうせ自分でbuildしないカスが騒いでるだけだろ
0903login:Penguin
2010/10/01(金) 00:32:49ID:CxVFvXg40904899
2010/10/01(金) 00:51:29ID:mU0opg4u問題が出るのは、
「インストールごは云々」
>>899は確認した日本語が間違ってる。
お前も俺と変わらないくらいスレ読んでないな。
0905login:Penguin
2010/10/01(金) 01:52:19ID:/IlMpmD7Mozc+dict-0.13.492.102-20100925
インストール後は再起動
マイクロソフトが同じようなバグを出すと叩かれまくるだろうな
0906login:Penguin
2010/10/01(金) 02:12:13ID:5wTYb02R>>902
>>903
日本脳炎で騒いだのオマエラだろ?
0907login:Penguin
2010/10/01(金) 02:36:44ID:9Vrrr1f10908login:Penguin
2010/10/01(金) 03:20:53ID:nICHhQiX水泳後はシャワーを
卒業後はニートに
ジョギングごは入浴する(でない)
運動後は水分補給を
なんとなく法則性があるか気がする
0909login:Penguin
2010/10/01(金) 06:50:00ID:iXUp9Nc+ほらよ
インストール後は再起動
普通に変換できるんだが?
やっぱり自分でbuild出来ないカスが騒いでるだけか
0910login:Penguin
2010/10/01(金) 07:11:08ID:iXUp9Nc+アップデート後は設定を変更する
ジョギング後は入浴する
やはりカスだ
>>906
あれは実際に、n音のリエゾンがバグってたと思う
今は問題ない
0911login:Penguin
2010/10/01(金) 07:11:36ID:K8bUKdQW公式版で間違いなく再現するんだろう。
ただこれ結構痛いバグにも関わらず
9月10日に投稿して中の人の返信が9月28日。
対応の悪さが気になるなあ。
0912login:Penguin
2010/10/01(金) 08:04:38ID:aw+AKu1CSawaさんの辞書では、20100914版でその問題(issue 22)に独自に対応済
0913login:Penguin
2010/10/01(金) 16:12:14ID:JR0VSmEgmozcが開発版っていう位置づけのことを忘れてないか?
文句があるならAnthyでも使ってろ。
Google神に意見するなんてお前何様だ?
渋谷駅のセルリアンタワーに向かって土下座しろ
許しを乞え
0914login:Penguin
2010/10/01(金) 16:19:20ID:YFka5g5Kお前さんのMozcのバージョンを晒してくれないかな。
> あれは実際に、n音のリエゾンがバグってたと思う
> 今は問題ない
あれはオリジナルじゃない辞書を使った場合に発生した。
オリジナルにはそもそも日本脳炎問題はない。
0915login:Penguin
2010/10/01(金) 16:20:54ID:/Hi9hMTn0916910
2010/10/01(金) 16:50:41ID:+lncwQecMozc-0.12.410.102
Ubuntu10.10のMozcを10.04でbuildしたMozcだボケ
公式版だぞボケ
やはりカスだ
0917login:Penguin
2010/10/01(金) 16:50:54ID:H/Tnt3iW今は 六本木ですが。
0918login:Penguin
2010/10/01(金) 17:09:11ID:Vbejq9UT開発版という認識があるのなら、それこそ
不具合があれば(あると思ったら)どんどん開発元に文句を言って
協力するというのが求められる姿だろう... こんな所で終わらぬ
議論をするよりとっとと上流に報告する方がはるかにマシ。
報告して上流に「おまえのせいじゃ、ぼけ」と言われても、別に問題は無い。
冗談のつもりか何なのか分からないが、
そこまでgoogle(の開発したsoftware)に対して盲目的になれる
理由が良く分からない。feedbackしないと、結局上流にも
喜ばれない。
0919login:Penguin
2010/10/01(金) 17:23:51ID:K8bUKdQWネタなのは分かるけど、
> mozcが開発版っていう位置づけ
だったらフィードバックへの反応は早めにしないとな。
「安定版だから放置状態」っていうのなら別だけど。
返事かくのに18日もかかるのはまずいよ。
>>914
公式版でも、
表現が「日本脳炎」にはならないっていうだけで、
「日本のうえん」か何かにはなってた。
nihonn|ouenn (にほんおうえん) が
nihon|nouenn (にほんのうえん) に解釈されてたのが原因。
「日本脳炎」になるかどうかは、
該当語が辞書に登録されているかどうかの話で
本質とは関係ないんだけど、
「日本応援」からの突飛さで騒ぎになった。
開発者も「ソース読め、素人の辞書はコスト設定が云々」
みたいにイラついてたな。
今は nihonn|ouenn と解釈するよう修正されてる。
だから非公式辞書で「日本脳炎」が登録されていても、
nihonn|nouenn と打たない限りは
「日本応援」になるはず。
0920login:Penguin
2010/10/01(金) 17:24:06ID:T16gqUdq明らかな釣りに何反応してるの?
マジレスおいしいの?
ばかなの?
0921login:Penguin
2010/10/01(金) 17:29:27ID:ifk3XaM4何日ならまずくないの?
0922login:Penguin
2010/10/01(金) 20:04:56ID:qrkQavyd0923login:Penguin
2010/10/01(金) 23:42:03ID:rVJyF/O4っつーか開発版とか銘打つことで、自然に日本語を破壊しようとしてるんだろ。
今となってはgoogleはMSをぶち抜いて悪の組織No.1だし。
0924login:Penguin
2010/10/02(土) 01:28:41ID:UkW1aCjt0925login:Penguin
2010/10/02(土) 02:05:05ID:GW4N1NWC君おもしろいねってよく言われるでしょ。
0926login:Penguin
2010/10/02(土) 05:02:41ID:vdYd4KUi> 開発者も「ソース読め、素人の辞書はコスト設定が云々」
> みたいにイラついてたな。
中の人、それが言い訳になると思ってるほどのゆとりなんだね。
自分で「mozcでは自分で辞書登録することは事実上不可能です」と言ってるようなもの。
0927login:Penguin
2010/10/02(土) 07:21:59ID:mTPdkDxD>っつーか開発版とか銘打つことで、自然に日本語を破壊しようとしてるんだろ。
これはあるかもしれんな。
グローバル化する時代には、
ぼ〜っとしてたら言語を破壊されるかも。
googleなんてグローバル化(アメリカ化)を企む組織の代表だろう。
0928login:Penguin
2010/10/02(土) 11:08:35ID:t1YT0E+20929login:Penguin
2010/10/02(土) 11:59:03ID:lqQrXmmOIMスレには必ず現れるのでスルーすればよい。
0930login:Penguin
2010/10/02(土) 16:38:45ID:vdYd4KUi悪貨が良貨を駆逐するように、2ちゃん的な大衆テクストに埋め尽されることになる。
0931login:Penguin
2010/10/02(土) 21:28:49ID:z1Yfvux6言い訳なのか?
ちゃんと理解してから辞書作れってことでしょ。
0932login:Penguin
2010/10/02(土) 22:24:28ID:qA+ot8Ux0933login:Penguin
2010/10/02(土) 23:48:06ID:dm+EbJ2B0934login:Penguin
2010/10/03(日) 06:49:50ID:bKz57XgJウソばっかwww
0935login:Penguin
2010/10/03(日) 09:17:14ID:1NeD4DfEそれ、windowsのほうだろ
0936login:Penguin
2010/10/05(火) 15:29:22ID:uBQK6IB8結局、それは本当なの? 俺のmozcが変なだけ?
0937login:Penguin
2010/10/05(火) 15:41:54ID:y2OALexY0938login:Penguin
2010/10/05(火) 23:39:20ID:XhoKNQ2/0939login:Penguin
2010/10/05(火) 23:50:45ID:Hosb5WER>>877
0940938
2010/10/06(水) 10:32:35ID:JolNtVKP0941login:Penguin
2010/10/06(水) 13:32:17ID:fvWnmku9Ubuntu ならPPA があるんじゃないかな
もしくは,来週辺り出る10.10 なら標準で入ってると思う
0942938
2010/10/06(水) 14:55:06ID:JolNtVKPプリンタードライバも何とかはいったんだけど 印刷でまれに文字が欠けるっていう ふしぎな症状がでてて ちょっとめげてますw
長年つかった win2k機がついに飛んだのを機に ubuntuで linuxに再挑戦してみたんですが、
昔よりも相当入り易く、またwin-likeになったなあと。マシンパワーも上がったからかxでも負荷差を感じないし。
で用意したwin7をまだインストールせずに頑張ってますw
やっぱ linuxって難しいなあと。
まあ駄々こねてもしょうがないかwHD安いからもう一個用意して、10.10をいれて評価すべきかなぁ
0943login:Penguin
2010/10/06(水) 14:58:20ID:xbfg3SiE文字が欠けるのはOOo?
0944login:Penguin
2010/10/06(水) 15:44:31ID:NXRl9vW6リポジトリだと
http://download.opensuse.org/repositories/home:/sawaa/xUbuntu_9.10/
あたりにあるっぽい。
ppaにはなかった。
ppa自分で作ってもいいのよ?
0945login:Penguin
2010/10/06(水) 15:45:08ID:fvWnmku9ppa にはlucid しか無さそうだ
https://launchpad.net/~japanese-testers/+archive/mozc
自分でビルドするか野良拾ってくるしか無さそう…
後,評価なら仮想マシンという手もある
0946login:Penguin
2010/10/06(水) 17:08:26ID:ATpjVN6Gppaも野良
0947login:Penguin
2010/10/06(水) 19:16:34ID:yaiXOIcD確かに
まあ,そのへんで拾ってくるよりは多少ましということで
0948login:Penguin
2010/10/06(水) 20:36:08ID:WggmX7Pfまぁ無保証なのはどこだって同じっちゃおなじ。
Google公式がmozcのリポジトリ持ってる訳でもないしねw
0949login:Penguin
2010/10/06(水) 20:58:02ID:CvCVxTvqビルドに必要なパッケージをインストール。
$ sudo apt-get install g++ python libibus-dev libcurl4-openssl-dev \
libssl-dev zlib1g-dev libdbus-1-dev libglib2.0-dev libprotobuf-dev \
protobuf-compiler libgtest-dev subversion devscripts debhelper \
libqt4-dev scim libscim-dev
ここからMozcの最新版をダウンロードして解凍。
http://code.google.com/p/mozc/downloads/list
あとはMozcのdebパッケージを作ってインストール。
$ debuild -b -uc -us
$ sudo dpkg -i ../*.deb
古いMozcは暴走することがあった、
というかUbuntu 10.10 RCの公式Mozcは
pythonの負荷がえらいことになった、
ので最新のやつを使うことをすすめる。
0950login:Penguin
2010/10/06(水) 22:34:14ID:59L2qLFY0951login:Penguin
2010/10/06(水) 22:52:02ID:sfnhD91khttp://packages.debian.org/search?suite=sid&searchon=names&keywords=mozc
0952login:Penguin
2010/10/06(水) 23:17:52ID:JSQWACDmsidでもまだ0.12.xなんだよね。
自分でコンパイルしてるけど、1Gぐらいメモリがないときつい。
0953login:Penguin
2010/10/06(水) 23:44:06ID:fvWnmku9俺はsvn co してる
今co したらr46 だったのでbuild
これは0.13.492.102 にあたるっぽい
0954login:Penguin
2010/10/06(水) 23:49:06ID:sfnhD91kIPAから間借りしてる辞書がnon-freeなんだっけ?
他人のコンテンツで食ってるクセに肝心の辞書は非公開とか、さすがGoogleエゲツねぇ!
0955login:Penguin
2010/10/06(水) 23:55:16ID:8pHNN5dvつ チラシの裏
0956login:Penguin
2010/10/07(木) 06:03:02ID:9mdMzeba多少マシどころか、たいへんクソである。
0957login:Penguin
2010/10/07(木) 07:50:29ID:ZxdruYmG公式ではgclientで取るよう勧めてるけど。
svnだと関連ファイルを取れなかった気がする。
あと生ファイル群だと、
初回はかなりの量をダウンロードしないといけない。
500MB以上かな?
tar.bz2をダウンロードするほうが無難。
0958login:Penguin
2010/10/07(木) 10:50:24ID:OuM6i8iP> 公式ではgclientで取るよう勧めてるけど。
> svnだと関連ファイルを取れなかった気がする。
そうなのか
tbz 取ってきて作りなおしてみる
0959938
2010/10/07(木) 13:00:46ID:jvCPZ0qh"ビルドに必要なパッケージをインストール。" は、できてるっぽい
ソースもダウンロードはできた。 解凍って "tar -xjf " でいいのかな。どこのディレクトリでやってもいいのかな。
そこからさきは、(debian)パッケージの意味がわからないとわからないか。
$ debuild -b -uc -us は
展開されたソースのとこにCDして叩けばいいのかな。
で ".DEB" が生成するから
$ sudo dpkg -i ../*.deb
を叩けばいいのかな。
0960login:Penguin
2010/10/07(木) 13:02:16ID:3TKm6EbE0961938
2010/10/07(木) 13:09:05ID:jvCPZ0qh悪かった。ちょっと偏ってたかなとも思ったんだが、親切に答えてくれてる人もいるんでどこまでがこのスレでよくて
どこからがすれ違いか ってこと自体も 判断に苦しむんだけどな。
でも、LINUX全体に つかえねーやって おもわれて 使える人間だけで閉鎖したら 終わりなもんなんじゃないの?
だから UBUNTUなんかも こういう方向に進化してきたんじゃないの?
まあMOZCはベータなんだし いれにくいこと自体に文句いう積もりはない。
windows いれるよ。atokのライセンスもってるし じゃあな。
0962login:Penguin
2010/10/07(木) 13:42:08ID:jvCPZ0qh今回なんで9.10で止めてるかっていうと、古いマシンとかもあって 8.いくつのやつもいれてたり、おすすめにしたがって
バージョンアップもしてみたんだけど、やっぱさっき動いていたものがアップするとこけるとかあって、やっぱり安定しているものは
とくにOSは不用意にアップデートしてはいけないと。安定運用には常識だよな。
winddows版では google日本語はひどいと思って、アンインストールしたからな。
日本語入力がちゃんとしてないのはOSとして致命的だとおもう。
英語圏ではそういうことはないかなわからないのかも知れないけど、日本語入力にアホな欠陥がある状態っていうのは、英語モードに例えたら、
「キーボードの真ん中へんの文字キーが数個しんでいる。」ようなもんだ。
かりに中身の機能がいくらいいosでも、キーボードが死んでんじゃ意味ないだろw
linuxとかの日本語の部分に誰がどう関わってどう投資したりどう統括してんのか知らんけど、肝心の入り口たる日本語入力について
こんな半端な状態が発生してしまうって アホなことやってんな 統括できる人間とかいないんだなっておもうわ。
それがプロジェクト的問題なのか オープンソース的弱点なのかしらん。 あるいは日本人文化とオープンソース文化の不整合なのか。
UBUNTU日本版がどういうヒトとカネとストーリーで動いてるかようはわからんが
もしも俺が日本でのリナックスをやるんだったら「まともな日本語入力をデフォルトで提供できるようなストーリーでなければ
そのプロジェクト自体がありえん」っておもうわ。キーボードが壊れた込コンピューターうってるようなもんだってだれもおもわないの?
だれもそこを指摘できないんだったら、それこそ日本人的無責任だと思うわw
俺のいうことが的確な評価かもしらんがな
じゃ。
0963login:Penguin
2010/10/07(木) 13:57:02ID:JlGN/05Q0964login:Penguin
2010/10/07(木) 14:46:50ID:Cpug0kVIUbuntuもMozcも売ってるわけじゃないからな。
Linuxのほとんどは開発の中心が日本語圏じゃないから、
現状の日本語入力に不満をもった人が自分で開発するなり、
要望出すなりしなきゃ改善は見込めないと思う。
WindowsもデフォルトのIMEはひどいんだし、
君の考えによれば、Windowsもありえないプロジェクトってことになるな。
Google日本語入力はそこそこよく出来てると思った。少なくともMS-IMEよりまし。
フリー、あるいはデフォルトの日本語入力なんて、どのOSでも今のところ同じようなレベルだろう。
それですら「ひどい」と感じたなら、ATOKでも買えばいいのに。Linux版も売ってるよ?
開発に協力しようともせず、でも金は払いたくない。
それで、こんな所にクレーム付けてるだけ。
それこそ日本人的無責任。
0965login:Penguin
2010/10/07(木) 14:49:23ID:imtbd5hi0966デムパゆんゆん@OSSFJ
2010/10/07(木) 14:51:56ID:STlcJHTV0967login:Penguin
2010/10/07(木) 14:54:30ID:mDLMAp+3MS-IMEはそんなに悪くないよ
文章から察するに偏見を持ってるいるようだが
0968login:Penguin
2010/10/07(木) 16:03:06ID:OuM6i8iPまずは試してダメだったらエラーメッセージ貼るなりしたらいいんじゃないかな
こうかなって思うだけじゃ誰も助けようがない
ちなみに,Google の手順をそのまま打てばいけるよ
0969login:Penguin
2010/10/07(木) 17:06:43ID:jvCPZ0qh腹立ちまぎれにかいちまったが、まあ、ここはMOZCのスレなんでちゃんとこうは書いておかなきゃならないか。
(LINUX版)MOZCについてはインストールも評価も何もしていないわけで、中身についてはなにも評価のしてないから、何の文句もいってない。
そこは誤解のないように。あと「あっち」と違ってMOZCもwindowsのgoogle日本語入力もたぶんまだ開発終わってないんだろうし。おれがいれた頃と今は
またずいぶん違うかも知れないし。いれて数ヶ月(多分二月かそこら)快適に使ったと記憶しているんだが、アンインストールにいたるとこが何だったか、ちょっと
掘ってこないとわからん。もう改善されちゃってるかもだし。いまも両方とも開発してるんだろうからもっともっとよくなるだろうし。
>>964のようなレスは当然に予想されるわけだけど、じゃあ金を払えばまともなバージョンがあるのかとか言う話にもなるし、
あるいは「開発協力をしないものは使うな」、にもなるし、そういうものなんですか?にならないかな。
その手の論点は多分それだけで、スレ一つ立てるような話かもしれない。(既存かしらん)悪いが深入りしない。
MSのやつはATOKに比べれば不満だけど、まあまあこんなもんとおもってつかってる。
バギーじゃなければ機能は低くてもいいんだよなあ。
親身になってくれる>>968さんはありがたいんだけど、まあ、
http://code.google.com/p/mozc/wiki/LinuxBuildInstructions
に書かれてる内容くらいは理解しろよということなのかもね。大昔makefileがいるもの作るくらいの仕事してたんでソースからビルトすることの何となく
くらいはわかるけど、なんか これ結構説明がラフですよね。まあ繰り返しになりますが β公開でもありますしそれはこちらが文句いう筋合いではないです。
ただ
System Requirements
Currently, we only support Ubuntu 9.10 and 10.04 for building Mozc. We plan to add support for other platforms.
と
Build and install debian packageのとこに
Currently, Ubuntu 10.04 is required to build the packages があって9.10でいけるのかいけないのかさえわからんといった感じですw
(つづく)
0970login:Penguin
2010/10/07(木) 17:07:29ID:jvCPZ0qh立ち戻ればプリンターのドライバーは 7.いくつだか用なんで
私はウブンツでは どのバージョンでも相手にされないとのことようなんで 深入りはやめて すごすごとwindowsにかえります。
親身になってくれた方ありがとうございました
0971デムパゆんゆん@OSSFJ
2010/10/07(木) 17:13:37ID:STlcJHTV0972login:Penguin
2010/10/07(木) 17:46:55ID:imtbd5hi「9.10でも10.04でも動くけど、
debianのパッケージ作るには10.04が必要」
0973login:Penguin
2010/10/07(木) 17:53:44ID:qLZn35ZC0974デムパゆんゆん@OSSFJ
2010/10/07(木) 18:12:48ID:STlcJHTV0975login:Penguin
2010/10/07(木) 19:05:19ID:wk1s3o4V0976login:Penguin
2010/10/07(木) 19:19:28ID:uoUZlY/Pお笑い芸人でも一言で大爆笑させる人と
真逆のひととかいるよね?
0977login:Penguin
2010/10/07(木) 19:21:07ID:wk1s3o4V0978login:Penguin
2010/10/07(木) 19:29:03ID:uoUZlY/P流行ってるって聞いたし。
0979デムパゆんゆん@OSSFJ
2010/10/07(木) 19:34:40ID:STlcJHTV0980login:Penguin
2010/10/08(金) 08:41:02ID:FaZlMt9Tおまえの理想が通ってりゃ、今でもVineは国内では最メジャーディストリさ
0981login:Penguin
2010/10/08(金) 18:22:39ID:xsjt7Fks0982login:Penguin
2010/10/09(土) 12:20:53ID:IFqsG36G文句しか言えんやつに限って、何も行動したことがないチキン野郎だな。
0983login:Penguin
2010/10/09(土) 23:19:42ID:+1JVueOMおそらくバグFix。
0984login:Penguin
2010/10/10(日) 06:25:14ID:C3DEhgVGUpdated to revision 48.
ibus-mozcの修正か。
報告するか迷ったけど、
>>949 のpython暴走が再発してたので、
r47からの更新は急いだほうがいいかも。
再起動してtopを見たらいきなり
CPU 99% COMMAND python
だった。
再起動したのもいきなりマシンの反応が遅くなったから。
どこかで
~/.mozcを開発者に送って再現するか確かめてもらえばいい、
みたいな話があったけど、
あれって入力履歴やら個人情報入ってそう。
ざっと見た限りでは生テキストではないようだけど、
Issuesとかの添付ファイルとして
一般公開するのはまずそう。
面識もない開発者に
いきなりメールで送りつけるのもなんだし。
今回はibusフロントエンドの問題のようなので、
~/.mozcの添付は不要だろうけど。
0985login:Penguin
2010/10/10(日) 14:28:14ID:169NDOts以下のパッケージには満たせない依存関係があります:
uim-mozc : 依存: mozc-server (= 0.12.410.102-2) しかし、
0.13.499.102 はインストールされようとしています
手元でmozc-0.13.499.102のdebを作って
インストールしてるから、
エラーメッセージ自体はわかるけど、
なんで特定のバージョンに依存させてるんだろう。
依存: mozc-server (>= 0.12.410.102-2)
だと問題が起きるのかな。
>>984 はr48でもpythonが100%の負荷になるので、
諦めてscim-mozcに変えた。
他では問題になっていないようなので、
俺が何かしくじったんだろう。
0986login:Penguin
2010/10/10(日) 18:42:01ID:+CwRHV2r発生したときはシステムモニタから一旦停止させて再ログインすればおk。
0.13.492だと何度やり直してもダメなときのほうが多かったけど、今は一回で大体おk。
その前のVer.だと確定前の文字列が表示されなかったりとか。
Pythonの暴走は/usr/share/ibus/ui/gtk/main.pyなので、KDEにすればそれはそれで回避できたりもする。
レス数が950を超えています。1000を超えると書き込みができなくなります。