トップページunix
60コメント26KB

EUCでは半角カナを使えないのですか?

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさんNGNG
ソフトウェアデザイン誌の3月号に
曰く...自分は○×○に努力しているのに、他の連中は何もしねぇ
などと書かれた「インサイドTrueTypeうんたら」という記事に

『...ただ、ここで気をつけなければいけないのは、
EUCコードでは半角カナを使うことができないと
いうことです。そこで...』

いつからそうなった?
EUCは半角カナ扱えるだろ?
Linux-EUC-jp(笑)はそうなったのか?
(そーいやなんか昨年末位にEUCコードの扱いについてレベルの低い事決めてたな)

答えを誰か教えてくれ
1.俺(オマエ)の常識が古い
2.ソフトウェアデザインのライターレベルは低い
3.こいつだけがバカ
0002名無しさんNGNG
あー、それ俺も読んだ。
俺は、3だと思う。
「Linuxインストール・ユーザは、厳密にはLinuxユーザとは言えません」
とか
「Linuxユーザは、Canonの不買運動を起こします」
とか書いていた、やっぱり皆ひらがなの人でしょ?
みつうらだったか、みつたにだったか?
ひらがななんで、良く覚えてないけど、みつなんとかだった。
0003名無しさんNGNG
ひらがなにこだわるなぁ。
会社とかにばれたときの逃げ道だろ。
00042 > 3NGNG
そっか。ひらがなの人は会社にバレたらヤバイような、
やましい事してるのか。
2ちゃんねるの名無しさんと一緒だね。(w

「○○@N△C××です」とか、「××@△△大学です」
とか書くほうが、もっと信じらんないケド。
0005名無しさんNGNG
あー俺いつもそう思ってる
なんで大学名とか企業名出したがる奴が多いの?
もしかしてOO大ですって名乗るとどんなトラブルでも解決するのかな?
ウザ
氏んで欲しい
0006名無しさんNGNG
そういうこといってると
「学歴とか会社にコンプレックスもってるからそうおもうんだ。」
とかいわれるよ。

まぁ
田中 とか 浅田 とかいう名前の人多いので、どこの田中さんだとか
なのってもらわんと困るときがある
0007名無しさんNGNG
なんか、「半角カナ→SJIS→MS→極悪→とにかく排除」って理論が
刷り込まれてる奴って多くないか?
0008EUCで半角カナNGNG
ってアプリ組む上では処理すんのが面倒だからでしょ?
関係無いけど俺は、半角カナは見た目汚いんで嫌い。
0009名無しさんNGNG
EUCに半角カナがないのは、ASCIIとコードが重ならないようにしたか
らぢゃない?

#半角かなを1バイト文字として実装しようとすると、0x80以降を使う
#ことになり、
#2バイト文字として実装しようとすると、2バイトにもかかわらず
#「半角」文字。
0010>10NGNG
じゃなくて EUC-JP には半角カナも含まれてるんだよ。以下が
IANA の登録事項。Name: Extended_UNIX_Code_Packed_Format_for_Japanese
MIBenum: 18
Source: Standardized by OSF@` UNIX International@` and UNIX Systems
Laboratories Pacific. Uses ISO 2022 rules to select
code set 0: US-ASCII (a single 7-bit byte set)
code set 1: JIS X0208-1990 (a double 8-bit byte set)
restricted to A0-FF in both bytes
code set 2: Half Width Katakana (a single 7-bit byte set)
requiring SS2 as the character prefix
code set 3: JIS X0212-1990 (a double 7-bit byte set)
restricted to A0-FF in both bytes
requiring SS3 as the character prefix
Alias: csEUCPkdFmtJapanese
Alias: EUC-JP (preferred MIME name)
0011>9NGNG
じゃなくて EUC-JP には半角カナも含まれてるんだよ。以下が
IANA の登録事項。Name: Extended_UNIX_Code_Packed_Format_for_Japanese
MIBenum: 18
Source: Standardized by OSF@` UNIX International@` and UNIX Systems
Laboratories Pacific. Uses ISO 2022 rules to select
code set 0: US-ASCII (a single 7-bit byte set)
code set 1: JIS X0208-1990 (a double 8-bit byte set)
restricted to A0-FF in both bytes
code set 2: Half Width Katakana (a single 7-bit byte set)
requiring SS2 as the character prefix
code set 3: JIS X0212-1990 (a double 7-bit byte set)
restricted to A0-FF in both bytes
requiring SS3 as the character prefix
Alias: csEUCPkdFmtJapanese
Alias: EUC-JP (preferred MIME name)
0012名無しさんNGNG
>8
"面倒"と"使えない"は全然違う

>9
>EUCに半角カナがないのは、
おひおひ
001310@`11NGNG
二重カキコもうしわけない。
00149NGNG
>#2バイト文字として実装しようとすると、2バイトにもかかわらず
>#「半角」文字。

半角文字は2バイト文字として実装されていますね。誤解でした。結局
半角カナがいけないんぢゃなくて、SJISにおいて半角文字が1バイト文
字であると事が嫌われる原因ではないかとおもいます。
00151NGNG
>3
そっか、なるほど

>なんか、「半角カナ→SJIS→MS→極悪→とにかく排除」って理論が
>刷り込まれてる奴って多くないか?
いるんじゃないか〜
MS叩けるならなんでもやる連中。(がんばれGとか)

>9
>半角カナがいけないんぢゃなくて、SJISにおいて半角文字が1バイト文
>字であると事が嫌われる原因ではないかとおもいます。
うわ〜
おいおい
SJISで半角カナが1バイトで何の問題があるの?考えてみ
00169NGNG
>15

SJIS:
半角カナ:0xA1〜0xDF
全角一文字目: 0x81〜0x9F@` 0xE0〜0xEF(ASCII・半角カナ以外)
全角二文字目: 0x40〜0xFF(ASCII・半角カナと重なる)

EUC:
半角カナ:0x8E??(8E+半角カナコード:ASCII以外の文字)
全角一文字目:0xA1〜0xFE(ASCII以外の文字)
全角二文字目:0xA1〜0xFE(ASCII以外の文字)

ってことで、実装の奇麗さはともかく半角カナを扱う手間はあまり違
いませんね。9は、思いつきなんであまり気にしないで下さい。

#過去の資源との互換性を市場のモノとするMSの姿勢は、それはそれですばらしいモノですが
001716NGNG
[互換性を市場のモノ]→[互換性を至上のモノ]

ごめんなさい、明日に備えて、時差調整のために徹夜している(飛行
機の中で爆睡)んですが、書き込みはこれで終わりにします
0018名無しさんNGNG
判った!
あのライターの名前に、半角カナがあるんだよ、きっと。
なんたらジュン
とか。
0019>16NGNG
半角文字は1byte
全角文字は2byte
この暗黙の了解がeucを不完全なまま実装させる原因になったんだよ。
半角カナは2byteだから、全角文字として扱いたいけどそれができない。
だから半角カナ氏ねとなった。

>18
みつい○○○お がどうした?
0020いやNGNG
EUC は当初、ISO-2022 準拠ってのが売りだったような気がするが。

> 半角文字は1byte
> 全角文字は2byte

テキストVRAM の時代は終ったんだからもうどうでもいいでしょう。
Shift_JIS はその時代には抜群の利点があったわけだ。けど、も
う過去のもの。協調性まるでないし。
0021ん?NGNG
>テキストVRAM の時代は終ったんだからもうどうでもいいでしょう。
>Shift_JIS はその時代には抜群の利点があったわけだ。けど、も
だと思うよ。俺の言いたい事と大体同じ事だよね。
今時全角、半角ってなによソレってのもあるんだし。
0022んん?NGNG
>20
EUCは前にもあるけど半角カナは扱えるという点はOKだよな?

EUCは半角カナを扱えるが、
そのEUCに対応しているプログラムが半角カナの対応を
サボっている事が多く、サボりたくなる理由を説明したの
EUCに半角カナがない理由じゃないからね

ちなみにEUCから半角カナを外したコードの規格もあったね
00237NGNG
EUCのISO-2022 準拠ってのは、文字集合を組み合わせを動的に切り
替えるというコンセプトの部分じゃないのかなあ?ISO-2022-JPは
エスケープシーケンスでやってる事を、EUCでは1st Byteでやって
るよね。

しかし、世間一般の半角カナ排除の理論って、そんな高尚なもの
じゃ無くて、下記のような中途半端に独自拡張した知識を、頭ん中
へ実装している人が多いと思う今日この頃。
半角┬→SJIS┬→MS──→極悪─→とにかく排除-──┬→半角カナは
カナ│   └→非UNIXコード-┬→インターネットで┘ 使用不可
  └→Mail@`Newsで使用不可─┘     使用不可
    (ここだけは一応正しい)
>1
スレッドから外れたが、俺も3と思うぞ。
0024名無しさんNGNG
アナタの言ってる事ももっともなんだけどさ、もーいーじゃん。
反MS叩きも聞き飽きたよ。そんなことより、早く半角カナを殺そうよ。
大体、なんでそんなに半角カナを使いたがるのよ。どうして?
今あるデータにしてもさ、全部全角文字にすればいー事じゃん。
そりゃ確かにファイルレイアウトから帳票やラベルの桁数なんか、
全部変わってくるだろうとは思うけど、今頑張らなきゃこの先ずっと
半角カナを引きずっていくことになるんだよ?
いくら苦労しても、出てくるのはあのショボい半角カナ文字。
虚しいダケじゃん。もうやめようよ。その方が将来のタメにもなるって。
00257NGNG
なんか、良くあるパターンになってきちゃったけど、誤った知識を
広げる事や、その誤りを元にエラソーに他の事(半角カナでもMSでも
個人でも良いが)を否定する行為を批判しているんですけどねえ。
(このスレッドの、と言う意味でなく、一般的な風潮に対して)

23は、半角カナと聞くや、文字コードも何も無く即否定のプロセス
を、わかりやすく書いたつもりだったんだが、ダメでしたか(笑)

同様に、個人の嗜好による共有資産の否定もどうかと思いますよ。

別にがんばらなくても、MSはUNICODE化を進めているようだから
S-JISは廃れていくだろうし、JIS97では(JIS X 0201の)半角カナ
削除予定を明言しているので、21世紀初頭には、過去の資産との
互換性維持の目的で残るぐらいでないの?

最後にEUCの半角カナだけ残ったりして。
0026名無しさんNGNG
>大体、なんでそんなに半角カナを使いたがるのよ。どうして?
>今あるデータにしてもさ、全部全角文字にすればいー事じゃん。

オレもそう思う。だけどさ、やっぱあるんだよ半角カナ
を使う場面が多分。そういう状況を想定できない (オレ
も含めて)自分らの視野の狭さを自嘲しとくしかない。

かつては俺も一つのコードの中に同じ字形が存在する事
を疎ましく思っていたけど、だったらEUCのアルファベッ
トの全角と半角、数字の全角と半角も同じ問題抱える事
になるじゃん。

それに、半角カナと呼ばれているモノも、コードからす
れば文字の大きさとか形なんて決めていない。もしある
エディタが半角のアと全角のアを同じフォントで表示し
ても実は何ら問題ない事はご存知の事と思う。

結局SJISにしたって、EUCにしたって矛盾しているのさ。
それを理解せずに半角カナだけを排除しようとしても、
無理な話。

>7
例の系譜、全くその通りだと思うね。
0027名無しさんNGNG
>26

だからさー

>それに、半角カナと呼ばれているモノも、コードからす
>れば文字の大きさとか形なんて決めていない。もしある
>エディタが半角のアと全角のアを同じフォントで表示し
>ても実は何ら問題ない事はご存知の事と思う。

こんな解決じゃ

>オレもそう思う。だけどさ、やっぱあるんだよ半角カナ
>を使う場面が多分。

この要求が満足できないし、プログラムにも半角カナを
扱う為の処理は残ることになる。それじゃヤなんだよ。
もう殺そうよ。

要は、データの長さと画面や紙に出てくる文字の数が簡単に
求められれば、それでいーんだよ。オフコンだのWSだの
PCだのって、もう悩みたくないのよ。
UNICODEだったら、ちゃんと解決するの?じゃあそれに決定。
0028ってゆーかNGNG
27の場合
半角カナのフォントのセンスがいやなの?だったら
全角カナと同じフォントにすればいいじゃん

例えば、テキストをgrepしたり、sedしたりするとき
に同じ字形があるのがイヤーンっていうのなら、納得するけどな〜

>要は、データの長さと画面や紙に出てくる文字の数が簡単に
unicodeもサロゲーでだめだろ?確か

関係ない話で盛り上がるな〜
0029名無しさんNGNG
>28
とゆーか、文字コードの事でいちいち頭を悩ませるのがヤなんだよ。
でもって、半角カナの場合、頭を悩ませたところで出てくる文字が
アレなもんだから、もっとヤなんだよ。

>>要は、データの長さと画面や紙に出てくる文字の数が簡単に
>unicodeもサロゲーでだめだろ?確か

ダメなの?じゃUNICODE却下。もっとクールな文字コード希望。
0030名無しさんNGNG
>ダメなの?じゃUNICODE却下。もっとクールな文字コード希望。
クールっていえば、エスケープシーケンスばりばりのjis(語弊あり)は
世界に誇れるクールさだぜ?
00317NGNG
どれと、どれが同じ人の発言か判りにくいな〜。文字コードより
混乱してるぜ。複数発言する人は、なんらかのIDつけてよ。

>要は、データの長さと画面や紙に出てくる文字の数が簡単に
>文字コードの事でいちいち頭を悩ませるのがヤなんだよ。
そんな貴方には、asciiがピッタリ。
0032なんかJIS信者ってカンジNGNG
JISX0208オンリーにしてしまえば?
そもそもこのコードだけで英字もあるし、ロシア文字もあったし

英数字が、漢字やかなと同じ幅なのを嫌う場合は、
使用するフォントの方で対処で
エスケープシーケンス省略で扱えば、
文字は全部2byteで扱えるんじゃない
00331NGNG
簡便してくれ〜

ソフトウェアデザイン4月号のTrueTypeの記事...3月号の続きだけ
どこのライターまたしても「諸悪の根元はWindowsにあり〜」とか
毒電波出してやがる

結局真のLinuxユーザというのは、つまりアンチWindowsユーザに過
ぎないのか?適材適所も分からないバカばっかしで?
もうちょっと志の清い連中と信じたかったが

もうSDの購読止めようかな。レベル低すぎ。
日経Linuxオンリーにでもするか
0034>33NGNG
SDは昔から電波系が豊富です。岩谷とか吉田翁とか。
とゆーより電波をかいくぐって読むのがSDの醍醐味。
SDに期待するのは「読み応えのあるミーハー」って
気がします。私。
0035>34NGNG
>SDに期待するのは「読み応えのあるミーハー」って
その通りかも〜
反MS岩谷とかMS狂信者吉田とか、てっきりプログラマとしての
バックグランドがあって書いているのかなと思っていたんだけど
やっと最近そうじゃないことに気付いた。
何年買ってるよ?我ながら情けない

電波をかいくぐって楽しむといえば
自分の理想こそ全てで、
やってる事は唯のMS中傷に終始一貫という
がんばれゲイツ君
http://www.asahi-net.or.jp/~FV6N-TNSK/gates/
なんかも同じですね。
バカだけど面白いから許す

いっその事パチョコン批評家にでもなればいいのにとホントに思うワ
食えないかもしれないけど
0036名無しさんNGNG
書いてること(もしくは表現)がガキっぽいので好きじゃない。
別にMSも好きじゃないけどね。
0037名無しさんNGNG
岩谷にせよ、吉田にせよ、外○?にしても
立派な事をいうだけで、
自立して何かするわけではないところが
いかにも日本人の性を見せられているようで
嫌悪したくなるんじゃないか?
0038BB >33NGNG
『SoftwareDesign』って、最初のほうに載っているカラーページの
コラムが面白いと思いません? いっつもあそこだけは立ち読みして
います。

#いや、トピックのタイトルとぜんぜん関係ないですが・・・。
0039名無しさんNGNG
クールなコード体系なんだけど、「超漢字」の13万字ってどうなの?
これから別のコード体系考えるにしろ移行するにしろ、ついでに
「こんな字もでねぇーのかよ」は無くなると嬉しいかなと思う
0040>38NGNG
みえちゃんのIndyくんざんまい、好き。
0041名無しさんNGNG
別にいいんじゃないの、岩谷も吉田翁も面白ければそれで。
っていうか、アニヲタと同じで批判するだけならサルでも出来るから
彼らを超えるコンテンツ(プ を提供してみれ。
0042名無しさんNGNG
こういゆ話題になると
「じゃあ、おまえやってみろ」ってヤツが必ずいるね。
0043名無しさんNGNG
提案のない批判はただの馬鹿のやること。
0044>43NGNG
押し付けは最低だが、誰かが書いた内容に対して感想を述べるのは個人の自由。
それにいちいち「やってみろ」とほざく奴は当事者かキチガイ
0045>41NGNG
「ある電波親父の日記」として岩谷の記事は面白い、に賛成。
0046それではNGNG
もうちょっと、前向きな提案
SDに限らずUNX雑誌の記事
の訂正(若しくは より正しいとする意見)をアゲる
板を立てるってどうでしょう?
0047> 44NGNG
> 押し付けは最低だが、誰かが書いた内容に対して感想を述べるのは個人の自由。
> それにいちいち「やってみろ」とほざく奴は当事者かキチガイ

いやー、全員に対して「やってみろ」とは言おうとはおもわないが、
あまりにも無責任な意見がおおすぎんだよね。なんつーのか、記事を
書くにしてもそれなりの労力が払われてるわけで、それに対する考慮が
全くないのってみてて吐気するよね。記事をかく労力を考慮した上で
文句言ってる人の文句って、周りを納得させられるでしょ。

なんつーか、口を開けてエサ待ってるだけのアホが、
「なんでおれの口の上にエサ落としてくれねーんだ!」
とか騒いでるだけに見えるんだよ。

00481>43NGNG
確かにアンタのいうとおりかもしれない。
>それにいちいち「やってみろ」とほざく奴は当事者かキチガイ
もまた真

>41
>「ある電波親父の日記」として岩谷の記事は面白い、に賛成。
SD一時期それだけが面白かったというのもあったな〜。うんうん
0049>39NGNG
>クールなコード体系なんだけど、「超漢字」の13万字ってどうなの?
これも4byteで一文字というわけではないけど、悪くはないんじゃないの?
言語を切り替えるには(FEで始まる)言語指定コードをいれると切り替わる。

日本の漢字を扱うとなると、超漢字の中のJISX0208とJIS補助漢字を使う事に
なるのかな?そうなると言語指定コードは必須となるのかもしれないので、
文字列のバイト数から単純に文字数を知ることは難しいかも。

..無い文字といえば、家号なんかもコードに入れられるならいいんだけど
それはないよな〜。NTTの絵文字乱造はOKなのにね。
つくづく文字というのは難しい。
0050>47NGNG
アンタ当事者か?
Linuxをオタクの大人の玩具にした連中が何をいうか

アンタに指摘されるまでもなく、こちらは勝手に
リヌ環境の強化に努めている
>「なんでおれの口の上にエサ落としてくれねーんだ!」
なんて心配は無用だ
お前は、今の状況に満足していろ。よ!お山の大将
0051> 50NGNG
はぁ?(?_?)

脳が不自由か。。。
0052>51NGNG
どっちもどっちだな〜
下らん
0053> 50 from 47NGNG
はぁ?俺は客観的にみていってんだよ。あんたが環境の強化に努めてるのは
すばらしいことだろうけど、あんたの話をしてるわけじゃにゃいのよ。

まー、モノ作ったりモノ書いたりしたことがないと無責任なこといくらでも
言えるやね。そのためにどれだけの労力がはらわれるかかんがえもせずにさ。

で、そういうのに対する配慮ってのが全くない発言っつーのに対しては
「じゃ、そのナンブンのイチかでもやってみろよ。」
とかおもうわな。そうすっとさ、
「すぐに自分でやってみろっていうだろ。これだから」
とかひらきなおるわな。アホは。そういうのが幼稚だっつーんだよ。

なにかモノをやるのにかかる労力がわかってる人間は、それを
わかった上で文句言うから、おだてるのがうまいやね。


0054名無しさんNGNG
誰だよ、こういうスレ立てるの。このネタは荒れるの!
0055>54NGNG
別に良いジャン。元題から、とっくにズレてるし。(笑)

で、俺は
1> 3.こいつだけがバカ
に一票。
0056 >53NGNG
おばかさ〜ん
>まー、モノ作ったりモノ書いたりしたことがないと無責任なこといくらでも
>言えるやね。そのためにどれだけの労力がはらわれるかかんがえもせずにさ。
勝てば官軍って言葉しってるか?
努力しましたじゃあ、だれも認めちゃくれないのよ
労力がどうしたというのよ?
未だオタクの玩具に過ぎないのは事実だろ
おばかだねぇ。若いのに

そういう事は一度でも誰もが納得する成果出してからいいなさ〜い
ゲイツ叩きはその後で結構
ね?選民意識の固まり君
0057>56NGNG
よくわかんねえのだが、それは41に同意したと考えて
いいの?
0058はてはてNGNG
面白いならいいんじゃないの?
0059名無しさんNGNG
よくわかねえな
53の無責任な発言するなってのは
怒る矛先を間違えている気がするし
56のゲーツがどうのこうのは話に関係
ないんじゃねえのか?
0060名無しさんNGNG
hageましょう
■ このスレッドは過去ログ倉庫に格納されています