Perlコーディング初心者質問スレ Part 50

**nobodyさん** · 2006/06/26(月) 00:46:38

Perlのコーディングで困ってる人のスレです。

【投稿する際の注意】
質問するときは内容をよく吟味してから投稿してください。
「コマンドの意味がわかんない」とかはマニュアル見ましょう。
回答者さんは何でも屋じゃありません。

1：自分はこういう事がしたい。
2：それでこんな風にやってみたが･･･
3：こんなエラーが出て上手く行かなかった。

最低でも1と3が無いと誰も答えられないよ。
ソース貼る時は、全角スペースでインデント忘れずに。
良い回答は良い質問から。一緒に勉強しましょう。

過去ログやお勧めサイトは >>2-10

**nobodyさん** · 2006/06/28(水) 03:28:54

>>68
ラベル。

**nobodyさん** · 2006/06/28(水) 03:45:51

>>25
まず、require文とhtml_head("掲示板")だけで動くのか報告よろ。
どうせ晒すなら全部晒してもらうとこっちでもテストできるんだけど・・・

**nobodyさん** · 2006/06/28(水) 03:58:15

あ、わかった。143行目を　print "\n\ntest\n";　で解決ですね。たぶん
あるいは　html_head("掲示板"); print "test\n";　とか
82行目のifをスルーした場合どこにもヘッダを出力する
ルーチンがないので、普通にエラー・・・・・・・・・・・・

**nobodyさん** · 2006/06/28(水) 04:19:30

・・・
form_vew_make($pop_name,$pop_title,$pop_msg,$pop_icon,$pop_color,$pop_password,$pop_mail,$pop_home,$pop_thread);
こういう代入はあまりにも毒々しいので、$popなんとかは全部１つのリファレンスにまとめた方がいい。
あるいは%FORMをそのまま放り込んで、$pop系の変数を全部捨てた方がいい。
$lenなんとかはlenごときで変数作るなよと、ｗその程度だったら
必要な時にlen_count($なんとか)で取れば十分。
あと$view_flagのgoとbackは、goとbackを代入してるif文のところで
そのまま処理すればよいので不要

**nobodyさん** · 2006/06/28(水) 08:40:19

すみません。
BASIC認証するときのサーバの負荷について教えてください。
[ID]:[PASS]
というようなユーザファイルあると思うんですが、
何件ぐらい大丈夫なんでしょうか。
5万、10万件ぐらいは平気な感じでしょうか。
データベースでなく、ただのテキストファイルの検索って
どれぐらい大変なのかわかりません。

レンタルサーバじゃ実験できないし、
apacheのインストールの勉強も途中という
初心者ですので。
よろしくお願いします。

**nobodyさん** · 2006/06/28(水) 09:22:51

>>73
perlの話じゃないので、スレ違い。使ってる鯖(apacheなり
なんなり)のスレを探してそっちできけ。

**nobodyさん** · 2006/06/28(水) 09:34:48

板違い

**nobodyさん** · 2006/06/28(水) 10:04:15

>>74
73です。
たしかに、１をよく読んだら全然違ってました。
初心者、perlつながりで質問してしまいました。

旅に出ます。＞＜

**nobodyさん** · 2006/06/28(水) 17:08:53

どこがperl繋がりなんだ…

**nobodyさん** · 2006/06/28(水) 17:13:29

perlで.htaccessなり.htpasswdに追加アッー！

**nobodyさん** · 2006/06/28(水) 17:38:43

質問があるんですが「->」って何に使うんですか？
検索エンジンでは記号の検索ができないので、調べようにも調べられずに困っています・・・。

**nobodyさん** · 2006/06/28(水) 17:43:27

>>79
「perl アロー演算子」辺りでぐぐる

**nobodyさん** · 2006/06/28(水) 20:12:24

デリファレンス

**nobodyさん** · 2006/06/29(木) 00:16:50

$hoge->[10] $hoge は配列へのリファレンス
$hoge->{piyo}　$hoge はハッシュへのリファレンス
$hoge->()　　　 $hoge はコードブロックへのリファレンス
$hoge->piyo()　$hoge はオブジェクト（メソッドコール）

っていう理解でいいですか？

**nobodyさん** · 2006/06/29(木) 00:18:42

まぁ合ってる。
ただリファレンスじゃなくて
リファレンスの参照というか、デリファレンスというか

82 · 2006/06/29(木) 00:33:58

$hoge->[10] で要素が参照できるなら $hoge は配列へのリファレンス、というわけではないのでしょうか？
デリファレンスしてるのはアロー演算子ですよね？？　混乱してきた。。。

**nobodyさん** · 2006/06/29(木) 00:37:48

ごめん、82を読み違えてた。
合ってる。$hogeは配列へのリファレンス。

**nobodyさん** · 2006/06/30(金) 00:52:51

掲示板で無造作な大量リンクのカキコを排除したいと考えています。

　　if(　$txt　にURLが５個以含まれる　){

　　　　はじき処理

　　}

の場合は、IF文のカッコ内にどのような文字を入れるとよろしいでしょうか。
よろしくお願いします。

**nobodyさん** · 2006/06/30(金) 01:03:46

$text =~ m!(http://.*){5,}!s
とかでいいんじゃね

**nobodyさん** · 2006/06/30(金) 01:31:11

>>87
なりました１１１１１１１１
ありがとうございました　　　三　三　旦

**nobodyさん** · 2006/06/30(金) 10:18:19

perl 5.8.6 で XML::RSS を使って Podcast 情報を取得しようとしていますが、enclosure url が引っ張り出せません。XML::RSS では出来ないようなのですが、他に enclosure url が取得できるものはあるでしょうか。m(_ _)m

**nobodyさん** · 2006/06/30(金) 10:41:50

crypt関数について質問です。
#saltはランダムです
$crypted_pass = crypt($password, $salt);

$crypted_passは、$password='1111';$saltはランダムなので毎回違った
文字列になります。すごい疑問なんですが、これをBASIC認証のための
.htpasswdファイルに書き込むと、'1111'でも$crypted_passは毎回違う
文字列ができるのに、何回$crypted_passを作ってもBASIC認証の
ダイアログに'1111'を入れると認証されます。
すごいバカなので全然理解できないです。

わかりにくいとあれですので、やってみたいことを細くします。
フォームから入力されるパスワードを$FORM{'pass'}
.htpasswdファイルにすでに書いてあるパスワードを$pass_htpasswdとします。

パスワードが正しかったら～するって言うことが目的なんです。
if( crypt($FORM{'pass'}, $salt) eq $pass_htpasswd){hoge処理;}
こういうことがしたい場合は、$saltを固定しないとperlでは
できないんでしょうか？固定するとこの処理で大丈夫みたいです。
ランダムだと毎回違う文字列が出てきてだめです。

サーバだとなんで、'1111'ってわかるんでしょうか。
perlでもなんか処理のしかたありますか。
ちょっと、長い文章で申し訳ないですが、よろしくお願いします。

**nobodyさん** · NG

ヒント：crypted文字列の前から二文字はsalt

**nobodyさん** · 2006/06/30(金) 12:01:59

>>91
cryptの戻り値(digest)にはsaltの情報も含まれているのであとで確認したいときは
それをsaltとしてそのまま食わせればいいことになっている。

When verifying an existing digest string you should use the digest as the salt (like
"crypt($plain, $digest) eq $digest"). The SALT used to create the digest is visible as part of
the digest. This ensures crypt() will hash the new string with the same salt as the digest.
This allows your code to work with the standard crypt and with more exotic implementations. In
other words, do not assume anything about the returned string itself, or how many bytes in the
digest matter.

**nobodyさん** · 2006/06/30(金) 15:14:17

>>91
>>92
90です。
ありがとうございます。
できました！！！

saltといっしょだったんですね。
cryptだとパスワードそのまま、saltにできるんですね。
すごく便利です。
ありがとうございました。

**nobodyさん** · 2006/06/30(金) 15:22:58

なんか勘違いしてそうな文面だな。

**nobodyさん** · 2006/06/30(金) 16:17:19

　　　　　　　　　　　第三者　　　　　　　　　　　　　　　　　「通信は傍受される」のがセキュリティの前提で
　　　　　　　　　　　　　↓
　　　　　受信　　　　　↓傍受　　　送信　　　　　　　　　　この場合、パスワードが傍受されるから
サーバー←←←[パスワード]←←←クライアント　　　　生でパスワードを送るのはダメ

　　　　　　　　　　　　第三者　　　　　　　　　　　　　　　　　パスワードからハッシュ関数で生成した
　　　　　　　　　　　　　 ↓　　　　　　　　　　　　　　　　　　ダイジェストを送信すれば、傍受されても
　　　　　受信　　　　　 ↓傍受　　　送信　　　　　　　　　　ダイジェストからパスワードは復元できない
サーバー←←←[ダイジェスト]←←←クライアント　　　　（できるけど、とてつもなく時間がかかる）ので安全

ダイジェストを受け取ったサーバーは、自分が持っているパスワードをダイジェスト化して
それと送られてきたダイジェストを比べる事で、パスワードが合っているか判断する
っていう理解でおｋ？

**nobodyさん** · 2006/06/30(金) 16:20:58

>>95
それだと、「ダイジェスト」を「パスワード」と読み替えたのと全く同じなのでよくない。

**nobodyさん** · 2006/06/30(金) 16:38:41

下手な図だが。要はパスワードの平文をサーバに保存しないのがcryptの一般的な目的かと

　パスワード入力　ランダムなサルト
　　　　　　↓　　　　↓
crypt($password, $salt);
　↓　　　　　　　　　　　　　　登録時
保存(ダイジェスト化されたパスワード)
　├──────┐　　　　照合時
　↓ 　　　　　　│
照合　　　　　　│頭にくっついているサルトだけが
　↑ 　　　　　　 ↓　　　　自動で取り出される。
crypt($password, $salt);
　　　　　↑　　　　　パスワードとサルトが同じであれば
　パスワード入力　　　　　出てくるダイジェストが同じものになる

**nobodyさん** · 2006/06/30(金) 16:45:56

なるほど。ダイジェストだけ保存しておけば、認証はできるのかぁ。
セキュリティは難しいです＞＜　結城たんのアリス本でも読もうかな・・・

**nobodyさん** · 2006/06/30(金) 17:07:50

>>98
たん付けとは浩に失礼だ。

**nobodyさん** · 2006/06/30(金) 17:12:00

>>94
90です
if( crypt($FORM{'pass'}, $pass_htpasswd) eq $pass_htpasswd){hoge処理;}
$saltの文字列が長いときは、crypt関数が、
頭から2文字saltを取ってきてくれて、.htpasswdに記録されている
パスワードをそのまま$saltに入れても大丈夫

っていうことかと思ったのですが。
違いましたでしょうか？
スクリプトは正常に動いてるみたいです。

よくわかりませんが、BASIC認証は通信を暗号化
しないとだめなんですよね。
たしか。

**nobodyさん** · 2006/06/30(金) 17:18:35

>>100 勉強してきたようだな。
>>93の
> saltといっしょだったんですね。
から>>100の意味は読み取れないぞ。
それに、書くなら、
crypt関数は$saltの先頭2文字をsaltとみなして計算するから、
とかするのが正しいだろう。

ロジックが重要なプログラムの世界で、言葉遣いぐらい、と思っているとひどい目に遭うぞ。

**nobodyさん** · NG

ミルカさん萌え

**nobodyさん** · 2006/06/30(金) 17:50:56

正確には一概に頭二文字とはいえないな。ライブラリ依存。
POSIXやSUSv3の範囲で言えば確かにそうだけど、
拡張として$n$...$形式のsaltに対応している環境も結構ある。
ttp://www.gnu.org/software/libc/manual/html_node/crypt.html
ttp://www.freebsd.org/cgi/man.cgi?query=crypt&apropos=0&sektion=3&manpath=FreeBSD+6.1-RELEASE&format=html

**nobodyさん** · 2006/06/30(金) 18:21:42

ﾒｰﾙｱﾄﾞﾚｽ：aaaa@aaaa.ne.kp
### メール投稿設定 ###
①$tmail = '';# 投稿用メールアドレス
②$mailhost = '';# 受信メールサーバー
③$mailid = '';　　　　　　 # メールアドレス(@以下は入れないでください)

って言うのがあったんだけどそれぞれ何入れればいいんですか？
一応番号ふっときました

**nobodyさん** · 2006/06/30(金) 18:27:54

>>104
Perlうんぬん以前の問題だな・・・

PC初心者板マジオススメ
http://pc7.2ch.net/pcqa/

**nobodyさん** · 2006/06/30(金) 18:28:48

>>104
ここはスクリプトを「作る人」のためのスレだ。使う人はスレ違い。
作者に聞け。

**nobodyさん** · 2006/06/30(金) 19:33:30

作者も聞かれても困るけどなｗ

**nobodyさん** · 2006/07/01(土) 00:20:37

①$tmail = 'info@yahoo.co.jp';# 投稿用メールアドレス
②$mailhost = 'pop.mail.yahoo.co.jp';# 受信メールサーバー
③$mailid = 'info';　　　　　　 # メールアドレス(@以下は入れないでください)
とでもやっておけばいいんじゃないの？
ｼﾗﾈ

**nobodyさん** · 2006/07/01(土) 15:05:13

ページ移動させたいときに

print "Location: http://google.com/";, "\n\n";

ってやるけど、windowsのローカル+Apache+ActivePerl だと 500エラー返しちゃうんだよね…
eval でもエラーにならないんで、
Location: ができるかどうかって前もって判断することってできる？

**nobodyさん** · NG

正常に飛びましたが何か？

**nobodyさん** · 2006/07/01(土) 15:50:23

>>110
マジでΣ
何かの設定違ってんのかなー。

>>109 なんで＆quot; になってんのかわかんないけど。

まあ、ぐぐったら tok2 とか infoseek とかでも Location は 500 るっぽいんだけど、
それは手動で設定変更して HTML吐いての meta タグで飛ばしてた。
プログラム内で自動で判断できれば一番なんだけど、何か対策ないかねえ。

**nobodyさん** · 2006/07/01(土) 16:43:35

print "Status: 302 shine\n";
も一緒に吐くとどうなる？

**nobodyさん** · 2006/07/01(土) 16:44:34

こうだったorz
print "Status: 302 Shine Compact\n";

**nobodyさん** · 2006/07/01(土) 18:13:25

>>113
500だねぇ・・・。
動くとこでやってみたけど、何これ？マジック？

**nobodyさん** · 2006/07/01(土) 18:23:44

print "HTTP/1.1 301 Moved Permanently¥n";
こいつを出してからにするとどう？

**nobodyさん** · 2006/07/01(土) 18:52:35

>>115
おおおおお(*゜▽゜)

print "HTTP/1.1 301 Moved Permanently\n";
～

だといかなかったけど、参考にぐぐって、

print "Status: 301 Moved Permanently\n";
print "Content-type: text/html\n";
print "Location: http://google.com/\n\n";

こうしてやったらいきました！すごい！ありがとう！

……っていうか、ひょっとして Content-type: ないからあかんかった……？(；´Д｀)
動くとこはなくても動いたんだけどｗ

**nobodyさん** · 2006/07/01(土) 19:08:37

Content-Typeはどんなステータスでも必須だったような。。

>>115
それはnph-*なファイル名でないとあかんやん。

**nobodyさん** · 2006/07/01(土) 19:09:54

>>114
CGI/1.1仕様でちゃんと決まってますよ。

**nobodyさん** · 2006/07/01(土) 19:13:14

申し訳ないです。

鯖のインストール済モジュールが知りたくて、検索してたら↓の情報がありました。
ttp://antipop.gs/mt/2004/11/21/115534

ただこれを実行すると DBI など複数同一表示されるものがあるのですが、
これを重複をなくすにはどうすれば良いでしょうか？

**ヽ(´ー`)ノ** ◆.ogCuANUcE · 2006/07/01(土) 20:57:42

use strict の後に my %c; を、for の後に grep { !$c{$_}++ } を入れるんだ。

**nobodyさん** · 2006/07/01(土) 21:38:28

>>99
お前は呼び捨てかよｗ

**nobodyさん** · 2006/07/01(土) 23:52:40

「9.56」みたいな、小数点付きの数字を画像表示させたいと考えているのですがよく分からず困っています。

小数点さえなければ
------------------------------------------------------
$cout = sprintf("%06d",$cout);

for($i = 0; $i < length($cout); $i++){
$no = substr($cnt,$i,1);
push(@image,"./img/$no.gif");
}

print "Content-type:image/gif\n\n";
binmode(STDOUT);
print &gifcat'gifcat(@image);
------------------------------------------------------
というコードで、数字を画像表示させられるというのは分かるのですが、
なにぶん小数点が含まれるとなると・・・・どうしたらよいか・・・・

ちなみに「img」ディレクトリに「0.gif～9.gif」という数字の画像と
「point.gif」という小数点を表示する画像が入っています。

どうかよろしくお願いします　orz

**nobodyさん** · 2006/07/02(日) 00:05:54

>>122
未だにperl4なのがアレだけど…。多分、以下の１行入れるだけでいける。

for($i = 0; $i < length($cout); $i++){
　$no = substr($cnt,$i,1);
　$no = 'point' if ($no eq '.'); ### この行を入れる ###
　push(@image,"./img/$no.gif");
}

**122** · 2006/07/02(日) 00:29:28

>>123
え・・・>>122は入門書っぽい本を参考にして組んだのですが・・・
何かまずかったでしょうか・・・？

とりあえずありがとうございました orz

**nobodyさん** · 2006/07/02(日) 04:58:17

Image::Magickで「9.56」の画像を作ればいいんじゃね

**119** · 2006/07/02(日) 13:06:22

>>120
ありがとうございました、希望の動作になりました。

Perl はコードが省略化されて読めなかったりするのですが、
119のリンク先では↓の部分が難解でした。もしよければ解説おねがいします。

print qq|<li><a href="http://search.cpan.org/search?module=$_";>$_</a></li>\n|
for sort
map {$_ =~ m/^.+?"Module" (.+?)$/}
qx/perldoc perllocal/;

# printの行は↓に変更、最後にセミコロンを付けるとエラー
# print "<li><a href=http://search.cpan.org/search?module=$_>;$_</a></li>\n"
# for sortの行は理解不能無理、こんなループ見たことない検索しても出てこない
# mapの処理自体は分かるが、左に代入先などがないので出力が分からん･･･
# qxは調べて分かった。でもどういう出力に･･･

**nobodyさん** · 2006/07/02(日) 13:35:34

後ろから読んでくと分かるはず。

qx: qxの実行結果を
map: map に通してモジュール名だけ抜く
sort: ↑をソートして
for: そのそれぞれについて(foreach)
print: print

**119** · 2006/07/02(日) 14:16:29

>>127
ありがとうございます、↓やっと分かってきました。

use strict;
my %c;
my @qx = qx/perldoc perllocal/;
my @module = map {$_ =~ /^.+?"Module" (.+?)$/} @qx;
my @modlist = grep { !$c{$_}++ } @module;
@modlist = sort @modlist;
foreach (@modlist) { print "<li>$_</li>\n"; }

**nobodyさん** · 2006/07/02(日) 17:13:00

$_[0]って何だ？
エラーメッセージが一つしか表示されない。
もう一つ表示するはずなんだが・・・。

&error("ダメだ","ダメっす");
コレだと『ダメだ』しか表示されない・・・。
『ダメだ』と『ダメっす』をランダムってか表示させたいんだが

**nobodyさん** · 2006/07/02(日) 17:36:43

>$_[0]って何だ？
配列の一番はじめの要素
>&error("ダメだ","ダメっす");
サブルーチンに配列で引数渡してるところ
>コレだと『ダメだ』しか表示されない
アタリマエ

**nobodyさん** · NG

sub error {
print $_[int(rand(scalar(@_)))];
}

我ながら酷いコードだな

**nobodyさん** · 2006/07/02(日) 18:36:42

ちょっと行き詰ってしまったので質問させてください

今回UTF-8を使用しようと思いjcode.pmでエンコードしようとしたのですが
一部の文字列が文字化けすることに気づきました。

例)心霊

ちなみにエンコード方法は
Jcode::convert (\$value, 'utf8');
としているだけで特に怪しいことはしていないと思います

ちなみにそこを#でコメントアウトしてみると
フォームページ自体をUTF-8で書いているため
さきほどの「心霊」と言った文字列も問題なく表示されるわけですが
フォームページをEUC-JPなどにすると
当然のごとくEUC-8になってしまうため問題があります

何か私自身の書き方に問題があるのでしょうか？
それとも仕様なのでしょうか？
お手数をおかけして大変申し訳ありませんがご教示頂けると嬉しいです

よろしくお願い致します

**nobodyさん** · 2006/07/02(日) 18:53:53

129だが解決方法を教えてくれ

**nobodyさん** · 2006/07/02(日) 18:58:30

せめて sub error を晒せ。
いまんとこ解決というかそれは当たり前というか。
>>130 も書いている通りなんだが。
>>131 もなんか書いてるし。
それを参考にどうぞ。

**nobodyさん** · 2006/07/02(日) 19:00:42

>>131
配列の添え字は整数しかとらないんだし、
randの引数はスカラーコンテキストだからこれで良いじゃないか。
sub error { print $_[rand @_] }

>>132
何をしようとしているときに問題が発生するのかが良くわからんので、問題が発生するときの
・内部エンコーディング(UTF-8ならutf-8フラグはあるのかどうかも出来れば)
・出力/入力するエンコーディング
・どっちの方向に変換しようとしているのか
辺りを詳しく。

スクリプトの内部処理をUTF-8で行って、出力するページのエンコーディングを
EUC-JPにしようとしているわけ？勘では多分、使い方の間違いだ。
Jcode::convert(\$value, '変換先のエンコーディング', '元の文字列のエンコーディング');
ってやって見れ

**132** · 2006/07/02(日) 19:09:39

>>135
ごめんなさい、誤解させてしまうような書き方をしてしまいました

基本的には内部においてUTF-8で処理したいのです
eucやsjisに変換する気はありません

ただどんな文字コードでフォームから入力されても
UTF-8に変換したいために
Jcode::convert (\$value, 'utf8');
としています

# 現在のブラウザではフォーム入力ページがUTF-8なら
# UTF-8で文字コードを送信してくれるという話なので(どっかで聞きました)
# Jcode::convert (\$value, 'utf8');
# をしなくても実害はないといえば実害がないのですが
# 万が一sjisとかで送信してくるブラウザ等があった場合にも
# 対応したいと思い変換処理させています

ところでUTF-8フラグはEncodeモジュール以外でも必要なのでしょうか？
(今回の件で色々ぐぐっていたときUTF-8フラグというものについても読んだのですが
Jcodeモジュールを使う時にフラグ云々という話は出てこなかったので不要なのかと思っていました)

続きます

**nobodyさん** · 2006/07/02(日) 19:10:50

Jcode::convert (\$value, 'utf8');
を
jcode($value)->utf8();
にしてみたら？
自動判別が働いて正しく格納されるはず。

入力のエンコードを誤認してたらどうしようもないけどね

**nobodyさん** · 2006/07/02(日) 19:11:56

入力された文字列を処理させる流れは以下のような感じです

sub decode {
my ($buffer, $key, $value);

if ($ENV{'REQUEST_METHOD'} eq "POST") {
read (STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}

@pairs = split(/&/, $buffer);
foreach (@pairs) {
($name, $value) = split(/=/);

$value =~ tr/+/ /;
$value =~ s/%([a-fA-F0-9][a-fA-F0-9])/pack("C", hex($1))/eg;

Jcode::convert (\$value, 'utf8');

$in{$name} = $value;
}
}

**nobodyさん** · 2006/07/02(日) 19:16:54

あの～packしてる時点でスクリプトを書いている文字コードへ変換しているはずですが･･･

＞# 万が一sjisとかで送信してくるブラウザ等があった場合にも
＞# 対応したいと思い変換処理させています
そりゃおまいさんがどんなコンテンツを管理しているかによる。
UTF8で書かれたページからshiftjisで
しかもフォームデータをエンコードもせずにダイレクトで送ってくるブラウザ
使ってる奴なんて死ねばいいと思うよ

**nobodyさん** · 2006/07/02(日) 19:19:08

139の一行目はなんか激しい勘違いなので忘れてw

**nobodyさん** · 2006/07/02(日) 19:23:43

>>137
jcode($value)->utf8();
にしてみたら上手く行ったかと思ったのですが
ためしにフォームページをEUC-JPにして入力してみると
入力された文字列はEUC-JPのまま出力されていました・・・

>>139
>しかもフォームデータをエンコードもせずにダイレクトで送ってくるブラウザ
>使ってる奴なんて死ねばいいと思うよ

もうちょっと正直に書きますと
ある分野のデータベースを作っているのですがその検索フォームを
「自分のサイトにつけたい人はどうぞ」
という風にしたいと考えているのです
ですのでその入力ページがeucもあればsjisもあるかと思うので
鯖側でUTF-8に変換したいなあと・・・

最後まで解決しなければその案は断念しますがｗ

**nobodyさん** · 2006/07/02(日) 19:47:20

>>138
切り分けができてないな。そんなに長いプログラムではどこで
間違ってるか特定できないだろ。

Jcode::convertを疑うのなら、4valueにこの値をいれて
Jcode::convertを呼んだらこれこれこうなったけど
期待している値はこれだというのを示さないと。

**nobodyさん** · 2006/07/02(日) 20:06:33

>>142
えっと･･･このソースの大半は一般的な入力データ処理だと思いますが･･･
とりあえず>>132で書いた通り
Jcode::convert (\$value, 'utf8');
をコメントアウトすれば問題なく処理されます

一応文字化けした結果も載せておくと
「心霊」をUTF-8で記載されたページから入力すると
unpackされた値は「%E5%BF%83%E9%9C%8A」になりそれをpackして
Jcode::convert (\$value, 'utf8');
で変換すると「綽？？」(← 文字化けしたもの)
となってしまうというわけです(当然期待している値は「心霊」です)

ちなみに「心」だけでも「霊」だけでも正常に出力されます

**nobodyさん** · 2006/07/02(日) 20:40:15

いやだから??とか文字化けしたとかじゃわかんないでしょ。
utf8フラグと文字コードのダンプぐらい示さないと。

**nobodyさん** · 2006/07/02(日) 20:48:13

ためしに
Jcode::convert (\$value, 'utf8', 'euc');
と
Jcode::convert (\$value, 'utf8', 'sjis');
ってやった結果も記してくれんかな

**nobodyさん** · 2006/07/02(日) 20:55:32

そもそも他人に使わせるなら日本語限定ではだめじゃん？
ttp://www.russky.net/article/list.asp?id=855
これは gb2312 だけど euc-kr にも日本語のひらがなが入っていたようないないような。

**nobodyさん** · 2006/07/02(日) 21:13:47

おおかたencode/decodeを適切にやってないと予想。

**nobodyさん** · 2006/07/02(日) 21:35:08

ああ、大体わかった
「綽？？」ってのはUTF-8の文字列をEUC-JPとして見たときのものだ。

つまり変換自体には問題はなくて、結果を表示するページを
間違えてUTF-8じゃなくEUC-JPにしてしまっている、と。

**nobodyさん** · 2006/07/02(日) 21:47:43

s/\x0D\x0A/\n/g;
tr/\x0D\x0A/\n\n/;
とかって、改行コードの統一処理はどのタイミングでやるもの？
何かファイルを読み込むごとに毎回するもの？

**nobodyさん** · 2006/07/02(日) 21:52:43

混在してるとごちゃごちゃするので、なるべく入り口近くで決めた形式に
統一しちゃうね。場合によっては無駄になることもあるけどわかりやさ
優先。

**132** · 2006/07/02(日) 22:03:39

>>144
>>143の？？は実際には文字化けの□をもっと縦長にした感じのが出ています
ただここにコピペしたら？に変換されてしまったわけで

>>145
入力ページはUTF-8で記載されていますのでその上での結果です
>Jcode::convert (\$value, 'utf8', 'euc');
「綽？？」
>Jcode::convert (\$value, 'utf8', 'sjis');
「蠢？怺」
ちなみに↑の例ですが入力ページをそれぞれeucおよびsjisに変えたら問題ありませんでした
今回の「心霊」のようにそれぞれの文字コードで別の問題ある文字がないとは限りませんが･･･

>>146
そうかもしれません

>>147
その可能性がないとは言えませんが私は適切にやってるつもりなのでなんとも

>>148
ブラウザでのエンコードはUTF-8になっていることを確認した上で見ています
なのでブラウザの問題ではなくむしろ下に書くように
jcode.pmモジュールがUTF-8をEUC-JPに誤読しているのかと･･･

つづく

**132** · 2006/07/02(日) 22:04:39

今回試しに下のような形でエンコードしたところ
Jcode::convert (\$value, "utf8", "utf8");
正しく「心霊」と表示されました

また「心」と「霊」は単独で正確に表示できることから
思うに「心霊」と続けて入力したとき
繋がっている部分の文字列から文字コードをEUC-JPと判断された上で
UTF-8に変換しているのではないかと個人的には思っています

例) #文字コードについて調べるのが面倒なので下記のような仮定で･･･
UTF-8 ：心→aaaaaa 霊→bbaabb
EUC-JP ：綽→aaaa ？→aabb ？→aabb

今めちゃくちゃ眠いので
もしかしたら落ちてしまって反応明日以降になっちゃうかも･･･
そのときはごめんなさい

あと、忘れていたのですが、ご回答頂いた方々、ありがとうございます

**nobodyさん** · 2006/07/02(日) 22:07:24

>>150
それは、
「コードの最初の方に１箇所だけ統一処理を置いて読み込む度に処理される」
ということを意味してるのか、
「必要不要は置いといて、オープンする度に毎回とりあえず統一処理する」
ということなのか、どっちの意味ですか？
読解力不足ですみません。

**148** · 2006/07/02(日) 22:27:28

>>151-152
そうか、ごめん。こっちの環境ではちゃんと自動認識できてたもので、つい。

なら、SJISの一バイトカナの問題もあるし、
呼び出し元のフォームでエンコーディングを指定してもらうか、
もしくはフォームに適当なマルチバイト文字列を埋め込んでおいて、
それが何になったかでエンコーディングを調べるってのはどうよ。

# formにはaccept-charsetなんてのもあるのだけれど、IE対応してないんじゃ仕方ない…

**132** · 2006/07/02(日) 22:38:32

>>154
ご回答くださり有難うございます
なるほど、その方法がありましたね
ソース見られるとちょっと不恰好だけど･･･

てゆーか素朴な疑問なのですが
jcodeモジュールを使っている人で同じような問題に当たった人って居ないのかなあ･･･
eucで「～」を入れるとNGというのは発見したのですが

# ちなみに入力ページをEUC-JPにした上で「～」を入力したところ確かにNGでした

自分一人だとしたら、やっぱり何か私の書き方がおかしいんだろうな･･･
jcode.plではこんなこと一回もなかったのでjcode.pmが嫌いになりそう

**nobodyさん** · 2006/07/02(日) 22:45:18

ってか受け取った文字列が utf-8 かどうかなんて自分で1行書いて判別すれば起こらない問題じゃね？

**nobodyさん** · 2006/07/02(日) 22:49:46

143の%エンコードっされた文字列をみるに
Jcode::convertには

"\xe5\xbf\x83\xe9\x9c\x8a"

という「心霊」をutf8にしたバイト列を食わしているわけだが、
$Jcode::DEBUG=3にしてこいつを変換すると

>DEBUG:sjis = 6, euc = 2, utf8 = 6 at ～

と出るので、sjisとutf8のスコアが同点でどっちにも決められない
状態になっていることがわかる。

これは避けられないことなので、普通はhiddenで判定用文字列を
渡してどういうのが来るかで文字コードを決定し、他のパラメタに
ついてはJcodeの自動判定にたよらずその文字コードを入力コード
に指定してやるのが安全。

**132** · 2006/07/02(日) 23:19:43

ご回答頂きありがとうございます

>>156-157
なるほど、了解しました
とくに>>157さんは細かく調べて頂き深く感謝致します

>>154さんも仰っていたように
判定用文字列を渡してチェックする方向で対処したいと思います

長い時間お付き合い頂き、皆様、本当にありがとうございました

**nobodyさん** · 2006/07/02(日) 23:58:34

正直、convertサブルーチンを使う気ならjcode.pl使えばいいじゃん。
Jcode.pmはオブジェクト指向が前提だし、その先にはEncodeへの視野がある。

使いこなせないなら無理すんな

**nobodyさん** · 2006/07/03(月) 01:25:18

>159
jcode.plはUTF-8に対応して無いんだが

**nobodyさん** · 2006/07/03(月) 01:44:49

>153
答えた本人じゃないけど・・・
>「必要不要は置いといて、オープンする度に毎回とりあえず統一処理する」
だと思う

俺も基本的にはデータファイルを読み込むときに改行を統一 (または不要なら削除) してる

「あれ？このデータは改行付だったっけか？」なんて迷うことも少なくなるので、
自分でどの段階でまとめておくとか、自分なりのルールを決めておくといいかと思います。

**nobodyさん** · 2006/07/03(月) 02:25:22

早く文字コードが統一される時代が来ないかな
もうこのさいUTF-8でもSJISでもなんでもいいからさ

**nobodyさん** · 2006/07/03(月) 07:23:23

>>157
utf8の心霊はそんなにもeucっぽいという事？ｗ
でも、実際には文字化けしてるわけで、・・・なんか変な感じだ・・・

**nobodyさん** · 2006/07/03(月) 07:27:52

>>129
$_[0]=="ダメだ"
$_[1]=="ダメっす"
自分の経験からするとこういうランダムは、すぐにうっとうしくなるｗ

**nobodyさん** · 2006/07/03(月) 09:14:35

>>162
unicodeはいい機会だったのだが日本語については従来のコード
との対応について統一に失敗したのでだめぽ。まったく当時その
辺で仕事してた奴らは負の遺産を残してくれたものだ。

**149** · 2006/07/03(月) 10:05:01

>>161
もう誰もレスくれないと思ってたからちょっと感動。

やっぱり、オープンの度にコード統一する癖付けといた方が何かと良さそうですね。
これで改行統一の野望に一歩近づきました。
ありがとうございます！

**nobodyさん** · 2006/07/03(月) 12:27:50

sjisで統一されたら面倒くさくて超困るしｗ
utf8は神。もうちょっとがんばってはほしかったが。

jcode の文字自動判別は前からいろいろ問題あったよね。
length で判定して同じ文字数だったらEUCにするので、
sjis で半角カナだけ書いて文字判別させると文字化けするとかね。
優先順位指定できたらもっと使いやすかったと思う。

**nobodyさん** · 2006/07/03(月) 12:30:55

孫がトロン潰しさえしなければなぁ・・・