トップページphp
1001コメント360KB

Perlコーディング初心者質問スレ Part 52

■ このスレッドは過去ログ倉庫に格納されています
0001nobodyさん2006/09/15(金) 14:01:51ID:gobry0n2
Perlのコーディングで困ってる人のスレです。

【投稿する際の注意】
質問するときは内容をよく吟味してから投稿してください。
「コマンドの意味がわかんない」とかはマニュアル見ましょう。
回答者さんは何でも屋じゃありません。

1: 自分はこういう事がしたい。
2: それでこんな風にやってみたが・・・
3: こんなエラーが出て上手く行かなかった。

最低でも1と3が無いと誰も答えられないよ。
ソース貼る時は、全角スペースでインデント忘れずに。
良い回答は良い質問から。一緒に勉強しましょう。

お勧めサイトは >>2-10

前スレ http://pc8.2ch.net/test/read.cgi/php/1153987463/
過去ログ倉庫 ttp://user.ftth100.com/mirrorhenkan/perl/
0047332006/09/21(木) 11:50:02ID:???
>>46
すみません、後学のためにBCCの恐怖をお教えいただけないでしょうか?
他に軽く出来る処理のヒントになるかもしれないですし。
0048462006/09/21(木) 12:00:24ID:???
>>47
BCCで送るつもりがCCになっててメルアド流出ってニュース聞いたことないですか?
「事故の元」って>>44が言ってるのもそういうことだと思いますよ
0049332006/09/21(木) 12:04:51ID:???
>>48
あー、そっちの意味ですか。
それは大丈夫です。
>>44
>Bccで送るな。
と言ってますからBccで送ってはいけない、って意味なので違う事を危惧してくださっていると思います。
0050nobodyさん2006/09/21(木) 12:23:58ID:???
大丈夫大丈夫って飲酒運転して人を轢き殺すタイプだな
0051nobodyさん2006/09/21(木) 12:24:45ID:???
これはとあるシリアル制御機器にコマンドを送る命令である


$test->printf("%c%c",0x1b,0x40);

これでは問題なく動いてくれるが、
ちょっとコマンドを長めに投入するとだめ。
原因はなんだろう

×
$test->printf("%c%c%c%c%c%c",0x1b,0x40,0x1f,0x03,0x1b,0x40);
0052332006/09/21(木) 12:30:16ID:???
>>50
お前>>48で46を名乗って「>>44が言ってるのも」と他人の振りをしてるのはなぜだ?
>>44=>>46=>>48=>>50
答えれねーならしゃしゃんじゃねーよクズが。
0053462006/09/21(木) 12:34:25ID:xRtMaydf
はいはい妄想乙。
0054nobodyさん2006/09/21(木) 12:46:46ID:rVJ008ap
>>52 != >>33
だろ
0055nobodyさん2006/09/21(木) 12:50:01ID:rVJ008ap
  |    |    |  /-------------石綿-------------
  |    |    |/|           ∧   | lllllllllll |
▲|  schindler /  |    シュレッダー  |雪|   | パロマ | l| ̄ ̄ ̄|
▽|    |  //l . |    |アイリス |  |印|   | O。O | ||___| アメリカ産牛肉
  |    |// │ |    |オーヤマ|    ̄  `┬┬_´ ..||ε(;; ;)3|\  __
  |    /..│   | |  __ ̄ ̄ ___ . / ┌┘/l . ||ε(;; ;)3|.  || |#|イトーヨーカドー電気ストーブ
_|_/  │   | |  |Mac ||_  |:|デル|:| lニニニl/  .||ε(;; ;)3|.  || ~~~
.  / .     |   | | /__/l|:.. : |ニニニ|.::.:.:.||.:..:::..::..:  ̄ ̄ ̄\||            _/ ̄ ̄\_三菱
./ .       |0,  | |::_||.::..:...||:..::.SH902iS::::.[PS2]::::: /\\ : | | .           └-○--○- ┘
 設計     |   |/.::.↓>>52.:..::::./ヽ-、.:(PSP): .| \| ̄|=| |コ=      /\\ :  _/ ̄ ̄\_トヨタ
姉歯事務所|  ./.::..:..:<⌒/     ヽ.::..:..:◎..:...::.. .| \|  |: | | 松下|  .| \| ̄| └-○--○- ┘
.       |/.::..:..:..::::.<_/____/.::.: ソニーBMG:..\.|_|: | | FF式 .  .| \|  |  ファイヤストンタイヤ
      ____   ___    _____  ________...\.|_|:サンヨー石油ファンヒーター

0056nobodyさん2006/09/21(木) 13:03:19ID:???
>>47
メールアドレスに改行仕込まれるとそれ以降のアドレスが駄々漏れになる。
sendmailの引数で指定すれば(シェルに解釈させないように注する)、その心配はまったく無くなる。

付録:
一行の長さの制限とか考えてないでしょ。
0057nobodyさん2006/09/21(木) 13:43:19ID:???
>>56
Sendmail の引数で指定するのは、一般的にはやっちゃいけない方法と言われてるね

リスクとしては、

OSインジェクション >>> メールアドレス漏洩 だし、

シェルに解釈されないようにする&RFC準拠のメルアドを全て使えるようにする手間 >>> 改行コードとカンマとスペースを排除する手間

シェルコマンドは色々あるからね。
まぁシェルコマンドを全部エスケープすればすむだけだとは思うけど。
0058nobodyさん2006/09/21(木) 13:46:31ID:???
そもそもメールマガジンで1万って考えられないな。
スパムじゃないの?
0059nobodyさん2006/09/21(木) 13:47:40ID:???
>53

>54

>55

おいおいいきなりID出して別人工作か。
もちっと頭使え。
0060nobodyさん2006/09/21(木) 13:50:34ID:???
>>58
メールマガジンで1万ってのは普通だろ


むしろ、スパムで「たった」1万通なわけないじゃん

スパムのアクション率なんて、0.00001% とかだぞ。
スパムするなら、最低500万通/日、業者なら1億通/日は送っているだろ。

0061nobodyさん2006/09/21(木) 13:50:39ID:???
>>58
また出た。
お前がツクリャ30人が関の山だろうが、俺の文章読みたさにがんがん登録があるってわけ。
貧相な想像力でねちねち言ってんじゃねーっつーの。
0062nobodyさん2006/09/21(木) 14:22:11ID:xRtMaydf
wwwwwww
0063nobodyさん2006/09/21(木) 14:22:18ID:???
でも個人のメールマガジンで1万の登録が有るってのもな。
0064nobodyさん2006/09/21(木) 16:30:17ID:???
てか、みんな一応質問に答えてやってんだから
それぐらいで着火するようなら自分で考えて自分でやれ
ちょっと調べればいくらでも出てくるぞ
0065nobodyさん2006/09/21(木) 19:39:32ID:???
↓そろそろ釣りでした宣言
0066nobodyさん2006/09/21(木) 20:13:30ID:???
本日の営業時間終ったから、レスは明日じゃないかな
0067nobodyさん2006/09/21(木) 21:46:53ID:???
スパマーも一応仕事だからな。
0068332006/09/22(金) 06:53:12ID:???
回答ありがとうございます。

>>56
仰るとおり長さの制限に引っ掛かりました。
ヘッダーが32kb超えてる、みたいな感じのエラーが出たので、10件ほどでのテストでは判明しない問題でした。
>>38が提案してくださったようなプロセスの小分けの方向で模索してみます。

>>57
シェルコマンドをエスケープですか。
難しそうですが、勉強してみます。
0069332006/09/22(金) 07:18:25ID:???
自分の頭の整理も含め、もう一度書き直しますね。

1: 自分はこういう事がしたい。
1万件のメールアドレス(@配列にいれてあります)にメールを送信したい。

2: それでこんな風にやってみたが・・・
a.foreach構文で1万回sendmailをやってみた
b.全部を$mailに入れてBccとして送らせてみた

3: こんなエラーが出て上手く行かなかった。
a.実行時間が長すぎて、途中で切られた
b.ヘッダーが長すぎると言われた

ヘッダーを短くするには繰り返し構文を使うしか思いつきません。
>>38の案を模索してみたんですが、バックグラウンド処理、リダイレクトというのがさっぱりわからなかったです。
一回の処理を短く行う方法は御座いませんでしょうか?

お教えくださいますようお願いします。
0070nobodyさん2006/09/22(金) 09:54:19ID:???
>>69
僕の使ってるサーバではやらないでね。
0071332006/09/22(金) 09:55:43ID:???
ない知恵を絞ってみました。
@maill[0..99]←([]の中身は変数で変更可能)
で100回だけループするようにして、
htmlのリフレシュを使って、@mail[100..200]を処理する(getメソッドで数値を渡しておく)ようにして、
それが@mailの行数を超えるまでリフレシュさせまくる、というのは不安定でしょうか?

それか、100件ごとに
sleep 5;
などを入れて休憩させるといけるのか、とかも考えましたが、
これだと「一回の処理の時間の長さが50秒追加されるだけで余計長くなってる」ってことになるでしょうか?
100件ごとに一回の処理として扱われるなら最後までいけると思うんですが。
0072332006/09/22(金) 09:57:18ID:???
>>70
昨日の結局何も答えてはいないだけのクズか。
しつけーぞ。しゃしゃり出るならなんか回答してみせろ無能め。
0073382006/09/22(金) 10:13:02ID:???
>>69
ふつう、1万件のメールをCGIプログラムでは送りません。タイムアウトするから。
ヘッダが長すぎるというのはあたりまえ。1行の長さが998文字以下と決まってるのです。
だから、やるなら、

Bcc: xxxxxx@xxxx.xx,
 xxxxx@xxxx.xx,
 yyyy@yyyy.yy,

のように、1つのヘッダ行が複数にまたぐ場合は、2行目以降は行頭に空白文字(スペースあるいはタブ)を置いて続けることができます。
このような仕様がいろいろあるので、メールクライアントを作りたかったら、RFCを読みましょう。
ttp://www.ietf.org/rfc/rfc2822.txt
ttp://www.puni.net/~mimori/rfc/rfc2822.txt(日本語訳)

プログラムで送ろうとせずに、eml形式のメールデータをローカルなperl環境で1万個作ってメーラーにインポートして一斉に送ってはいかが?
スパムを送られたら幇助しているようでいやなので詳しく書く気はないです。ごめんなさい。
0074nobodyさん2006/09/22(金) 10:18:03ID:???
> 1万件のメールアドレス(@配列にいれてあります)にメールを送信したい。
もうこの時点で目的は何であれスパムだよな。

そうじゃないんだったらメルマガやメーリングリストでも使えばいいじゃん。
0075nobodyさん2006/09/22(金) 10:20:42ID:???
>>72-73

>>35>>40
を書いた者だが、
もうおまえ去れ。
スパム業者でないという保証もないし。
これだけヒントもらってるんだから自分でやれよ。
0076nobodyさん2006/09/22(金) 10:39:14ID:???
>>74
そういうシステム使うと、その業者を儲けさせるだけ
やつらは、人様が苦労して作成したコンテンツに広告を載せて配信し、ぼろ儲けしている
0077332006/09/22(金) 10:50:43ID:???
>>73
> プログラムで送ろうとせずに、eml形式のメールデータをローカルなperl環境で1万個作ってメーラーにインポートして一斉に送ってはいかが?
ありがとうございます。
最終段階で送信プログラムを実行するんじゃなく、
<p><a href="mailto:foo\@bar.com?bcc=$mail&subject=$subject$body=$body">SUBMIT</a></p>
というHTMLを吐き出すことにしました。


>>74
>> 1万件のメールアドレス(@配列にいれてあります)にメールを送信したい。
> もうこの時点で目的は何であれスパムだよな。
配信希望者に送る場合もでもスパムというのでしょうか?

> そうじゃないんだったらメルマガやメーリングリストでも使えばいいじゃん。
そのメルマガのコーディングについての質問です。

>>75
いただいたヒントを参考に解決しました。

みなさま、本当に有難う御座いました。
0078nobodyさん2006/09/22(金) 11:04:03ID:d6rNV+wj
ID出して否定しないし33の名前は全部同一人物だろ
結局mailtoでBCCwwwww
Perl関係ないじゃんww
解決乙。もう来るなよ

>>75
>>73は33とは別の人ね。すげー親切で泣ける
0079752006/09/22(金) 11:10:34ID:???
ホントだ・・。>>73さんごめん。
0080332006/09/22(金) 11:12:12ID:???
>>78
> ID出して否定しないし33の名前は全部同一人物だろ
最初にIDを出していないので、否定しようと騒いでも余計に悪化すると思いまして。

お陰様で解決しました。
0081nobodyさん2006/09/22(金) 11:13:44ID:???
変ななりすましはスルーでOK
0082nobodyさん2006/09/22(金) 11:56:21ID:???
だが、否定ぐらいはしとけと。
0083nobodyさん2006/09/22(金) 12:14:06ID:???
>>57
最近のperl使ってシェルを経由させずに起動すれば良いだけ。

> Sendmail の引数で指定するのは、一般的にはやっちゃいけない方法と言われてるね
無知をさらけ出されても困る。
0084nobodyさん2006/09/22(金) 13:09:56ID:???
>>76
自分で鯖立てればいいだけじゃん。
0085nobodyさん2006/09/22(金) 16:20:39ID:URN28btq
post データが
a0=1&b0=1&a1=4&b1=2&a2=2&b2=2&・・・&an=8&bn=9
と"a".$i =数字と"b".$i=数字となっているものを
postgresql にperl でupdateしたいのですが、

for($i=0;$i < n; $i++){
$str ="update table set a=$html->param('\"a\".$i') where b=$html->param('\"b\".$i)";
$sth=$dbh->prepare($str);
$sth->execute();
}
こんな感じでupdateしたいのですが,試行錯誤の上に挫折中です。
うまい方法はないですか?
0086nobodyさん2006/09/22(金) 16:31:12ID:d6rNV+wj
$html->param('\"a\".$i')
をprintしてみたらどうでしょうかね
0087nobodyさん2006/09/22(金) 16:38:47ID:???
$html->paramはなんですか?文字列ですか?メソッドですか?
$strに何が代入されてるんですか?
0088nobodyさん2006/09/22(金) 16:50:49ID:???
>>87
どうみても $html は CGI のインスタンスだし、$str には SQL 文が代入されてるがな。(´・ω・)

文字列の中でメソッド呼び出しってできたっけ?
一旦 param の内容を変数に代入してから $str に埋め込んでみては?
0089nobodyさん2006/09/22(金) 16:50:53ID:URN28btq
>>87
>$html->param

$html=new CGI;
です。
>$str
にはpostgresqlに対するupdate のストリングが入って欲しいものです。

>>86
CGI=HASH(0x804c914)->param('"a".1')
となりました。
0090nobodyさん2006/09/22(金) 16:56:20ID:???
てか、パラメータを直接 SQL 文に埋め込むと SQL インジェクションできるんじゃね?
0091nobodyさん2006/09/22(金) 16:58:49ID:???
流石○○板だな
0092862006/09/22(金) 16:58:56ID:???
>>89
いや意味的には>>88と同じで変数を確認ってことです
っつーかbのシングルクォート
0093nobodyさん2006/09/22(金) 17:03:18ID:???
$html->paramはなんですか?クォートの中から呼び出せるんですか?
$strに何が代入されてるんですか?
確認しましたか?
0094nobodyさん2006/09/22(金) 17:04:10ID:???
アッー!
0095nobodyさん2006/09/22(金) 17:51:48ID:???
>>85
$htmlってのは
use CGI;
my $html = new CGI;
したもんだと仮定しますた。それから、
$dbh は、DBI/DBD::Pgで接続したときのインスタンスと仮定しますた。んで、

まず、$html->param('\"a\".$i') ってのがおかしい。全体をシングルクォートしてしまうと$iは展開されません。
まあ、$html->param("a$i") だとします。

そんで、ダブルクォーテーションの中に $html->param("a$i") を入れちゃうと、
$html と ->param("a$i") とに分かれて解釈されちゃうので、外に出してください。

だけれど、せっかくprepare使うんなら

my $sth = $dbh->prepare("update table set a=? where b=?");
for ( $i=0; $i < n; $i++) {
    $sth->execute($html->param("a$i"), $html->param("b$i"));
}

などとしてはいかがでしょうか?

※上記のソースで n が裸で出てくるのはおかしいです。use strictすれば教えてくれます。
※SQL-injectionのチェックはしてくださいね。
0096nobodyさん2006/09/23(土) 06:00:23ID:08cXFZbB
Perlで、サニタイズするときの定番の関数は何ですか?
PHPだとhtmlspecialchars()というのが標準で備わっているんですけど、Perlでそれに相当するものは何になるんでしょうか。
(自分で書くのは簡単なんですけど、できればPerl標準のものがあればそれを使ったほうがいいかなと考えています。)
0097nobodyさん2006/09/23(土) 06:57:54ID:???
PHPのそれに相当するビルトイン関数はないよ
0098nobodyさん2006/09/23(土) 07:46:28ID:???
>>97
ライブラリ関数で結構ですので、教えていただけませんか。
0099nobodyさん2006/09/23(土) 08:34:56ID:???
Perl標準もデファクタスタンダードと呼べるものもないと思うよ

HTMLを使用するモジュールには大概あるから(CGI、TT、HTML::Templateなど)
あとは自前で用意するんじゃないかな
0100nobodyさん2006/09/23(土) 08:39:51ID:???
>>98
http://perldoc.jp/docs/modules/CGI.pm-2.89/CGI.pod#item__escaped_string___escapeHTML__unescaped_string___
0101nobodyさん2006/09/23(土) 09:31:06ID:???
サニタイズゆうな。クズ。
0102162006/09/23(土) 16:17:05ID:???
今日、@IT に自分が質問していた内容に関する記事が追加されました。

http://www.atmarkit.co.jp/fsecurity/rensai/hoshino10/hoshino01.html

自分が書き込んでから数日以内のことなので、ひょっとしたらこのスレ見ててくれたのかな、と思ったりw
偶然かもしれないですけど・・・

もし、見ていてくれたのなら 杉山 さん、本当にありがとです。
0103nobodyさん2006/09/23(土) 17:05:32ID:???
ねーよw
0104nobodyさん2006/09/23(土) 17:24:16ID:???
>>16 より引用

> バイナリエディタで解析した " (ダブルクォート) の 16進表記は、"22" です。
> ここで、$hoge に バイナリレベルで "82" をいれてみるとどうなるかやってみました。(バイナリファイルを一般のテキストエディタで表示したときの、"・"(半角) と表示されるあれです。)
> それを出力して、IE と Firefox と Opera で表示したところ、 "82 22" で 1つの不正な文字 "・"(全角) として表示され、ダブルクォートが消えうせていました。


>>http://www.atmarkit.co.jp/fsecurity/rensai/hoshino10/hoshino02.html より引用

> 赤坂さんの入力には、「%82」という文字列が含まれている。


22 はダブルクォートだけど、82 はようするに22と組み合わされて1つの2バイト文字と扱われればいいわけで、82である必然性が無い。
参考リンクの、http://applesoup.googlepages.com/bypass_filter.txt にも 82 は出てこないからね


以上の理由により、杉山氏はこのスレを見ている可能性が高い
0105nobodyさん2006/09/23(土) 17:43:34ID:???
http://www.atmarkit.co.jp/fsecurity/rensai/hoshino10/hoshino03.html によれば、
php なら、mb_convert_encoding($_GET{'hoge'},'SJIS','SJIS')) で対策できるみたいだね。

Perl の jcode.pl で同じことやったが、無理だったわ。
不正な文字列を変換してもそのままになっちゃうみたい。

Perlで対策するにはどうすればいいんだろうか・・・。
0106nobodyさん2006/09/23(土) 17:59:04ID:???
>>29 じゃだめなんかい。
そんなに面倒だったら、受け取った文字列の後ろにスペース一個くっつけとけば?
01071052006/09/23(土) 18:02:03ID:???
>>106
なるほど
それでできるのか
ありがとうございます
01081052006/09/23(土) 18:15:29ID:???
$str = qr/^([\n\x20-\x7e\xa1-\xdf]|[\x81-\x9f\xe0-\xfc][\x40-\x7e\x80-\xfc])*$/

の qr ってなんだろう。と調べてみました。

http://psst.jp/syn/archives/000199.html

つまり、>>29 は、「^([\n\x20-\x7e\xa1-\xdf]|[\x81-\x9f\xe0-\xfc][\x40-\x7e\x80-\xfc])*$」を、正規表現としてコンパイルしているわけですね。


実際に $GET_hoge の無効な文字列を削除するには、

$GET_hoge =~ s/$str//g

とすればいいわけですね。

ありがとうございます。
0109nobodyさん2006/09/23(土) 18:23:40ID:???
この脆弱性、CGI配布サイトで配られている大部分の掲示板スクリプトとかにとかに影響していますね・・・
漏れの使っている Child Tree とかはもろ影響してるし

実はphpユーザなんでPerlのことよくわからないや(´・ω・`)
しかも自分で書いたスクリプトじゃないから修正が大変です><

本来出力時のエスケープがいいと思うのですが、、print 内の変数を全て書き換えるのは大変なので、
GET と POST として送られてきた全てのデータに >>29 の正規表現を適用させる方法は無いでしょうか

どうかお願いします
01101052006/09/23(土) 18:33:56ID:???
あれ、動かしてみたけど、駄目でした。

> つまり、>>29 は、「^([\n\x20-\x7e\xa1-\xdf]|[\x81-\x9f\xe0-\xfc][\x40-\x7e\x80-\xfc])*$」を、正規表現としてコンパイルしているわけですね。

まではいいんですが、

> 実際に $GET_hoge の無効な文字列を削除するには、
> $GET_hoge =~ s/$str//g

は違ったようですね。

「^([\n\x20-\x7e\xa1-\xdf]|[\x81-\x9f\xe0-\xfc][\x40-\x7e\x80-\xfc])*$」は正しいパターンなので、

if ($GET_hoge !~ $str) {
&error("貴方が送信した文字列はShift_JISとしてValidではありません。");
}

みたいに使うってことだったようです。
0111nobodyさん2006/09/23(土) 18:36:49ID:???
Encode.pmでは無理か?
0112nobodyさん2006/09/23(土) 18:38:01ID:???
>>109
製作者に言えよw
0113nobodyさん2006/09/23(土) 18:52:41ID:9+jKDZxZ
指定したファイルを読み込んで、そのファイル内に記述された$aaa等の変数をperl内の内部変数に置き換えるにはどうすれば良いですか?
0114nobodyさん2006/09/23(土) 18:57:30ID:???
>>110
最後の1バイトがゴミかどうか調べてみれば?

>>113
while(<DATA>){
${$1} = $2 if /^(\w+)=(.*)/;
}
print $aa;
__END__
aa=bb
0115nobodyさん2006/09/23(土) 19:01:07ID:???
^([\n\x20-\x7e\xa1-\xdf]|[\x81-\x9f\xe0-\xfc][\x40-\x7e\x80-\xfc])*$ の意味を考えてみた

"\n" は改行文字、"\x" はなんだか良く分からないけど、バイナリレベルで調査するって宣言かな
"\x20-\x7e" は、16進数の "20" から "7e" ってことか
2桁の16進数だから、

16^2 = 256 = 2^8 = 1バイト

つまり、この [] の1ブロックで、1バイトってことだね
1ブロック目、2ブロック目、3ブロック目全てが 1バイトのよう

これを括弧でかこって繰り返しにしている

あれ?

ってことは、3バイトの文字列で始まり、それが0回以上繰り返される?
例えば、ユーザ入力値が "ab" だったら不正扱い?

でも試してみたらそうならないし

う〜ん
0116nobodyさん2006/09/23(土) 19:36:39ID:???
正規表現ってそんなわかりにくいのかな。

>>110,115
その場合こう。
というかちょっと数行に分けて書き換えてみるからこれでわかって。

my $reg_alpha = qr/(?>[\t\r\n\x20-\x7e]+)/; # アルファベットの連続
my $reg_han_kana = qr/(?>[\xa1-\xdf]+)/; # 半角カナの連続
my $reg_multi = qr/(?>(?:[\x81-\x9f\xe0-\xfc][\x40-\x7e\x80-\xfc])+)/; # 2バイト文字の連続

$GET_hoge =~ s/^((?:$reg_alpha|$reg_multi|$reg_han_kana)*).*$/$1/;

テストはしてない。
0117nobodyさん2006/09/23(土) 19:39:36ID:???
>>113
状況がよくわからんが、
・require
・eval
・正規表現
お好きなのを使ってどうぞ
0118nobodyさん2006/09/23(土) 19:42:38ID:???
>>116
あー、o 修飾子つけた方がよかったかもしらん。たいしてかわらんかもだけど。;
0119nobodyさん2006/09/23(土) 19:49:01ID:???
>>115
全然違う…。

[¥n¥x20-¥x7e¥xa1-¥xdf]
が、ASCIIキャラクタとsjis半角カナ ... A

[¥x81-¥x9f¥xe0-¥xfc][¥x40-¥x7e¥x80-¥xfd]
がsjis2バイト文字 ... B

/^(A|B)*$/
だから、1バイト文字と2バイト文字で構成されている文字列にマッチする。
(sjisのみ対応)

正規表現の2バイト目の最後、0xfdまで文字あるから直しておいた。
0120nobodyさん2006/09/23(土) 19:51:21ID:???
>>116
(´・ω・)
$GET_hoge =~ s/^((?:$reg_alpha|$reg_multi|$reg_han_kana)*).*$/$1/os;
01211152006/09/23(土) 20:10:01ID:???
>>116
ご親切にありがとうございます。
あとでそれぞれの修飾子の意味を調べながら解読してみようかと思います。

>>119
なるほど。
プロポーショナルフォントなせいで "|" を見落としていました。
そのせいで、3バイトを意味すると思って混乱していたようです。
誤解が解けてすっきりしました。
本当にありがとうございます。

「ASCIIキャラクタとsjis半角カナ」 と 「sjis2バイト文字」 では当たり前かもですが、1バイト目が重複することはありえないわけですから、
Shift_JIS の [?x81-?x9f?xe0-?xfc] で終わっているようなのは不正ですね。

# http://www.atmarkit.co.jp/fsecurity/rensai/hoshino10/hoshino02.html
# [マルチバイト文字の1バイト目(0x82)] ってどういうことなんでしょう。
# "82" がマルチバイト文字の1バイト目ということは分かるんだけど、"0x" って・・・。
# マルチバイト文字の1バイト目が "82" であるということを、"0x82" と表記するって決まりがあるんだろうか。
01221152006/09/23(土) 20:10:35ID:???
2chブラウザでコピペしたときに正規表現が変になっちゃいました
0123nobodyさん2006/09/23(土) 20:21:34ID:???
おまえらおもしろいな

use Encode qw/encode decode/;
encode( 'sjis', decode( 'sjis', $q->param('query') ) );
0124nobodyさん2006/09/23(土) 20:23:05ID:???
>>121
0x の接頭辞は、16進数である事を示す。
0x82 で16進数の82を指す。
0125nobodyさん2006/09/23(土) 20:24:48ID:???
貼るの忘れた
http://search.cpan.org/~dankogai/Encode-2.18/Encode.pm#Handling_Malformed_Data
0126nobodyさん2006/09/23(土) 20:43:33ID:???
まあ、いちいち変換→逆変換するのは無駄い気もするけどね。
01271212006/09/23(土) 21:39:58ID:???
>>124
サンクスです
0128nobodyさん2006/09/23(土) 21:39:59ID:???
PERL5ってこのスレでいいの?
0129nobodyさん2006/09/23(土) 21:49:51ID:???
>>123
あーEncodeって半端なマルチバイトを落としてくれるのか知らなんだ
入力された文字コードのチェックするしコストにはならないよね
0130nobodyさん2006/09/24(日) 00:58:20ID:???
Encode.pmはjcode.plよりも劣るから使ってない
jcodeにはutfパッチのやつとかあるしさ
0131nobodyさん2006/09/24(日) 01:07:12ID:???
>>130
凄い釣りですね^^
次はPerl5はPerl4より劣るから使ってないとか言い出すんですか?
0132nobodyさん2006/09/24(日) 01:15:21ID:???
ワロス
0133nobodyさん2006/09/24(日) 01:27:45ID:???
そんなエサに俺様がクマー
0134nobodyさん2006/09/24(日) 04:38:21ID:???
勉強になるなぁ。
0135nobodyさん2006/09/24(日) 04:47:31ID:???
釣りの?(´・ω・`)
0136nobodyさん2006/09/24(日) 05:19:33ID:???
=チラシの裏
最近 perl の
  my $this = shift or return;
  $hoge ||= 'hogehoge';
  $piyo &&= piyopiyo($piyo);
こういう書き方にエクスタシーを感じてきた。 if文いらないのステキすぎ。
=cut
0137nobodyさん2006/09/24(日) 05:33:37ID:???
おまいらPerlメモを知らないのか?
ttp://www.din.or.jp/~ohzaki/perl.htm
0138nobodyさん2006/09/24(日) 11:31:51ID:???
良くわからない正規表現使うよりは、
String::Multibyteモジュールを使ってみるのも。
use String::Multibyte;

my $str = "イリーガル\x82";
my $sjis = String::Multibyte->new('ShiftJIS');
print $sjis->islegal($str) ? 'true' : 'false';

ttp://homepage1.nifty.com/nomenclator/perl/shiftjis.htm
も参考になる。
0139nobodyさん2006/09/25(月) 00:34:54ID:wf+gGDeG
21:00pmにc:\beta.exeを終了させるプログラムはどのようなソースになりますか?
0140nobodyさん2006/09/25(月) 01:22:59ID:???
>>139
>>1 ぐらい読め。
> 【投稿する際の注意】
> 質問するときは内容をよく吟味してから投稿してください。
> 「コマンドの意味がわかんない」とかはマニュアル見ましょう。
> 回答者さんは何でも屋じゃありません。
>
> 1: 自分はこういう事がしたい。
> 2: それでこんな風にやってみたが・・・
> 3: こんなエラーが出て上手く行かなかった。
0141nobodyさん2006/09/25(月) 06:43:54ID:???
>>99,100
さんくすです。
0142nobodyさん2006/09/27(水) 10:30:04ID:???
ひさびさにPerlメモ見たら、

※上記の内容について
最近の perl(perl5.8.8等)では,index 関数を使うよりも, /\Q$keyword\E/ という正規表現を使った方が速いようです.実行速度は perl のバージョンや実行環境,スクリプト等に影響されるため,必要に応じてベンチマークをとるのがよいでしょう.

って書かれてた。7月下旬に更新されたらしい。
数年越しでも書き換えなきゃいけない情報をちゃんと更新するのは偉いなあ・・・。ちょっと遅いけど、まあGJ!
0143nobodyさん2006/09/27(水) 12:02:27ID:???
正規表現を使わないなら関数を使うより速いことが多い
0144nobodyさん2006/09/27(水) 16:45:21ID:???
日本語でおk
0145nobodyさん2006/09/27(水) 16:57:20ID:???
/\Qpenis\E/ ⇒ 正規表現なし ⇒ 高速
/^pen(?: )?is$/ ⇒ 正規表現あり ⇒ 低速

C言語のstrcmp()に置き換えできるような場合、Perlでは/〜/を使う方が速い
…とどこかのサイトに書いてあったがURLを紛失してしまった
0146nobodyさん2006/09/27(水) 17:13:22ID:???
でも誤差程度ならindexでいい気が。
■ このスレッドは過去ログ倉庫に格納されています