Perlコーディング初心者質問スレ Part 59

**nobodyさん** · 2009/02/16(月) 11:42:29

Perlのコーディングで困ってる人のスレです。

【投稿する際の注意】
質問するときは内容をよく吟味してから投稿してください。
「コマンドの意味がわかんない」とかはマニュアル見ましょう。
回答者さんは何でも屋じゃありません。

1：自分はこういう事がしたい。
2：それでこんな風にやってみたが･･･
3：こんなエラーが出て上手く行かなかった。

最低でも1と3が無いと誰も答えられないよ。
良い回答は良い質問から。一緒に勉強しましょう。

お勧めサイトは >2 以降

前スレ　http://pc11.2ch.net/test/read.cgi/php/1218030872/

**キュウテｨｲﾊﾆ-** · 2009/05/08(金) 18:21:55

%00はどういう意味なんだろう？

**キュウテｨｲﾊﾆ-** · 2009/05/08(金) 18:24:51

>>435
リファラーにq="なんたら"
って書いてある"なんたら"の
"なんたら"と、その回数が知りたいのです

**nobodyさん** · 2009/05/08(金) 18:37:21

検索語からして馬鹿を露呈してると思うよ。
>>432から"検索語"を抜いた"apache referer 集計 perl"でググっただけで死ぬほど出てくるというのに。

**nobodyさん** · 2009/05/08(金) 18:38:33

リファラ集計
open IN, '<', '/apache/logs/access.log';
my%ref_cnt;foreach my$log(<IN>){$log=~m/^.*? .*? .*?\[.*?\] ".*?" [0-9]{3} .+ "(.*?)" ".*?"/;$ref_cnt{$1}++;}
my@keys=sort{$ref_cnt{$b}<=>$ref_cnt{$a}}keys%ref_cnt;for my$key(@keys){print$ref_cnt{$key}.":".$key."\n";}

**キュウテｨｲﾊﾆ-** · 2009/05/08(金) 18:39:16

>>438
うむ！頑張ってみる！

**nobodyさん** · 2009/05/08(金) 18:42:59

簡単に漠然と言っちゃえば % を \ を置き換えたもの
%00 は \0 の NULL 文字となる

だったような気がするんだマイハニー

**キュウテｨｲﾊﾆ-** · 2009/05/08(金) 18:52:02

>>439
検索語が知りたいんです。

**nobodyさん** · 2009/05/08(金) 18:54:48

集計したら、あとはそこから検索語を取り出すだけだろ・・・・･････････・・・・・・・・・・・・・・・･････････・・・・・・・・・・・・・・・･････････
もう君Analogでも使ってればいいと思うよ

**キュウテｨｲﾊﾆ-** · 2009/05/08(金) 18:56:58

>>443
バッチで取得したいのですぅ

**nobodyさん** · 2009/05/08(金) 18:57:50

馬鹿は死んでも直らないって本当だな

**nobodyさん** · 2009/05/08(金) 18:59:36

前にくだすれで大暴れしたりしてた人か

**キュウテｨｲﾊﾆ-** · 2009/05/08(金) 19:01:25

頭を冷やして考えます。

**nobodyさん** · 2009/05/08(金) 19:34:43

>>412
まずレスポンスヘッダのチェックからだろ。

**nobodyさん** · 2009/05/08(金) 19:49:09

もう相手にしないで

はい次の方どーぞ

**アルモコニ** · 2009/05/08(金) 19:54:33

これはどういう意味ですか？

米を煮たいと所存だす。
http://www.google.co.jp/search?hl=ja&q=%E3%83%8B%E3%83%AB%E3%82%B3%E3%83%A1&lr=

ケロロゲ?ムで火をつけリソウシを入れました。
いいぐあいにリソウシは紫の汁を出し、
結局、アルモコニでした。
http://www.google.co.jp/search?hl=ja&q=%E3%82%A2%E3%83%AB%E3%83%A2%E3%82%B3%E3%83%8B&lr=

**nobodyさん** · 2009/05/08(金) 20:25:18

数値のソートはsort関数が早いのかな。
試したら圧倒的になったんだけど。
文字列だとGuttman Rosler変換が断トツだった。

**nobodyさん** · 2009/05/08(金) 21:03:07

で？

**nobodyさん** · 2009/05/09(土) 00:02:11

じ？

**nobodyさん** · 2009/05/09(土) 01:54:05

こ？

**nobodyさん** · 2009/05/09(土) 10:19:40

**nobodyさん** · 2009/05/09(土) 10:20:01

にょ！

**nobodyさん** · 2009/05/10(日) 08:47:53

i2iアクセス解析のサーチワード一覧のソースが欲しいんです。

**nobodyさん** · 2009/05/11(月) 20:26:11

>>457
http://www.google.co.jp/search?q=%CE%B4%CE%B8%CE%BD%CE%B2&lr=

**nobodyさん** · 2009/05/13(水) 13:11:51

すいません。おそらくかなり初心者質問なのですが
xamppの環境で、Shift_JISで書いたコードが、問題なく動作するように
use encoding 'shiftjis', STDOUT => "shiftjis";
を加えたのですが、即座に動かなくなりました。
搭載されているperlはvar5.8.7なので、動かないはずがないのですが･･･
どなたか原因ご存知ありませんでしょうか？

**nobodyさん** · 2009/05/13(水) 13:24:51

エラーログぐらい出せクソ野郎

**nobodyさん** · 2009/05/15(金) 15:32:32

URLを要素ごとに分解したいのですが、色々調べた結果、自分では以下のような形になりました
一応結果は求めたものなのですが、正解なのかどうかわかりません
普通はこうやるとか、間違ってるからこう直せってのがあったら教えてください

my $url = 'http://www.google.co.jp/';

my($scheme, $userinfo, $host, $port, $path, $query, $anchor) =
$url =~ m/
(https?|shttp):\/\/
(?:((?:[-_.!~*'()a-zA-Z0-9;:&=+$,]|%[0-9A-Fa-f][0-9A-Fa-f])*)@)?
(\d+\.\d+\.\d+\.\d+|(?:[a-zA-Z0-9][\-a-zA-Z0-9]*[a-zA-Z0-9]\.)*[a-zA-Z0-9]*)
(?::(\d+))?
(?:((?:\/(?:[-_.!~*'()a-zA-Z0-9:@&=+$,]|%[0-9A-Fa-f])*)*))?
(?:\?((?:[-_.!~*'()a-zA-Z0-9;\/?:@&=+$,]|%[0-9A-Fa-f][0-9A-Fa-f])*))?
(?:\#((?:[-_.!~*'()a-zA-Z0-9;\/?:@&=+$,]|%[0-9A-Fa-f][0-9A-Fa-f])*))?
/ox;

**nobodyさん** · 2009/05/15(金) 16:04:16

>>461
つttp://search.cpan.org/~gaas/URI-1.37/

**nobodyさん** · 2009/05/16(土) 17:28:43

use CGI::Lite;
use encoding 'shiftjis', STDOUT => "shiftjis";

print "Content-Type:text/html\n\n";
my $cgi = new CGI::Lite;
my %g = $cgi->parse_form_data('GET');
print $g{'all-text'};

---表示結果---
\x{0093}\x{008c}\x{008b}\x{009e}\x{0093}s\x{008d}]\x{008c}Ë\x{0090}\x{00ec}\x{008b}\x{00e6}
（本当は「東京都江戸川区」とprintされる）
CGI::Liteは最新版。perl5.8.5 unix環境です

**nobodyさん** · 2009/05/16(土) 18:01:49

変換元のコードが判別出来てない

**nobodyさん** · 2009/05/17(日) 15:36:49

$BB =~ s/:/&url_encode(:)/g;

url_encodeはサブルーチンで普通に使えています
上記のように$BBに入っている文字列の中の「:」だけを全てエンコードしたいのですが、上記のコードだと「:」が「&url_encode(:)」という文字列に変換されてしまいます
正規表現の中でサブルーチンを呼び出すにはどうすればいいでしょうか？

**nobodyさん** · 2009/05/17(日) 15:47:36

**nobodyさん** · 2009/05/18(月) 01:28:52

1byteで回答

**nobodyさん** · 2009/05/18(月) 05:31:12

一体全体、なんでマニュアル調べないんだろうね?
「マニュアルに書いてあることを質問するな」とか云うはるか前の話として、
マニュアルをちょっと調べれば、3秒とか、長くても20秒くらいで
解決することを、わざわざ文章書いてポストするって、
どんだけ時間の無駄づかいなの?

**nobodyさん** · 2009/05/18(月) 09:09:13

スレタイをよく見るんだ

**nobodyさん** · 2009/05/18(月) 09:58:34

親切な人なら
$BB =~ s/:/&url_encode(':')/ge;
よりも↓の方が負荷がかからない
$BB =~ s/:/%3a/g;
と教えるだろうけどＰｅｒｌ使ってて負荷のこと言うと叩かれそうだから言わない

**nobodyさん** · 2009/05/18(月) 12:45:23

use URI::Escape;

my $safe = uri_escape($bb, ":");

これで、おｋ。

**nobodyさん** · 2009/05/18(月) 19:48:23

>>470
質問の本質はそこじゃないしな

**nobodyさん** · 2009/05/18(月) 20:45:50

>>472
おまえさんには「教えてください」なんて口が裂けても言わないから
ダイジョウブダヨ。

**nobodyさん** · 2009/05/19(火) 01:35:37

マニュアル見てもよくわからんってことも少なくないけどな

**nobodyさん** · 2009/05/19(火) 18:36:32

構文チェックでokが出てるのに500吐くんですけど、こういった場合ってどういった原因が考えられるんでしょうか？
サーバがUnixなので改行コードはLFにしてあります。アスキーで転送しました。
use strict;が原因かと思ってコメントアウトしたけど500のままなのです。

**nobodyさん** · 2009/05/19(火) 18:41:42

>>475
chmod ago+x *.cgi

**nobodyさん** · 2009/05/19(火) 19:34:05

>>476
おお！動いた！ありがとうございます。
FFFTPの方で700に設定してたのが悪かったのかな・・・。他はこれで動いてるのに。

**nobodyさん** · 2009/05/19(火) 19:44:30

>>477
当たっちゃったか

apacheは、apacheユーザとかnobodyユーザとかで動くから、
700じゃ実行権限ないの。この設定はhttpd.confで出来るよ。

他で動いてる理由は、4700か2700になってるとかかもしれないね
もしくはrootユーザに設定されてるか。もしされてるなら危険なので変えよう。

**nobodyさん** · 2009/05/19(火) 20:22:03

あとよくあるのが、cgiの場合HTMLを吐かずに終了してる場合

**nobodyさん** · 2009/05/19(火) 20:32:44

>>478
自己レス。
ごめん。勘違いに気づいた
4700、2700じゃ実行できるわけないや

**nobodyさん** · 2009/05/19(火) 20:38:57

ディレクトリ内のファイルを更新日時でソートして表示するにはどうしますか？

**nobodyさん** · 2009/05/19(火) 20:40:03

opendir
stat
map
sort

**nobodyさん** · 2009/05/19(火) 20:44:51

mapで何するの？

**nobodyさん** · 2009/05/19(火) 20:48:58

qx|ls -tl|

**nobodyさん** · 2009/05/19(火) 20:50:50

open IN, "ls -t ./ |";
while(<IN>){
print $_;
}
close IN;

時刻も取りたいなら、-tlにして、\sでsplit

**nobodyさん** · 2009/05/19(火) 20:51:15

フォルダ内のファイルを更新日時でソートして表示するにはどうしますか？

**nobodyさん** · 2009/05/19(火) 21:15:24

@files = `ls -t`; (新しい順)
@flies = `ls -tr`;(古い順)

**nobodyさん** · 2009/05/19(火) 21:20:16

>>486
use strict;
use File::stat;

opendir(DIR, "./") or die;
my @file = readdir(DIR);
closedir(DIR);

my @new = ();
for (@file) {
my $fi = stat($_);
push @new, {name=>$_, mtime=>$fi->mtime};
}
@new = sort { $a->{mtime} <=> $b->{mtime} } @new;

あとは@newが順番は更新日時順でハッシュの配列になってるから。

**nobodyさん** · 2009/05/19(火) 21:22:11

.
..

↑これ消さないと

**nobodyさん** · 2009/05/19(火) 21:26:11

ほら、初心者の頃って、余計なの入ってると理解が遅れたりするじゃん
まずこれが理解できるようになってから、自分で消してもらうってことで。

**nobodyさん** · 2009/05/19(火) 21:28:16

@fileの更新日時ソートを、map、stat、sortで一行で書くにはどうしますか？

**nobodyさん** · 2009/05/19(火) 21:30:22

自分でやれｗ
俺map嫌いなんだよ

**nobodyさん** · 2009/05/19(火) 21:36:48

$dir= ".";
opendir(IN, $dir);
@files= map{$_->[0]}sort{$a->[1]<=>$b->[1]}map{[$_,(stat("$dir/$_"))[9]]}grep(-f"$dir/$_", readdir(IN));
closedir(IN);

**更新日時でソート** · 2009/05/19(火) 21:49:48

ありがとう。みなさんありがとう。

**nobodyさん** · 2009/05/19(火) 21:52:56

まさに黒魔術だよな

**nobodyさん** · 2009/05/19(火) 23:18:27

どいつもこいつも古いopen/opendirの書き方しやがって

**nobodyさん** · 2009/05/19(火) 23:28:19

openとか、デバッグくらいにしか使わないからなぁ

**nobodyさん** · 2009/05/20(水) 00:12:40

新しいのってどんな書き方？

**nobodyさん** · 2009/05/20(水) 00:15:44

open IN, ">", $file;

**nobodyさん** · 2009/05/20(水) 00:21:19

my @file = glob("./aaa");
とか？
でもこれはopendir+readdirだな

なんかのモジュール使うとかだと、結局はopenのラップだしなぁ

>>496
答えは？

**nobodyさん** · 2009/05/20(水) 00:31:37

>>499
入力ファイルが消えてしまったんだが

**nobodyさん** · 2009/05/20(水) 01:06:52

openは3引数で書くようになったが
opendirは相変わらず2引数だなぁ

**nobodyさん** · 2009/05/20(水) 01:15:45

>>500
ファイルハンドルはグローバルだから使うべからず（STDINとかの例外を除く）
>502の言うように3引数でmyつけて使うべし

**nobodyさん** · 2009/05/20(水) 01:28:30

新しい書き方では、出力ファイルのハンドラをINと書く

俺は古いのでいいや、なんか混乱しそうだし

**nobodyさん** · 2009/05/20(水) 01:33:39

自分もファイルハンドルにmy 付けて$変数にするのはもうクセになってるけど、
入出力に文字コード絡みの指定をしない時は、相変わらず2引数使ってることが多いかな。

けど、使い捨ての短いスクリプト書く時は、文字コード絡みがあっても、ついつい、
open(my $f,"$file_name");
binmode($f,":encoding(cp932)");
とかやっちゃうことも多い。

**nobodyさん** · 2009/05/20(水) 01:36:09

ファイルハンドラとかopendirのハンドラとか、なんで変数じゃなくていいんだろうな
逆に不思議だ

**nobodyさん** · 2009/05/20(水) 01:39:23

open my $fh, '+<', 'path' or die $!;

何のことだろって思って調べたんだが、こんな感じであってる？

**nobodyさん** · 2009/05/20(水) 01:48:12

そんな感じであってる

**nobodyさん** · 2009/05/20(水) 02:03:59

どうせなら die "$file:$!";

**nobodyさん** · 2009/05/20(水) 13:51:48

$hog に何が入っているか利用する前に調べる関数とかあるのでしょうか？
$hog にblessされたハッシュが入っているのか、テキストが入っているのか、
数値が入っているのかを利用する前に知りたい状況です。

**510** · 2009/05/20(水) 13:52:55

×blessされたハッシュ
○blessされたハッシュのリファレンス

**nobodyさん** · 2009/05/20(水) 13:57:10

>>510
ref

**510** · 2009/05/20(水) 14:21:19

>>512
ありがとうございます。
これでいけそうです。

**nobodyさん** · 2009/05/20(水) 20:33:00

正規表現を教えてください。
やりたいことは、"「で始まって」って終わる文字列"を置換したいです。
例えば、"「あ」「い」"を"「★」「★」"に置換したのです。
下記のように記述すると、多分２バイトコードである為、うまくいく場合と行かない場合が
あります。どのように記述すればよいか教えてください。

$data =~ s/「[^「」]*」/「★」/gi;

**nobodyさん** · 2009/05/20(水) 20:40:54

s/「(?:あ|い)」/「★」/g

**nobodyさん** · 2009/05/20(水) 20:55:54

>>515
ダメ

**nobodyさん** · 2009/05/20(水) 22:23:39

>>514
# 例えば入力がCP932（≒Shift JIS）なら……

# foo.pl （UTF-8で保存すること）
use strict;
use warnings;
use utf8;
use Encode;

my $encoding = find_encoding('cp932');
my $data = $encoding->decode(shift);

$data =~ s{
(?<= 「 )
( .+? )
(?= 」 )
}{★}xmsg;
print $encoding->encode($data);

__END__

入力
perl foo.pl 「あ」「い」「ほげほげ」

出力
「★」「★」「★」

まああれだ、正規表現を通さなくても、
入れるときデコード、出すときエンコードの癖を付けような

**nobodyさん** · 2009/05/21(木) 01:23:27

ちなみに「ほげほげ」を「★★★★」にする要件なら、
{★}xmsg;
を
{'★' x length($1)}xmsge;
にする感じで。

**nobodyさん** · 2009/05/21(木) 02:45:24

(´-`).｡ｏＯ(.xlsの変換なんだろうなぁ。。。)

**nobodyさん** · 2009/05/21(木) 10:31:35

>>517
「原理原則」や「机上の空論」を正論と思って賞賛してよいのは中学二年生まで

**nobodyさん** · 2009/05/21(木) 15:48:56

>>514の質問は不明な点が多すぎ。
>>517氏の言うように、入出力時に変換するのが基本だから、
どこから読み込んで、どこに出力して、入力、出力、スクリプトそれぞれの
文字コードの情報があると、回答も得られやすいと思う。

古いPerlの場合、CPANからモジュールを突っ込んで使うか、
自分でガリガリ正規表現を書くことになる。
質問に条件をつければ、答えてくれる奇特な人がいるかもしれない。

全て文字コードCP932(日本語Windows環境)と仮定して、
ファイルから読んで、標準出力に出力する場合。

use encoding qw(cp932);
use open qw(:encoding(cp932) :std);

open(my $fh, "foo.txt") or die $!;
my $data = join('', readline($fh));
close($fh);

$data =~ s/「(?:[^」]+)」/「★」/g;

print $data;

**514** · 2009/05/21(木) 16:41:46

説明足らずですみません。
文字コードはShift_JISです。
具体的に説明します。
以下のコードを実行すると
２番目の「」の部分が置換されないのです。
プログラムを始めたばかりの未熟ですみません。

$data = "あ「い」う「ニ世、三世」え";
$data =~ s/「(?:[^」]+)」/「★」/g;
print $data;

exit(0);

**nobodyさん** · 2009/05/21(木) 16:42:15

ﾜﾗﾀ

**nobodyさん** · 2009/05/21(木) 19:18:34

$data = "あ「い」う「ニ世、三世」え";
$data =~ s/「.+?」/「★」/g;
print $data;

v(★０★)v

**nobodyさん** · 2009/05/21(木) 21:18:35

なぜ(?:を知ってて+?を知らぬ

**nobodyさん** · 2009/05/21(木) 21:47:57

それは>>521を丸コピペしただけだからだと思うよぉ
*?と+?は今後よく使うはずだから覚えておこう

**nobodyさん** · 2009/05/21(木) 22:17:03

あんな便利というか必須な機能が、perl4には無いんだよな

**nobodyさん** · 2009/05/21(木) 22:37:14

ちなみにperlの正規表現についてはここを見ておくと吉
ttp://www.kt.rim.or.jp/~kbk/regex/regex.html#PERL

**nobodyさん** · 2009/05/21(木) 22:58:52

perl4は忘れなさい

**nobodyさん** · 2009/05/22(金) 12:59:45

>>522
use strict;
use warnings;
use encoding qw(cp932);
use open qw(:encoding(cp932) :std);

my $data = "あ「い」う「ニ世、三世」え";
$data =~ s/「.+?」/「★」/g;
print $data;

exit;

[^x]+より.+?の方が速いは、衝撃的。

**514** · 2009/05/22(金) 13:01:09

>>524-528

ありがとうございます。
しかし、.+?とは、どういう意味なのかしらん？

**nobodyさん** · 2009/05/22(金) 13:20:16

「1文字以上」　の　「何らかの文字」　の　「最短マッチ」　

左から
+ . ?

**nobodyさん** · 2009/05/22(金) 15:52:26

えっ

**nobodyさん** · 2009/05/22(金) 16:25:07

>>528で確認すると

> +?　+と同様ですが、マッチングがものぐさ(non-greedy)に行われる点が異なります。

とあるが、ものぐさと言われてもわけが分からんだろうな。
greedyが「貪欲な」という意味になるので、non-greedyなら「慎ましく」あたりが該当するのではないか。

だが、慎ましくと言われてもなお意味不明なことだろう。
しかし同時に、分からない者は置いてけぼりで構わないという高潔さも感じたことだろう。
正規表現を覗くものは、正規表現からも覗かれているのだ。

**nobodyさん** · 2009/05/22(金) 19:12:35

なんか見つかったらそれで終わり、というあたりがものぐさなんだろうけど

何故原文も翻訳もそんなあいまいな表現をしたがるんだ