正規表現道場@2ch

**ヽ(´▽｀)ノ** · 2001/07/26(木) 09:03

以外と毛嫌いして居る人も多そうな正規表現、
でもperlを使いのなす上で避けて通れない道だったりするかもです。
そこで、スクラップブック的に目に止まったカッコイイ正規表現を
書き留めておこうと言うスレッドです。
質問する時は言語と、得たい結果をなるべく詳しく書いてね。

取り合えず僕が知ってる有用なリンクです。
http://www.din.or.jp/~ohzaki/perl.htm
http://www.kt.rim.or.jp/~kbk/regex/regex.html

もっとｲｲ（・∀・）リンクは>>2-10さん辺りが書いてくれるカモ････

**878** · 02/11/05 14:42

訂正。
-----
もとデーターは
http://www.ss.iij4u.or.jp/~osamu-s/bibliography.htm
と
http://ime.nu/homepage.mac.com/hitou/satoyama/bunken.html
で作ったファイルをｇｒｅｐしたものです。

**nobodyさん** · 02/11/05 14:43

>>878
タグがついてるし、複数行もあるけど？

**nobodyさん** · 02/11/05 15:01

>>878
Perlでなら簡単にできるが、シェルコマンドでやりたいの？

**878** · 02/11/05 15:37

ソートできるのであれば、何でもいいんです。

それから、僕はタグはw3m -dumpしました。

**nobody** · 02/11/05 21:49

>>882
これはどう？
while(<>) {
$landscape{$1} = $_ if /\Qランドスケープ研究\E.+?(\d.+)/;
}
foreach $key (sort {$a <=> $b;} %landscape) {
print $landscape{$key};
}
sjisでやるときのために、\Q\E入れますた。

**nobodyさん** · 02/11/05 22:29

>>883
で、できました！！！！

こんなに短く書けるのですね！！！

perlと883ﾀﾝ
って何てすばらしいんだろう！！！

**nobody** · 02/11/05 22:38

>>884
よかったっすね。
ところで、書き込んでから後で気づいたんだけど、昇順ソートにもかかわらず、
61: 296-298.の方が61: 287-289.より前に来ちゃうのよね。どしてー？

◆hMJAPH9PWA · 02/11/06 15:07

>>885
"61: xxx-xxx"の61しか見てないからだよ。

**nobodyさん** · 02/11/06 16:45

>>886
(\d.+)/て最長（行末まで）に一致しない？

**nobodyさん** · 02/11/06 22:30

cmp と <=>

**nobodyさん** · 02/11/06 22:49

>>888(末広がりさん）
記号や空白は、数値としては解釈されないんですね。
ありが㌧

**nobodyさん** · 02/11/07 10:52

#から#までをボールド
/から/までをイタリック

#hello# -> hello
/hello/ -> hello

s|#(.*?)#|$1|g;
s|/(.*?)/|$1|g;

としてましたが

#hello/nest#hello/
ってのがきちゃうと
hellonesthello
ってなっちゃいます。
hellonesthello
ってしたいんですけどスマートな解決法ありませんでしょうか？

**nobodyさん** · 02/11/07 12:02

>>890
#hello/nest/#/hello/

**nobodyさん** · 02/11/07 12:08

>>890
/だと閉じタグの/と紛らわしいので他のにしてください。

**nobodyさん** · 02/11/07 15:20

perlの正規表現で
29から44までの数字ってどう表しますか？

for(29..44)は使わないで、表現してください。

**nobodyさん** · 02/11/07 16:09

/(?:29|3[0-9]|4[0-4]/

**nobodyさん** · 02/11/07 16:09

カッコは不要か
/29|3[0-9]|4[0-4]/

**教えて偉い人** · 02/11/07 19:37

えーと　テキスト中に入れ込むマクロということで、 [@ と @] でくくっています。
で、
[@ [@ xx @] @] <= 本文
1__2_____3__4 <= 話をわかりやすくするための括弧の通し番号

こんな風になったとき、最短の [@ xx @] (番号 2と3 ）を取り出したいのですが
最短一致で [@ .+? @] としても [@ [@ xx @] (番号 1と3 ）が取り出されます。
どうすればいいのでしょうか....
なお、xx の変わりに @ や [ や ] が単独で入る可能性はあるので、
[^@\[\]]+? は使えません

ちなみに jscript です

**nobodyさん** · 02/11/07 21:05

PHPの書籍で、メールアドレスにマッチさせるとして以下の正規表現が載っていました。
"^([a-z0-9_]|\\-|\\.)+@(([a-z0-9_]|\\-)+\\.)+[a-z]{2,4}$"

"\"がふたつ続いている部分は、意味があるのでしょうか。
"\"をひとつにしてもちゃんとマッチしたのですが…。

**nobodyさん** · 02/11/07 21:29

> "\"がふたつ続いている部分は、意味があるのでしょうか。
ある
> "\"をひとつにしてもちゃんとマッチしたのですが…。
気のせい

**nobodyさん** · 02/11/07 21:53

>>898 ありがとうございます。

これでもマッチしますた。
<?php
$mail = "a.b-.c@a.b--b.cc";
if(eregi("^([a-z0-9_]|\-|\.)+@(([a-z0-9_]|\-)+\.)+[a-z]{2,4}$",$mail)) echo "yes!";
?>

どんな場合に"\\"が意味を持つのでしょうか。

**nobodyさん** · 02/11/07 22:04

>>899
マッチすべきでないものにもマッチしないか?
あくまで稚拙なテストでうまく動いてると言い張るなら勝手にしろ
> どんな場合に"\\"が意味を持つのでしょうか。
そんな場合

**nobodyさん** · 02/11/07 22:38

すみませんでした。
"\\"の意味を教えていただけないでしょうか。

正規表現のリファレンスページでは見あたらなかったので、
"\\"というくくり方（捉え方）がそもそも違うのかもしれませんが、
わたしの聞きたいところはご理解いただけないでしょうか。

**nobodyさん** · 02/11/08 01:21

"\\"は￥を表す

**nobodyさん** · 02/11/08 02:00

わたしの未熟な知識だと、
"\."は"."そのものを表し、"\\."なら"\"と任意のひと文字にマッチする…。
ということになるのですが、>>897の場合は違いますよね…？
どう違うのでしょうか。

**nobodyさん** · 02/11/08 02:12

>890
s{(?:#(.*?)#)|(?:/(.*?)/)}{
"$1" unless $1 eq undef;
"$2" unless $2 eq undef;
}ge;

これだと
#hello/nest#hello/ は
hello/nesthello か。

invalid な HTML 吐かないだけマシって考えてください。

02/11/08 02:52

"\""="
"\\"=\
"\\."=\.
?

**nobodyさん** · 02/11/08 03:00

***@2ch.net

**897** · 02/11/08 03:57

えと、905さんの真意は不明ですが、
わたしは905さんとほぼ同じように考えています。
ただし、"\\."だと、"\."という文字列ではなくて、
文字列としての"\X"とか、"\0"とかにマッチする、
つまり、"."は正規表現として扱われるのではないか、と。
そうだとすると、メールアドレスに"\"なんて含まないじゃないか、
なんて思ってしまうわけです。

906さんもヒントなのでしょうか？
***@2ch.netだと、"*"がマッチしないので、ダメですよね。
("\"のときも"\\"のときも)
abc@2ch.netにしてみましたが、当然マッチします。
("\"のときも"\\"のときも)

**nobodyさん** · 02/11/08 04:03

"<a href=\"index.html\">" → <a href="index.html">
"\\" → /\/
"\\." → /\./
?

**nobodyさん** · 02/11/08 08:20

>>905, >>906, >>908
日本語不自由ですか？

**nobodyさん** · 02/11/08 08:46

>>909
FUCK OFF.

**>>897** · 02/11/08 17:02

"^([a-z0-9_]|\\-|\\.)+@(([a-z0-9_]|\\-)+\\.)+[a-z]{2,4}$"ってのはつまり
'^([a-z0-9_]|\-|\.)+@(([a-z0-9_]|\-)+\.)+[a-z]{2,4}$'でしょ？
"^([a-z0-9_]|\-|\.)+@(([a-z0-9_]|\-)+\.)+[a-z]{2,4}$"にしたら
'^([a-z0-9_]|-|.)+@(([a-z0-9_]|-)+.)+[a-z]{2,4}$'になっちゃうから、
たとえば「"@a>aa」などにもマッチするのでは？

**897** · 02/11/08 19:47

>>911 ありがとうございます。
えと、無駄なものもあるのかもしれませんが、
$mail = 'a@a>aa';
$mail = '"a@a>aa';
$mail = '\"a@a>aa';
$mail = '"a@a\>aa';
$mail = '\"a@a\>aa';
以上のすべての$mailの場合で、
if(eregi("^([a-z0-9_]|\-|\.)+@(([a-z0-9_]|\-)+\.)+[a-z]{2,4}$",$mail)) echo "yes!";
以上の判別にマッチしませんでした。（yes!と表示されない）

もちろん
$mail = 'a@a.com';
ならマッチします。

**897** · 02/11/08 19:52

>>911さんがおっしゃりたかったのは、
正規表現として読まれる前の正規表現というか、
"\."をもう一度正規表現として読むと、
正規表現としての"."になってしまう、という意味ですよね。
でも、実際はそういう、二段階で読まれる構成にはなっていないようです。

わかりにくくしか書けなくてすみません。

**nobodyさん** · 02/11/08 20:52

ある文字数制限を越えたら、自動的に切りつめてくれる正規表現を書くにはどうしたら？

たとえば、制限文字数20文字だとして、

ｈｔｔｐ://dailynews.yahoo.co.jp/fc/science/astronomy/
↓
<a href="ｈｔｔｐ://dailynews.yahoo.co.jp/fc/science/astronomy/>
ｈｔｔｐ://dailynews.ya...
</a>

こんなのを考えてるんですが・・・

**nobodyさん** · 02/11/08 21:37

ttp://itp.ne.jp/servlet/jp.ne.itp.sear.SCMSVTop
タウンページでの検索結果を
CSVなどの構造化されたデータに変換する最も一般的な手段は
何でしょうか？

ぼくは今まで、w3m -dump →正規表現
と回してましたが、直接HTML読んでCSVなりに変換されている方
いらっしゃいませんか？

**nobodyさん** · 02/11/08 21:49

>>915
はげしく外出。>>789,>>800

**nobodyさん** · 02/11/08 21:50

>>914
ｈｔｔｐなんていう全角のurlがあるとは思われんので
レス不可能。

**914** · 02/11/08 21:53

ごめん自己解決した。
phpでやってるんですが、

$text = eregi_replace(
"(http://[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]?)".
"[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%#]*",
'<a href="\0">\1</a>', $text);

こんな感じのでできました。
果てしなくコードきもいけど。
もっとスマートな方法あるんでしょうか。

**914** · 02/11/08 21:56

>>917
いや、ほら、
掲示板で半角でhttpって打つと、
勝手にリンクに変換されてうざいじゃないですか。

**nobodyさん** · 02/11/08 22:22

>>918=914
{1,20}を使う。後は分かるはず

**nobodyさん** · 02/11/08 22:25

>>919
だーからー、
ｈｔｔｐ://dailynews.ya...
は、20文字制限って言ってるのに24文字でしょ、
もしかして、マルチバイト対応での話？

**920** · 02/11/08 22:34

>>921
だーからー、
本当はソレは半角なんだが、
ここ(２ちゃんねる)では勝手にリンクに変換されてうざいってことでしょう。

**914** · 02/11/08 22:50

おー、きもちいいくらいすっきりした。ありがとうです！

$text =
preg_replace("#ftp://([-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%\#]{1,16})[-_\.!~*'()a-zA-Z0-9;/\?:@&=+$,%\#]*#i",
'<a href="\0">\1</a>',
$text);

>>912 そうです。

できれば、「20文字以上を越えたら"..."つける」っていう機能もほしいな、
とか、思ったりしたり。。。。

**nobodyさん** · 02/11/08 22:55

書いてたら先越された・・・
「20文字を超えたら」のところはif文との組み合わせでしょ。

**nobodyさん** · 02/11/08 23:01

>>922
だーからー、じゃなかった、
そーれじゃー、
sedとかPerlで
s/(<a href=\")(ｈｔｔｐ:\/\/.............)(.+>)(<\a>)/$1$2$3$2$4/;
かいな。sedでは\1, \2 ...だったけや。

**nobodyさん** · 02/11/08 23:14

s{(http://[-\w\./~\%#\@&?]+)}{"<A href=\"$1\">".(length($1)>20?substr($1,0,20).'...':$1).'</A>'}ge;

**914** · 02/11/08 23:32

(´Д｀)PHPだとe修飾子の関数内で後方参照が使えない。。。。

みんなPerl派なのかな。
はて、どうしようか。

**914** · 02/11/09 00:13

むぅぅ、できた！

function e_modifier($match){
if(strlen($match[0]) > 20){
return "<a href=\"$match[0]\">".substr($match[0],0,20)."…</a>";
}else{
return "<a href=\"$match[0]\">".$match[0]."</a>";
}
}
$text = preg_replace_callback("|gopher://[-_\.!~*'()\w;/\?:@&=+$,%#]+|i", 'e_modifier', $text);

結構ながくなっちったなあ。
それにしても、完結に書ける分Perlはいいなあ。
>>926 さんのやつかっこいいコードです。

**nobodyさん** · 02/11/09 00:15

>>928
自分でできるんならいちいち聞くな。

**897** · 02/11/10 11:41

あの、>>897の質問はもう放置でしょうか…。
やさしーい方が答えてくださるとうれしいです。
すみません、これでダメならもう聞きません。

**nobodyさん** · 02/11/10 16:03

その問題は、既に解決しています。

**nobodyさん** · 02/11/11 20:19

$word=~s/AA(\d+)$//;
とすると、数字がないときに$1に変な文字が入るのですが
どうすれば入らないようにできますか。

**nobodyさん** · 02/11/11 21:43

if ($word =~ s/AA(\d+)$//) {

}

**nobodyさん** · 02/11/11 23:45

>>932
変な文字が入る？例えばどんな？

**nobodyさん** · 02/11/12 21:56

>>934
ソースにない文字なので、ファイルのデータだと思われます。

**nobodyさん** · 02/11/12 23:51

my $var = '1';
my $foo = 'A';

$var =~ /(\d)/;
print $1, "\n";
$foo =~ /(\d)/;
print $1, "\n";

1
1

つうことじゃないの？
何で何をどうやってるのかわからんけど。

**nobodyさん** · 02/11/13 08:12

>>935がアフォに1票

**nobodyさん** · 02/11/16 12:23

$value =ereg(~ s/%([a-fA-F0-9][a-fA-F0-9])/pack("C", hex($1))/eg);

長いと頭がこんがらがって・・・
誰かこの意味を教えてくださいｍ（＿）ｍ

**nobodyさん** · 02/11/16 12:25

間違えた。こうですた。

$value =~ s/%([a-fA-F0-9][a-fA-F0-9])/pack("C", hex($1))/eg;

**nobodyさん** · 02/11/16 13:10

16進数？

**nobodyさん** · 02/11/16 13:20

意味ったって、１６進を１０進の文字コードに置換してるだけだろ

**nobodyさん** · 02/11/16 17:44

URLデコード

**nobodyさん** · 02/11/23 02:46

ある属性が含まれてるタグのみマッチさせたいってときは
どんな風な正規表現を組み立てたらいいんでしょう？

$attr ='class';

<\s*(?:\w+)(?:\s+(?:(?:$attr\s*=\s*".*?")|(?:\w+\s*=\s*".*?")))+\s*/\s*>

ってやったのですが、これだと

<a href=".."> みたいな属性が指定してあるタグ全部にひっかかってしまいます。

**nobodyさん** · 02/11/23 09:51

<\s*(?:\w+)(?:\s+(?:(?:$attr\s*=\s*".*?")|(?:\w+\s*=\s*".*?")))+\s*/\s*>
　　　　　　　　　　　　　　　　　　　　　　　　　~~~~~~~~~~~~~~~~~~~
　　　　　　　　　　　　　　　　　　　　　　　　　ここでマッチしてるんじゃない？

**nobodyさん** · 02/11/23 10:11

>>944
ありがとうございます。
うーん、それを外すと
<a id="index" href=".."> みたいな
他の属性あるとき引っかからなくなりますよね。

とりあえずタグだけひっかけて
それから id が含まれるかどうか
別の正規表現で調べたほうがいいのでしょうか。

**nobodyさん** · 02/11/23 12:31

/<(\w+)(?=[^>]*$attr)[^>]*>(?:.*?<\/\1>)?/o;

**nobodyさん** · 02/11/23 22:14

>>946
<a href="ideon">なんかにもかかっちゃわないか？？

**nobodyさん** · 02/11/24 18:08

/<(\w+)(?=[^>]*\b$attr\b)[^>]*>(?:.*?<\/\1>)?/o;

**nobodyさん** · 02/11/24 19:01

>>948
<a href="id/zero"> だと駄目じゃない。
".." の中を排除しなきゃだめか。

**nobodyさん** · 02/11/24 22:21

～にマッチする、ただし特定の単語は除くという場合どう書いたらいいでしょうか。
Wikiに使うWikiNameで特定の単語は除外したいんですが。

$WikiName = '([A-Z][a-z]+([A-Z][a-z]+)+)';

これで例えば Regularという単語はマッチしないようにしたいんですが。

あと950踏んだので次スレ必要ならば立てますね。

**nobodyさん** · 02/11/24 22:32

>>950
それ、Regular にはマッチしないんではないかと。
特殊なページ名にマッチして欲しくないなら
特殊なページ名は増えてくだろうから
マッチしてからきりだして比較のほうがすっきりすると思う。

**nobodyさん** · 02/11/24 22:47

しまったぁ。そうですね。
じゃあRegularExpressionsにマッチしないようにしたいと読み替えてください。

マッチしてから比較ですか。どうしようかな。
というのも(PukiWikiなんですが）マッチしたりする部分は深いところにあるので、
自分の技量じゃ改造できそうにないんです。
それでFAQ見たら ttp://pukiwiki.org/index.php?%5B%5BBugTrack%2F146%5D%5D
$WikiNameの正規表現を弄ればいいとなってまして。

次スレ立てますね。

**nobodyさん** · 02/11/24 23:01

建てますた。
http://pc.2ch.net/test/read.cgi/php/1038146241/

移行前に>>950の質問にアドバイスくれるとありがたい :-p

**nobodyさん** · 02/11/24 23:18

うーん、Wiki の場合そこの正規表現は何度も使われるし、
変に凝った正規表現にしちゃうと
メンテナンス性、速度の二点において不利になるかと。
PukiWiki のサイトでリクエストしてみたら？
指定した単語リストを WikiName として自動認識しない処理がほすい、ぐらいで。

**nobodyさん** · 02/11/24 23:45

やっぱそうですよねぇ。

しかしそのリクエストはWikiの存在理由に関わるのでなかなか取り入れてもらえないのです。
過去に数回要望があったみたいなんですが。

しかしプログラミング言語の型名とか（の途中が）勝手にWikiNameになると
気持ち悪くてしょうがないなぁ。
CClassNameとかだとClassNameだけ引っかかっちゃうんですよね。
この場合↑も引っかかるように変えれば気持ち悪くはなくなるのか。

**nobodyさん** · 02/11/24 23:52

プログラムのソースの場合、
文脈を読んで WikiName にして欲しいよね。どうせなら。
関数名とか意味あるとこだけ。
ちなみに私は
$WikiName = '([A-Z][a-z]+([A-Z][a-z]+)+)';
による自動マッチ自体不要派です
英語圏じゃ便利かもしれないけど
日本語ではいまいちだし、
今みたいにサイトを作る、っていう目的で運用されることが多い中、
意図しないところでリンクされるのは邪魔でしかない。
それに、PukiWiki はアイデアメモとかそういう方向進んでないし。

ってスレ違いだな・・・。

**nobodyさん** · 02/11/27 09:56

スペース（OR　Tab）区切りのファイルから値を変数に入れるのに､

@array = /(\S+)/g;
$top=@array[0];
$bottom=@array[1];
$rval=@array[2];
$lval=@array[3];

よりみじかく書けますか？

**nobodyさん** · 02/11/27 12:32

($top, $bottom, $rval, $lval)= /(\S+)/g;

配列 @array を再利用するなら
($top, $bottom, $rval, $lval)= @array= /(\S+)/g;

**nobodyさん** · 02/11/27 16:47

( $top, $bottom, $rval, $lval ) =split /\s+/;
だろう。

**nobodyさん** · 02/11/27 16:48

ちなみに、split /\s+/ は最適化されてるらしいから
m 使うより速い(はず)

**nobodyさん** · 02/12/19 08:48

他で聞くよりもここで聞いた方が早そうなので聞きます。

【日本語の正規表現】がどうしてもめんどくさい時に
KAKASIなどを使って`テキスト'を【ローマ字の読み】に変換してから正規表現にかけます。

その後、変換された`テキスト'を元の【日本語のテキスト】に
戻すことができればいいのですが、この方法を誰かしりませんか?

KAKASIで変換する際に【漢字⇔読み】の変換テーブルを生成してくれれば
話は楽なのですが、何か良い方法ないないでしょうか?

ｽﾚﾁｶﾞｲ、スマソ。

**nobodyさん** · 02/12/19 17:36

正規表現の基本的な質問を致します｡

[^y]は文字の否定ですよね？

「yahoo以外」
という風に

文字列の否定
はどうやるのでしょうか？

**nobodyさん** · 02/12/19 21:43

[^(文字列)]

**nobodyさん** · 02/12/20 10:56

すみません！！すみません！！

w3m -dump http://www.city.sendai.jp/kankyou/toshisuishin/guide/02/01.html >event.txt
でテキスト化したテーブルを
"┌"
で区切り文字として、テーブル毎に１ファイル生成したいのです｡

分割の際は、csplitコマンドを使いたいのですが、こいつはマルチバイトに対応していない
ので、odなどで調べて実際のコードでマッチさせたいのですが、
やり方がわかりません！！

event.txtの中には"┌"が12個あるので、イメージとしては
% csplit -f table_ event.txt /"┌"/ {12}
こんな感じですが、
マルチコードがダメなんで、
% csplit -f table_ event.txt /"『ここにコード』"/ {12}
としたいのです！！

どなたかアドバイス下され！
困っております！

**964** · 02/12/20 10:57

12個
↓
24個
の間違いでした｡

**nobodyさん** · 02/12/22 18:48

Perl 5 なのですが、マッチした部分を、さらに置換するにはどうすれば良いでしょうか？

$a = "<ul><\/p><li><\/li><\/p><\/ul>";

$a =~ s/(<ul>.*?<\/ul>)/\1 = s/<\/p>//g;/g;

↑こんな書き方はないみたいですけど、なんとなく私のやりたいことは分かってもらえるかと思ったので、ちょっと書いてみました・・・

うまく説明できないのですが、<ul> タグ間にある タグを取り除きたいのです。
なにか良い方法はないでしょうか？

**nobodyさん** · 02/12/22 18:56

>>966
<ul>の中のを除去するだけなら
<ul>の中のにマッチする表現を一つ書けばすむんじゃないの？

**nobodyさん** · 02/12/22 20:56

そもそも$aってばちゃんと表示してくれるの？
ブロックのネスティングがおかしいように思うけれどんも。

**966** · 02/12/22 22:49

>>967
<ul>の中のにマッチする表現とは、どのように書けば良いのでしょうか？

**966** · 02/12/22 22:51

>>967
<ul>の中のにだけマッチするように表現・・・できますか？

私などでは、まったく分かりません・・・

**nobodyさん** · 02/12/22 23:39

s/(<ul>).*?.*?(<\/ul>)/\1\2/g;
s/(<ul>).*?<\/p>.*?(<\/ul>)/\1\2/g;

↑こうやる・・・とか ^^; ？

**966** · 02/12/22 23:42

やっぱ駄目か・・・

**966** · 02/12/22 23:45

$a =~ s/(<ul>.*?)(.*?<\/ul>)/\1\2/g;
$a =~ s/(<ul>.*?)<\/p>(.*?<\/ul>)/\1\2/g;

↑これを 100 回くらい繰り返せば、まず大丈夫・・・って、なんてアホな方法 ^^;

**nobodyさん** · 02/12/22 23:48

>>970
良く分からんけど
while($text =~ s|(<ul>.*)</?p>(.*</ul>)|$1$2|){1;}
とかループで回してみたり。
一歩間違うと無限ループ直行ですが。

v · 02/12/22 23:51

http://yahooo.s2.x-beat.com/linkvp/linkvp.html

**966** · 02/12/23 00:03

>>974
あ！なるほど、ループすれば良かったのか！！

どうもです、やってみます。

**nobodyさん** · 02/12/23 01:06

perlって$1等で参照を変数のように扱えたんじゃなかったかな？
<ul>が複数あると結局ループを使ってしまうけど。

**nobodyさん** · 02/12/23 01:29

$1は定数（read-only)ですがなにか？