正規表現道場@2ch Part3 s/煽り|荒らし/あぼーん/g

**nobodyさん** · 03/11/19 21:42

Perlに限らずスクリプト系言語で大活躍の正規表現。
このスレは有用そうな正規表現を紹介したり、どう表現したらいいかわからないときに質問をしたりするためのスレッドです。
質問するときは使用言語や得たい結果をなるべく詳しく書きましょう。

註：& や " を書くときには、&amp " と描いておきましょうね。

Perlメモ
　http://www.din.or.jp/~ohzaki/perl.htm
正規表現メモ
　http://www.kt.rim.or.jp/~kbk/regex/regex.html
Regex::Diagram.pm
　http://www.cc.rim.or.jp/~midorin/mad-p/RegexDiagram.html
正規表現
　http://www.cc.rim.or.jp/~midorin/mad-p/perl/benkyou/PRC2kRegex/
UNIX正規表現入門目次
　http://www01.u-page.so-net.ne.jp/jc4/hiroyuki/rex_index.html
Regular Expression(Riue ちゃんの正規表現講座) - Index
　http://www.sixnine.net/regexp/

ほとんどは↓のリンク集にまとまっています。
正規表現最新リンク集2002
　http://www2.famille.ne.jp/~akio1998/l_grep.html

過去スレ
正規表現道場@2ch
　http://pc.2ch.net/test/read.cgi/php/996105815/
正規表現道場@2ch Part2
　http://pc2.2ch.net/test/read.cgi/php/1038146241/

**nobodyさん** · 03/11/19 21:44

motu

**nobodyさん** · 03/11/19 22:56

nikomi

**nobodyさん** · 03/11/20 00:40

nabe

**nobodyさん** · 03/11/20 01:09

uma-

**nobodyさん** · 03/11/20 13:42

shika-

**nobodyさん** · 03/11/20 15:18

chou-

**nobodyさん** · 03/11/20 20:06

流れを断ち切るために9get。

$MyJob =~ s/仕事/労働/;

**nobodyさん** · 03/11/20 20:06

俺は数字が読めない馬鹿でした。

**nobodyさん** · 03/11/20 20:15

$Pay =~ s/残業代//;

**nobodyさん** · 03/11/21 14:29

初心者質問で申し訳ないです。
条文（第一条～第九百九十九条）をアラビア数字（第1条～第999条）に置き換える式を教えてください。

**nobodyさん** · 03/11/21 15:19

>>11
使用言語と環境と文字コードは?

**未承諾広告※** ◆aiY4htt2.2 · 03/11/21 21:05

>>11
$arabic{'第一条'} = 1;
から、
$arabic{'第九百九十九条'} = 999;
まで入れといて、
対象文字列 $joubunn に対して置換してみるとか？

$joubunn =~ /$regexp/$arabic{$regexp}/ foreach my $regexp (keys %arabic);

効率悪そうな悪寒。。。

**nobodyさん** · 03/11/21 22:07

>>13
そういうハッシュテーブル使っていいなら、これでそんなに効率悪くないかと。

%arabic = ('一' => 1, ..., '九百九十九' => 999,);
$joubunn =~ s/(?<=第)(.+?)(?=条)/(defined($arabic{$1}))?$arabic{$1}:$1/ge;

てゆかそもそもそのハッシュテーブルの初期化が効率悪そうな悪寒。。。

**nobodyさん** · 03/11/21 22:43

文字コード Shift_JIS

my %ichi = ("一"=>1, "二"=>2, "三"=>3, "四"=>4,
"五"=>5, "六"=>6, "七"=>7, "八"=>8, "九"=>9);

my %juu = ("十\"=>1, "二十\"=>2, "三十\"=>3, "四十\"=>4,
"五十\"=>5, "六十\"=>6, "七十\"=>7, "八十\"=>8, "九十\"=>9);

my %hyaku = ("百"=>1, "二百"=>2, "三百"=>3, "四百"=>4,
"五百"=>5, "六百"=>6, "七百"=>7, "八百"=>8, "九百"=>9);

$joubunn =~ s/第(.*?百)?(.*?十\)?(.*?)?条/
"第".($hyaku{$1}||"").($hyaku{$1}?$juu{$2}||0:$juu{$2}||"").($ichi{$3}||0)."条"/eg;

# なんかこれって位取りの処理の仕方が肝で、正規表現とはあんまり関係なさそうな予感。

**nobodyさん** · 03/11/23 02:27

検索したい字句が存在してもしなくても
マッチさせるにはどうしたらいいのでしょうか？

<img src="オムレツ.jpg" alt="おいしい料理1">料理の解説1
<img src="カツ丼.jpg">料理の解説2

っというタグがあってこれから

1行目では、
　\1 → オムレツ.jpg
　\2 → おいしい料理
　\3 → 料理の解説１
2行目では
　\1 → カツ丼.jpg
　\2 →
　\3 → 料理の解説2

というようにしたいのです。
src="(.*?)".*?alt="(.*?)".*?(.*?)
↑のような正規表現を考えたのですが
これを2行目にも正しくマッチできるように
修正していただけませんか？

**nobodyさん** · 03/11/23 03:02

src="(.*?)".*?(?:alt="(.*?)".*?)?(.*?)

**nobodyさん** · 03/11/23 03:07

>>17
希望通りの結果が得られました。
どうもありがとうございます。

**nobodyさん** · 03/11/24 18:36

>>11のは、文字列として処理するより、いったん数値にするのがいいと思う
漢数字<->数値<->アラビア数字　で相互変換できればどういったケースでも使える

ちまり正規表現は数字文字列の抜き出しに使うくらいがいいね

**nobodyさん** · 03/11/25 00:30

正規表現の質問！
「改行も含めて全部」はどう表現すればよいのでしょう？
「.*」で「改行以外の任意の文字0個以上＝改行含まない全文字列」
ですが
「改行も含めた任意の文字0個以上＝改行も含めた全文字列」はどう表現すればよいのでしょう？

一応言語はJavaですが、PERLも同じらしいのですが・・

**nobodyさん** · 03/11/25 00:39

>>20
Perlなら　/s オプション
または文字クラスで　[\d\D]*　とか　[\s\S]*　とか　[\w\W]*　とかどうにでもなる。
JavaScriptは知ってるがJava言語は知らん。

**nobodyさん** · 03/11/25 00:42

>>20

>> または文字クラスで　[\d\D]*　とか　[\s\S]*　とか　[\w\W]*　とかどうにでもなる。
>> JavaScriptは知ってるがJava言語は知らん。

Javaでも全部できたみたい!!
今から意味調べます。ありがとうございます！

**nobodyさん** · 03/11/25 00:43

>>20
http://java.sun.com/j2se/1.4/ja/docs/ja/api/java/util/regex/Pattern.html#DOTALL

**nobodyさん** · 03/11/29 00:22

PHPで質問です。

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

<xsl:output omit-xml-declaration="yes" method="xml" indent="no" />

<xsl:template match="/block">!
<html lang="ja" xmlns="http://www.w3.org/1999/xhtml" dir="ltr" xml:lang="ja">!
!
<xsl:apply-templates select="block_head"/>!
!
<xsl:apply-templates select="block_body"/>!
!
</html>!
</xsl:template>

</xsl:stylesheet>

というテキストがあって、<xsl:template>で囲まれた範囲の改行
（"!"があるところ）だけを<xsl:text>\n</xsl:text>に置き換えるにはどう書けば
いいのでしょう。文字コードはUTF-8です。よろしくお願いします。

PHPのXSLT関数ってXSLファイル内のの改行を全部無視しちゃうので明示的に
改行を置かないと出力されるHTMLファイルが一行になっちゃうんですね。

**nobodyさん** · 03/12/01 13:50

>>24
もっとスマートな方法があるかもしれないけど、漏れだったらこうするかな。
1. <xsl:template /> の中だけ取り出す
2. 取り出したものを \n を <xsl:text>\n</xsl:text> に置換する
3. 置換したものを <xsl:template /> の中に戻す

**nobodyさん** · 03/12/01 14:07

>>25の方法での結果

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"><xsl:text>
</xsl:text><xsl:text>
</xsl:text><xsl:output omit-xml-declaration="yes" method="xml" indent="no" /><xsl:text>
</xsl:text><xsl:text>
</xsl:text><xsl:template match="/block">!<xsl:text>
</xsl:text><html lang="ja" xmlns="http://www.w3.org/1999/xhtml" dir="ltr" xml:lang="ja">!<xsl:text>
</xsl:text>!<xsl:text>
</xsl:text><xsl:apply-templates select="block_head"/>!<xsl:text>
</xsl:text>!<xsl:text>
</xsl:text><xsl:apply-templates select="block_body"/>!<xsl:text>
</xsl:text>!<xsl:text>
</xsl:text></html>!<xsl:text>
</xsl:text></xsl:template><xsl:text>
</xsl:text>

**nobodyさん** · 03/12/05 18:55

perlで質問です。
---------------------
あ\n
　　　　　\n
\n
\n
あ\n
---------------------
\nは改行です。
上のようなテキストファイルから2つ以上の連続した空白行を一つにまとめたいと思い、
$対象文字列 =~ m/^\s*\n$/;　（空白文字0個以上だけで構成され改行で終わる）
にマッチしたらフラグをセットし、フラグがオンに間はファイルに出力せず、
フラグがオンかつマッチング対象が空白文字だけで構成されていなければフラグをオフにする。
としようとしたのですが、
対象に空白文字と改行以外の文字が含まれるというのをどうやって表現していいか分かりません。
よろしくお願いします。

27 · 03/12/05 19:01

[^\s\n]で簡単にできました
はいどうも

**nobodyさん** · 03/12/05 19:03

何をしたいのかよくわからん

**nobodyさん** · 03/12/06 23:50

今日電車で置換されました。

**nobodyさん** · 03/12/07 03:53

>>30
同じカバン持ってる奴にお前のカバンを持ってかれたのか？

**nobodyさん** · 03/12/07 05:21

s/財布//g
かもしれん

03/12/07 06:33

>26
それはなかろう。

**nobodyさん** · 03/12/07 11:49

>>1
スレタイのRegExpが意図した通りに動かない恥ずかしいスレはここですか？

**nobodyさん** · 03/12/07 15:12

>>34
いつの世も正規表現とはそういうものなのです。

**nobodyさん** · 03/12/09 11:55

perlで変数$siteurlに入っているURLのドメインを$hogeに代入したいんですが、
・サブドメインがあればそれも
・ドメインに~が続いていたらそのユーザーID(?)まで
↑の条件付でして、思うようにいってくれなくて困ってます。

$siteurl =~ /^https?:\/\/(.*?)\/((.).*)/;
$hoge = $1;
$hoge .= "/$2" if ($3 eq "~");
こんな感じのとこまで考えたんですけどこれだと
http://hoge.hoge/~hoge
http://hoge.hoge/hoge
は意図したとおりなんですが、
ドメインより後ろに何も入ってないときは駄目だし・・
他にも色々調べながら試したんですが
ドメインの後にスラッシュがないと駄目だとか、
とにかく何か色々だめだめなんです。

正規表現からっきし駄目な僕に教えていただけませんでしょうか？

**nobodyさん** · 03/12/09 13:43

>>36
これでどうかな？
$hoge = $1 if ($siteurl =~ /^https?:\/\/([^\/]+(?:\/~[^\/]+|)).*/);

**nobodyさん** · 03/12/09 14:09

>>36
http://www.example.com/~username/path/to/file
という http URL の各部名称は、
"http" ... スキーム (scheme)
"www.example.com" ... ホスト名、サーバ名、ドメイン、FQDN etc.
"www" ... 3rd レベルドメイン、ホスト名、所謂「サブドメイン」 etc.
"/~username/path/to/file" ... パス (絶対パス)
"~username" ... 所謂「ホームディレクトリ」

see also: http://member.nifty.ne.jp/moha/rfc/rfc2396j.txt

my($hoge) = $siteurl =~ m{^https?://([^/]+(?:/[^/]*)?)};
$hoge =~ s/~//;

**nobodyさん** · 03/12/09 16:14

プログラミング･･･ではないのかもしれないのですが、教えて頂けませんか？

gooの辞書から関連語句だけを集めて用語辞典を作りたいので、
「説明文から検索」の機能で抽出した後、
左側に出てきた見出しだけをテキストエディタにコピペして、
単語以外は全て削除したいと思っています。
メモ帳とワードの他にVisual C++があるのですが、
これらで何とかできませんか？
例えば･･･
http://dictionary.goo.ne.jp/search.php?MT=%CE%EB%CC%DA&kind=jn&mode=0

すずき【鈴木】
姓氏の一。...

すずき-あきら【鈴木朖】
(1764-1837) ...

すずきいせき　―ゐせき【鈴木遺跡】
東京都小平市にある旧石器...

すずき-うめたろう　―うめたらう【鈴木梅太郎】
(1874-1943) ...

上記の場合でいうと、
(半角スペース)【鈴木】･･･から行末まで削除、とか
(全角スペース)―ゐせき(半角スペース)【鈴木遺跡】･･･から行末まで削除、というふうに
とにかく最初のひらがな単語だけを残したいのです。

▼などの記号も混ざっているので、段階を踏まなきゃならないのかなとも思いましたが
「正規表現メモ」とか見ても
どうすればいいのかさっぱりなんです(´д｀;
よろしくお願いします。

03/12/09 16:21

‘次の結果→’にはさまれてる‘’の中を取得。
オジーオズボーン単車で事故ったって。

36 · 03/12/09 16:36

すいません、本屋行っててレス遅れました
>>37さんのをちょっとだけテストさせていただいたところ
どうやら期待通りに動いてくれているようです。
それぞれ何をしているのかを調べながら、テストを重ねさせていただきたいと思います
>>38さんの方は返ってくる値が、>>36で質問した
「今回ぼくがやりたいこと」とは期待していたものとは違ったんですが、
最終的にやりたいことが、
「後々入力されたほかのデータが、登録されているｻｲﾄのサーバー上にあるか、
　というか、
　そのｻｲﾄ上のデータかどうかを調べる」
ということがしたかったので、ユーザーIDの自分の中での定義など、
なにか考え直す必要があるような無いような、そんな感じがしました。
・・何が言いたいのが良くわかりませんし、やたら長文で読みにくいと思いますが、
兎に角何がいいたいかといいますと、

本当に有難うございました。

**nobodyさん** · 03/12/09 16:39

timeで時間を取得して3の倍数の分なら処理をしようとしたんですが、ググッて調べた
下の書き方だとエラーが出てしまいます。どこか間違ってるんでしょうか？

if ($min =~ ^(\d+)(?(?{$1 % 3})(?!))$){

03/12/09 16:41

正規表現を使おうとしてるところ?

03/12/09 16:45

>>35
それを言っちゃあおしめえよ。

**nobodyさん** · 03/12/09 17:51

>>43
正解

**nobodyさん** · 03/12/11 14:45

テキストファイル中で「$replace[XXXXX]」となっている部分を
「XXXXX.html」に置き換えるような処理はどうすればよいでしょうか？
XXXXXが可変です。

**nobodyさん** · 03/12/11 14:52

大括弧の中を取得して、それに.htmlを付加すればOK。

**nobodyさん** · 03/12/11 15:00

>>46
さあ、添削してやるから書いてみれ。

46 · 03/12/11 15:14

一応でけました。
初心者なんで、最適化も何もない＆さっき質問したのと話がちょっと違うけどお願いします。
文字列に含まれる$img[XXXXX]の中身XXXXXを関数に渡して、その処理結果で置き換える、ということです。

$test = 'aaa <a href="test.pl"><img src="$img[test1]"></a><img src="$img[test2]">';
$test =~ s/(\$img\[)(\w+)(\])/func($2)/ge;
print $test;

sub func{
local($id)=@_;
if($id eq "test1"){
return "test1が渡されたよ";
}
return "test2が渡されたよ";
}

**nobodyさん** · 03/12/11 15:38

>>49
おおう、いいんじゃない。前後はカッコ要らんけど。
$test =~ s/\$img\[(\w+)\]/func($1)/ge;

**nobodyさん** · 03/12/11 21:09

>>42
if ($min =~ /^(\d+)(?(?{$1 % 3})(?!))$/){

=~の右辺は正規表現だから、m/正規表現/、その省略形、/正規表現/

**nobodyさん** · 03/12/11 21:11

むむ？=~はパターンマッチ…

**nobodyさん** · 03/12/14 11:28

http://cgupload.dyndns.org/~upuser/up2/imgboard.cgi
ここの２ページ以降の正規表現おしえてください

**nobodyさん** · 03/12/14 12:18

その内容を要約してここに書きなさい。

**nobodyさん** · 03/12/14 12:19

>>54
http://www.big.or.jp/~talk/t-club/soft/mini_r6/index.cgi
この掲示板の２ページ目、３ページ目のＵＲＬが
知りたいんですが、どのページも同じＵＲＬなんです・・・・
２ページ目はどうやれば指定できるんでしょうか？
何か元になるＵＲＬに付記すればいいのでしょうか？教えてください・・

**nobodyさん** · 03/12/14 12:29

あまちがえた　ここ

http://cgupload.dyndns.org/~upuser/up2/imgboard.cgi
この掲示板の２ページ目、３ページ目のＵＲＬが
知りたいんですが、どのページも同じＵＲＬなんです・・・・
２ページ目はどうやれば指定できるんでしょうか？
何か元になるＵＲＬに付記すればいいのでしょうか？教えてください・・

**nobodyさん** · 03/12/14 12:53

ここは正規表現のスレです。
激しくスレ違い >>53 >>55 >>56

**nobodyさん** · 03/12/14 12:55

POSTも知らない厨房が紛れ込んだスレはここですか？

**nobodyさん** · 03/12/14 12:57

>>57
>>58
うっせーハゲども
教えれば委員だよおしえれば
シネヤ

**nobodyさん** · 03/12/14 12:59

スレ違いだというのに真っ赤な顔をして書き込んでいる厨房がいるスレはここですか？

**nobodyさん** · 03/12/14 13:01

>>60
してねーよ妄想野郎

**nobodyさん** · 03/12/14 13:02

正規表現に関係ないのに教える訳にもいかんだろーが…

**nobodyさん** · 03/12/14 13:05

しょーがねぇな…

◆HTML講座（Web製作板）
http://pc2.2ch.net/test/read.cgi/hp/1010398268/

**nobodyさん** · 03/12/14 13:10

>>63
そこでおしえてくれ

**初心者** · 03/12/15 04:53

"@"という文字と"word"のどちらかにヒットする正規表現
が分からないのですが、[@]wordではないし、どうなるのでしょうか。

**nobodyさん** · 03/12/15 05:33

>>65
ちみはスレタイも読めないのか？

**nobodyさん** · 03/12/15 06:14

正規表現の質問なんだから間違ってはいないだろう。

**nobodyさん** · 03/12/15 09:03

67=65

68 · 03/12/15 09:05

xorなら話変わるか。
なんで正規表現でやる必要があるのかよく分からんが。

**nobodyさん** · 03/12/15 10:25

>>65
一つの正規表現に拘る必要はないと思うが、、、？
条件分岐だとして例えば
if($key_word=～/@/ || $key_word=～/word/){～以下実行文
では駄目なのかな？

**nobodyさん** · 03/12/15 10:31

Read Only Memory : 書き換え不可の記憶媒体。
Read Only Member : 書き込まない利用者。

**nobodyさん** · 03/12/15 10:59

>>70
わからないなら書かなくていいから

**nobodyさん** · 03/12/15 14:28

>>65
(@|word) とか。
なんでみんなどの言語で実装するか書かないのだろう？

**nobodyさん** · 03/12/15 14:41

それはどちらにもヒットする正規表現では。

**nobodyさん** · 03/12/15 23:09

>>75
　70は間違ってはいないよ、不充分かも知れんが。
　そもそも65の質問がどういうシチュエーションでどういう動作の目的でどういうマ
ッチングをさせたいのかを詳細に述べていないという不充分な訊き方なので、70のよ
うな「充分用を足すかどうかは保証の限りではない」当たり障りのない答えが返って
きても当然だと思うが。
　70の記述で取り敢えず「@」「word」が含まれていれば、その含まれている最初
の箇所マッチする。　複数含まれていて、それを全てマッチさせるのか、n回目まで
マッチさせるのかなどでオプション等の補助的記述が必要になって来るし、「含まれ
ている」ではなく「その単語そのもの独立だけに厳密マッチ」させるのならが、また
違う話になってくる、それをイチイチ説明していたら解説書になってしまう、それは
自分で読んでくれってことになる。

**nobodyさん** · 03/12/16 09:10

なんだ？こいつ。

**nobodyさん** · 03/12/16 13:37

>>76
アホは放置で。

**nobodyさん** · 03/12/16 16:12

不十分とか言う以前に正しい記述をしろってーの

**nobodyさん** · 03/12/16 17:08

>>78
>>75 は、元の質問が十分じゃないので正しい記述は不可能、と言いたいのだろう。
だが、アホなので放置で。

**nobodyさん** · 03/12/18 18:53

小数点を含まない数値にマッチさせるパターンを教えて下さい。

X25.125
X12.1
X78.
でなく
X25
X789
にマッチさせたいんです。　
御多忙中の所、誠に恐縮では御座いますが、
御教示いただければ幸いです。

**nobodyさん** · 03/12/18 18:57

>>80
> X25.125

Xとか入ってるけど，これって数値か？

**nobodyさん** · 03/12/18 19:01

>>80
(.+?)\.

**nobodyさん** · 03/12/18 19:11

スミマセン
Xは無視してもらっていいです。

**nobodyさん** · 03/12/18 19:27

perlの正規表現なんですが、
$hoge = "a(b(c))";
の時に、$hoge =~ m/(.*)$(.*)$/
とすると、$1は"a(b"で、$2は"c)"になりました。
つまり文末から見ていることになるのですが、これを
$1は"a"で、$2は"b(c)"になるようにするにはどうすればいいでしょうか。
よろしくお願いします。

**nobodyさん** · 03/12/18 19:36

>>84
それは文末から見ているんじゃない。. は ( も含むから
最初の .* が一番長くマッチできるところまで取り込んでいるだけ。

/([^)]*)$(.*)$/ か /(.*?)$(.*)$/ かこの辺↓参照。
http://www.din.or.jp/~ohzaki/regex.htm#GetNestedParen

**nobodyさん** · 03/12/18 20:29

>>80は普通に
[0-9]+
じゃない?
全体なら^$つけるとか。

**nobodyさん** · 03/12/18 20:34

同意

**nobodyさん** · 03/12/18 21:08

[0-9]+ ですと
例えば
10.
10.01
10
のうち、全ての"10"を拾います。　上記３つの数値のうち小数点を含まない
10（３つ目）のみにマッチさせたいんです。

**nobodyさん** · 03/12/18 21:11

>>88 -> >>86

**nobodyさん** · 03/12/18 21:42

>>88
>全体なら^$つけるとか。
^[0-9]+$

**nobodyさん** · 03/12/19 06:15

ところが全て行末ではないんです。

**nobodyさん** · 03/12/19 08:15

$perl -pe 's/(?<![\.\d])(X\d+)(?![\.\d])/##$1##/g;' >>80

小数点を含まない数値にマッチさせるパターンを教えて下さい。

X25.125
X12.1
X78.
でなく
##X25##
##X789##
にマッチさせたいんです。　
御多忙中の所、誠に恐縮では御座いますが、
御教示いただければ幸いです。

39 · 03/12/19 10:20

今頃ですが･･･
自力で検索したサイトは難しい所ばかりだった気がしたのですが、
>>1のリンク先を一通りち回って、今回は何とかなりました。
たぶん答えるのもアホらしい低レベルな質問だったんでしょうね。
スレ汚し失礼しました。

**nobodyさん** · 03/12/19 13:04

>92 いいかげんにしろやｶｽ

**nobodyさん** · 03/12/19 16:38

>>92
おらよ。
/(?:^|[^\d\.])(\d+)(?:[^\d\.]|$)/

**nobodyさん** · 03/12/19 23:48

/(?:^|[\d\.])([1-9]\d*)(?:[^\d\.]|$)/

**nobodyさん** · 03/12/21 14:45

>>92
お前さんのレベルじゃ，
込み入った正規表現に手を出すのはまだ早いんじゃないか？
とりあえずわかりやすい代替手段でも使っておけ。

my $f = 'fs4.5s5d.af56.156asd';
my @res = ();
foreach ( split(/[^\d.]/, $f) ){ push( @res, $_ ) if(/^[\d]+$/); }
if(! scalar(@res) ){ print "no match!\n"; }
elsif( scalar(@res) > 1 ){ print "too much match!\n"; }
else{ print "matched:[$res[0]]\n"; }

**nobodyさん** · 03/12/21 23:40

[サッカー][蹴球]96 ATLANTA OLYMPIC BS1総集編　日本1-0ブラジル前園カヌーオルテガ [110m08s DivX5].avi dgju9h3hNw 731,862,992 53de508adb8dc5d557c4d83efde22799
nyのキー情報（↑みたいなの）を正規表現で表すことできますかね？

ダウソ板のスレを全部取り込んで、
キー情報だけ抜き出してリストを作りたいです。

**nobodyさん** · 03/12/22 00:11

「みたいの」ってのが無理。

a · 03/12/22 01:56

>>98
もっとわかりやすく説明しろボケ

**nobodyさん** · 03/12/22 02:02

いいから放置しとけ

**nobodyさん** · 03/12/23 15:26

YahooXXXX.bbtec.net
からも
xxx.xxxx.ap.so-net.ne.jp
からもプロバイダ名を抽出させる方法を教えてください。

**nobodyさん** · 03/12/23 18:11

(\S+\.)?\S+\.[a-zA-Z]{2}[a-zA-Z]{2}
と
(\S+\.)?\S+\.[a-zA-Z]{3}

俺にはこんなものしか思いつかねーよ

**nobodyさん** · 03/12/23 19:52

>>102
ASAHIネットは www.ne.jp というホスト名を持っているわけだが、
ここからASAHIネットだと特定できる文字列をどうやって抽出しようかねぇ?

/
　　(?:
　　　　([0-9A-Za-z](?:[\-0-9A-Za-z]*[0-9A-Za-z])?) # 3rd LD
　　　　\.
　　)?
　　([0-9A-Za-z](?:[\-0-9A-Za-z]*[0-9A-Za-z])?) # 2nd LD
　　\.
　　([A-Za-z](?:[\-0-9A-Za-z]*[0-9A-Za-z])?) # TLD
　　\.?$
/x

**nobodyさん** · 03/12/24 10:46

>>102
常にドメイン名からプロバイダが抽出できると信じている時点でダメ。

**nobodyさん** · 03/12/24 14:10

「ISP名」ではなくて、XXXXX.XXX.XXX.2ch.netの
2ch.netを取得したいと仮定して答えても問題ないかな？

**nobodyさん** · 03/12/24 18:42

>>106
とりあえずそれでいってみよー

**nobodyさん** · 03/12/24 21:51

>>106
いいっすよ！

**nobodyさん** · 03/12/25 19:44

適当に答えてみる。
[-0-9a-zA-Z]+.[-0-9a-zA-Z]+$
多分[-0-9a-zA-Z]じゃ足りないけどよく分からないので。識者よろ

**nobodyさん** · 03/12/25 19:55

適当すぎて・・・・・・・・・・・・・

**nobodyさん** · 03/12/25 20:51

>>109
<q cite="http://member.nifty.ne.jp/moha/rfc/rfc2396j.txt">
hostname = *( domainlabel "." ) toplabel [ "." ]
domainlabel = alphanum | alphanum *( alphanum | "-" ) alphanum
toplabel = alpha | alpha *( alphanum | "-" ) alphanum
</q>
=> >>104

**nobodyさん** · 03/12/25 21:14

hogehoge.XXX のように.の後が3文字なら
後ろから二つ目の.まで
hogehoge.ne.XXのように.の後が2文字なら
後ろから三つ目の.まで
.XXXのXがすべて\dならIPアドレスということで全部

とでもしておけばいいんじゃない？適当すぎですが

**nobodyさん** · 03/12/26 00:26

>>112
汎用 JP ドメインなんてのもあるがな。

**nobodyさん** · 03/12/26 01:23

>>112
適当どころじゃないわな

**nobodyさん** · 03/12/26 13:51

#!/usr/bin/perl
$_ = << "EOD" ;
<test>
<test2>abc</test2>
</test>
<test>
<test2>def</test2>
</test>
EOD
/(<test>.+<\/test>)/s ;
print "$1\n" ;

テキスト中にある<test>文字列</test>を抽出したいと思ってるんだけど、
結果はこうなってしまう。
<test>
<test2>abc</test2>
</test>
<test>
<test2>def</test2>
</test>

結果はこうなって欲しい。
<test>
<test2>abc</test2>
</test>
こんな事も試したけどうまくいかず･･･
/(<test>(?!<test).+<\/test>)/s ;
何方か、お助け。

**nobodyさん** · 03/12/26 13:56

>>115
.+?

**nobodyさん** · 03/12/27 16:00

～～[hoge]～[foo]～～～[bar]～～[moge]～

のような感じのテキストで[hoge]以外の[と]で囲まれている部分を消して

～～[hoge]～～～～～～～

のようにしたいのですが、hoge以外の場合マッチという方法が思いつきま
せん。[^hoge]で無いことは確かなんですが・・。
文字列の否定の方法をどなたか教えてくださいませ。

**nobodyさん** · 03/12/27 17:39

>>117
s/\[(?!hoge)[^\]]*\]//g;
http://www.din.or.jp/~ohzaki/regex.htm

**117** · 03/12/27 17:54

>>118
どうもです。

**初心者スレ902,904** · 03/12/29 16:56

Perl コーディング初心者質問コーナー Part30
http://pc2.2ch.net/test/read.cgi/php/1069846177/902-
こちらから誘導されてきました。
再度質問を書きます

あるスクリプトで

my $check = '(?:^|[\0-\200\240-\337])(?:[\201-\237\340-\374]{2})*';
$FORM{'FROM'} =~ s/($check)(?: |　)+$/$1/g;

というのがあったのですが、"?:"というのはどういう意味なんでしょうか？
（このスレでも"?:"という表現が使われていますね）

ttp://www.kt.rim.or.jp/~kbk/perl5.005/perlre.html
ここも見てみたのですが、いまいち意味が分かりませんでした。
教えてもらえると助かります。

**初心者スレ902,904** · 03/12/29 17:03

わざわざ誘導されてきたのにすみません。自己解決しました。
ttp://www.kt.rim.or.jp/~kbk/regex/regex.html#GROUPING_NOBR
ここを読んだら分かりました。

**nobodyさん** · 03/12/31 18:09

rubyで
/#{str1}/.match(str2)
としたときstr1のメタ文字を通常の文字としてマッチさせたいのですがどうしたらいいですか？

**nobodyさん** · 04/01/01 00:08

>>122
Regexp.escape(str1) か Regexp.quote(str1)

**nobodyさん** · 04/01/01 00:51

>>123
thx

**nobodyさん** · 04/01/07 22:03

<dt>[名無し]さん(bin+cue).rar<>sage<>03/12/30 00:57 ID:St9M3KSl<dd>2　 
<dt>クソスレみっけ<><>03/12/30 00:57 ID:o9NEl4Ao<dd>じしんないから3で　 

とあって、空タグの<>間にある文字列を

<dt><a href="mailto:sage">[名無し]さん(bin+cue).rar</a>　03/12/30 00:57 ID:St9M3KSl<dd>2　 
<dt><a href="mailto:">クソスレみっけ</a> 03/12/30 00:57 ID:o9NEl4Ao<dd>じしんないから3で　 

のように<a>に内包させたい場合どうしたらよいでしょうか
テキストエディタは秀丸を使っています

**nobodyさん** · 04/01/07 22:21

>>125
置換ダイアログで
検索: <dt>\f[^<]*\f<>\f[^<]*\f<>
置換: \0<a href="mailto:\3">\1</a>

**125** · 04/01/08 00:00

>>126
どもです、バッチリでした
もすこし勉強してきま

**nobodyさん** · 04/01/08 11:30

PHPでHTMLを埋め込める掲示板スクリプトを作ってますが

＜…＞となっている不等号はHTMLタグとみなして、そのままにしておき
それ以外のHTMLタグとみなせない不等号を＆ｌｔ；と＆ｇｔ；に置き換えて
HTMLタグ内にない”と＆をそれぞれ＆ｑｕｏｔ；と＆ａｍｐ；に変換するように
正規表現を書きたいのですが色々書き直して試してますが
思い通りに動作しなくて困ってます。
どのように正規表現を書けばよいか知恵を貸してください。お願いします。

＜…＞の形になってない不等号を＆ｌｔ；と＆ｇｔ；に置き換える作業は今は
以下のようになってます。

$message = @ereg_replace("＜(([^＞]|\n)*)＜", "＆ｌｔ；\\1＆ｌｔ；", $message);
$message = @ereg_replace("＜(([^＞]|\n)*)", "＆ｌｔ；\\1", $message);
$message = @ereg_replace("(([^＜]|\n)*)＞", "\\1＆ｇｔ；", $message);

**nobodyさん** · 04/01/09 07:37

>>128
preg使えよ…

◆MbpwKgPmhw · 04/01/13 18:01

$ENV{'USER_AGENT'}で得られる文字列から、ブラウザ名とバージョンを抜き出す関数を作っています。
正規表現のせの字もわからんような状態から何とかあちこち検索かけてここまで作りました。
しかし、まだ正規表現のありがたみが足りない気がして、不満です。
よければもっと要約できる点、あるいは不備な点の指摘をお願いします。ちなみに、書き込みのためにここでは全角でインデントいます。コピペの際にご留意下さい。
#-----------------------#
# UA一般名化　　　　　　　　 #-----------------------------------------------------#
#-----------------------#
# 引数は、($ENV{'USER_AGENT'})
sub envUa2uaName{
　my ($UA) = $_[0];
　if($UA =~ /MSIE/){
　　$UA =~ s/(.){0,}MSIE ([0-9]{1,}(\.){0,}[0-9]{0,})(.){0,}/InternetExplorer $2/;
　}
　elsif($UA =~ /Opera/){
　　$UA =~ s/(.){0,}Opera(.)([0-9]{1,}(\.){0,}[0-9]{0,})(.){0,}/Opera $3/;
　}
　elsif($UA =~ /Safari/){
　　$UA =~ s/(.){0,}Safari(.)([0-9]{1,}(\.){0,}[0-9]{0,})(.){0,}/Safari $3/;
　}
　elsif($UA =~ /Netscape/){
　　$UA =~ s/(.){0,}Netscape(.)([0-9]{1,}(\.){0,}[0-9]{0,})(.){0,}/Netscape $3/;
　}
　elsif($UA =~ /Firebird/){
　　$UA =~ s/(.){0,}Firebird/Firebird/;
　}
　elsif($UA =~ /^Mozilla/){
　　$UA =~ s/Mozilla\/([0-9]{1,}(\.){0,}[0-9]{0,})(.){0,}/Mozilla $1/;
　}
　$UA =~ s/([a-z A-Z 0-9]{0,})\/([0-9]{1,}(\.){0,}[0-9]{0,})/$1 $2/g;
　return $UA;
}

**130** ◆MbpwKgPmhw · 04/01/13 18:02

>>130 =~ s/インデントいます/インデントしています/;

**nobodyさん** · 04/01/13 18:12

DoCoMoは？

**nobodyさん** · 04/01/13 18:53

>>132

( ﾟдﾟ)ﾊｯ!
そう言えば忘れてました・・・

**nobodyさん** · 04/01/13 19:00

j-phoneとvodafoneとauも忘れないでね。

**130** ◆MbpwKgPmhw · 04/01/13 19:03

>>134
サンプルデータが無い・・・・
UAが分からないと正規表現の書きようがない・・・

**nobodyさん** · 04/01/13 19:07

そんなものいくらでもころがってるだろう

**130** ◆MbpwKgPmhw · 04/01/13 19:08

>>136

スマソ

**nobodyさん** · 04/01/13 19:46

ちなみに俺はWin2000＆IE6だが、UAはMozilla/5.0 (Macintosh; N; PPC; en-US; m18) Gecko/20000929 Netscape6/6.0b3となってる。

**130** ◆MbpwKgPmhw · 04/01/13 20:13

>>138

環境変数をイジってる人のまでは対応仕切れないのでそれはそのまま表示します・・・。

**未承諾広告※** ◆aiY4htt2.2 · 04/01/13 21:12

UA なんて偽装し放題なんだからそれからブラウザ名を判定しても何の有り難みもねーよ。

と聞こえてくるのは幻聴でしょうか。。。

**nobodyさん** · 04/01/13 22:04

俺にはドリキャスのうめき声が聞こえる。。。

**nobodyさん** · 04/01/14 08:50

そういえばpipin@はまだ生き残ってるのか？

**nobodyさん** · 04/01/15 16:48

$text = "正規表現で、or にあたるものはないでしょうか？ ";
mb_ereg("正規表現|ない|or|しょう",$text);
//"|" は二つだけですよね？

こんな感じで、複数の文字列にヒットする方法を知りませんか？
eregでもpreg_matchでもどちらでも可能であれば教えて下さい。

**nobodyさん** · 04/01/15 17:23

H"は?

**nobodyさん** · 04/01/15 17:32

>>143
意味不明

**nobodyさん** · 04/01/15 19:03

>>143
preg_match('(正規表現|ない|or|しょう)', $text);

**nobodyさん** · 04/01/15 19:56

>>143
そのコードのままでは意図通りに動いてないの？

**nobodyさん** · 04/01/15 21:38

210.153.84.0/24 とか 210.134.83.32/27 とかの表記での
アクセス制限はPerlではできないかと思いますが、
これらを正規表現にてなんとか綺麗にかけないもの
でしょうか。

もしも良い案がございましたらご教授ください。

**未承諾広告※** ◆aiY4htt2.2 · 04/01/15 21:42

>>148
&

**nobodyさん** · 04/01/15 21:44

>>148
サブネットマスクで表すアドレス範囲がわかれば簡単なことだろ

**nobodyさん** · 04/01/16 04:47

>>149
たった一文字なのに的確なマジレスだな

**nobodyさん** · 04/01/16 17:53

空行の上の1行にマッチするということは、正規表現でできますか？

あいうえお\r\n
かきくけこ\r\n
\r\n
さしすせそ\r\n
たちつてと\r\n
naninuneno\r\n
\r\n
歯皮膚へ補\r\n
\r\n

かきくけこ\r\n、naninuneno\r\n、歯皮膚へ補\r\nにマッチして欲しいんですが・・・。

**nobodyさん** · 04/01/16 20:31

>>152
([^\n]+\n)\r\n
\1とか$1で参照で出来ると思う。

**nobodyさん** · 04/01/16 20:49

こんなんは動きませんか。perl。
(?:\n?)[^\r\n]+\r\n(?=\r\n)

**未承諾広告※** ◆aiY4htt2.2 · 04/01/16 22:03

\b(.+?)\r\n\r\n
手抜きかも。。。

**nobodyさん** · 04/01/16 22:45

／（．＋？￥ｘ０Ｄ？￥ｘ０Ａ）￥ｘ０Ｄ？￥ｘ０Ａ／ｇｓ

**152** · 04/01/17 00:12

>>153-156
皆様、レスありがとうございます。

空行の上の行を取得できました。
勉強不足でした、精進します。
ありがとうございました。

**nobodyさん** · 04/01/18 20:18

PHPで、
「(文字列ほげか、文字列ふが)が先頭にある文字列以外にマッチする」という正規表現はどのようにすれば記述できるでしょうか？
/(([^ほ][^げ])|([^ふ][^が])).*/
かと思ったのですが、違うようです……

**nobodyさん** · 04/01/19 00:42

>>158
逆に、「～にマッチしなかったら」という処理にした方が楽。

**nobodyさん** · 04/01/19 14:48

perlですが、
$domainにドメインが入っていて、(仮にyahoo.co.jp)
$hogeに入力されたURLが入っているときに
$hogeがルートディレクトリから2つ以上掘り下げた場所にあるファイルのURLなら、ある処理をする
ということをしたいのですが、頭の中ではまとまっていてもどのようにすればいいのかが・・。
ちょっと解りにくいと思うので、具体的に$hogeが何ならokで何ならNGかを↓
○ http://yahoo.co.jp/
○ http://yahoo.co.jp/xxx
○ http://yahoo.co.jp/xxx/
○ http://yahoo.co.jp/xxx/top.html
× http://yahoo.co.jp/xxx/yyy/
× http://yahoo.co.jp/xxx/yyy/zzz/...../foo.html
・
・
こんな感じです。
ネックとしてはディレクトリの時｢/｣をつけてる場合とそうでない場合がある。
index.htmlなどを書く場合とそうでない場合がある。
というところでしょうか。

で、マッチした場合に処理するという形で考えてるんですが、
if ($hoge =~ /^https?:\/\/\Q$domain\E\/([^\/]+)\/※/) { 処理 }
※の部分にスラッシュがあるか、なくてもドットがなければマッチ
という風にすればいけるのかな？などと考えているのですが、
どのように書けばよいのかが解りません。また本当にそれで実現できるのかも｢?｣です。
わかりにくい質問だとは思いますが、教えていただけませんでしょうか。

**nobodyさん** · 04/01/19 15:22

>>160
厳密なこと言うと /xxx/yyy がディレクトリかファイルかは、
実際にその URL にアクセスしてみないとわからないので、
どっかで妥協しないといけないと思う。

で、 >>160 のような前提でマッチするとするなら、こんな感じかな。
$hoge =~ /^https?:\/\/$domain\/([^\/]+)\/([^\/]+\/|[^\/\.]+$)/

**nobodyさん** · 04/01/19 15:33

>>161
有難うございます。確かに厳密にはそうですが、まぁここではそこまで突っ込まないことにします。
で、少し書いていただいたソースでテストしてみましたが、おそらく期待通りのようです。
後でまたテストしてみます。有難うございました。

**158** · 04/01/20 00:19

>>159
プログラム自体が「設定ファイルに記述した正規表現(のリスト)にマッチしたら」っていう処理なんで、
>逆に、「～にマッチしなかったら」という処理にした方が楽。
とは分かってるんですが、何とかならない物かと。

……あや、PHPでも '?!' は使えるのか。ってことは、
/^（?!ほげ）.*/
で、「文字列ほげが先頭にある文字列以外にマッチ」になるのか？
としても、
/^(（?!ほげ）|(?!ふが)).*/
じゃないよなぁ……。

**nobodyさん** · 04/01/20 03:08

boolを反転させればいいだけ。正規表現使う必要も無し。

**nobodyさん** · 04/01/20 03:48

>>163
何の設定ファイルか興味津々。

**nobodyさん** · 04/01/20 04:05

>>163
アホですか？

**nobodyさん** · 04/01/20 08:28

アホって言うか、いわゆる初心者ってやつです。おまけに自分で調べない、人に聞くことしか出来ないときてますから手に負えません。

**nobodyさん** · 04/01/20 17:57

みたこと無い人はPHP質問スレをちらっと訪れてみることをお勧めします。
長期滞在は精神衛生上よろしくありませんので、あくまでピーピングってください。

**158** · 04/01/21 03:02

>>164-166
申し訳ないです。数時間色々試して、「正規表現でそういうのは無理」
と思いつつもつい、知ってる人がいれば良いな程度に書き込んでしまいました。
(「無理」って思ったんなら諦めろよ、俺。)

処理の方いじってみる事にします。(とりあえず、当面質問スレには出向かない方向で。)
ありがとうございました。

**nobodyさん** · 04/01/21 06:51

(「無理」って思ったんなら諦めろよ、俺。)

気持ち悪いです。

**nobodyさん** · 04/01/21 07:45

気持ちいいです。

**nobodyさん** · 04/01/21 15:39

>>169
preg_match('/(?:(?!^(foo|bar)).)*/', $str, $arr); if ($arr[0]) do;

これが正規表現でやることか？
つーか>>1のサイトくらい見ろよハゲ

**nobodyさん** · 04/01/25 15:45

perlを使っています。
<a href="#epigraph">▲</a>　<a href="#D_20040124">▼</a>
を、
<a href="#D_20040124">▲</a>　<a href="#epigraph">▼</a>
と、属性値だけ入れ替えるにはどうしたらよいのでしょうか？（属性値は可変です）

正規表現は苦手で、いくら考えても判らなかったので……。

**nobodyさん** · 04/01/25 16:16

/(<a href="\#)([^"]+?)(">▲<\/a>　<a href="\#)([^"]+?)(">▼<\/a>)/$1$4$3$2$5/gi

こういうことなんかな？　意図がわからんからめちゃくちゃ適当なんだが。

**nobodyさん** · 04/01/25 16:27

>>174
できました！　そっか、こういう風にすれば良かったのか……。
今度からは自分でできるように、正規表現についてしっかり勉強しようと思います。
ありがとうございました。

**nobodyさん** · 04/02/03 02:35

ホッシュ

**nobodyさん** · 04/02/09 22:07

ＩＰアドレスの正規表現で
a.b.c.d/8
とか
a.b.c.d/32
ってどういう意味なんでしょうか？
誰か教えてください…

**nobodyさん** · 04/02/09 22:12

>>177
正規表現じゃなくてサブネットマスクだろ
ぐぐれ

**nobodyさん** · 04/02/10 18:53

めっちゃ簡素な質問で申し訳ないのだが、
PerlでHTMLタグを取り除く処理を行う場合、

s/<.*?>//g;
と書いている場合と、
s/<[^>]*>//g;
と書いている場合がありますよね？
大抵のところで「<.*?>は遅い」とかかれているのですが、
実際どれくらい処理効率が違うのでしょうか

**nobodyさん** · 04/02/10 18:56

すみません、すごく初歩的な質問なんですけど、
いくつか並んだ単語の中の、真ん中の単語だけを検索するには
どういう正規表現を使ったら良いのでしょうか？

<item name="アニメA.Aスレッド 13th session " category="AA" board="AAサロン"
<item name="アニメA.Aスレッド 12th session " category="AA" board="AAサロン"
<item name="アニメA.Aスレッド 11th session " category="AA" board="AAサロン"

と並んでいるもののうち、【アニメA.Aスレッド xxth session】だけを検索したいのですが可能でしょうか？

いろいろ検索しつつ試行錯誤をしていますが、どうしても分かりません。
どなたかいらっしゃいましたら、教えて頂けないでしょうか？

**nobodyさん** · 04/02/10 20:26

>>179
自分でベンチマークしてみる

>>180
21st 22nd 23rd ってことになるかな？

**nobodyさん** · 04/02/11 05:51

/アニメA.Aスレッド [0-9]{2}th session/

**nobodyさん** · 04/02/11 21:58

coffeeとかballoonみたいに、
3・4文字目が同じ、5・6文字目が同じような単語をマッチさせる正規表現を教えていただけませんか？

○×△△□□　みたいな形式。1・2文字目はなんでもOK。7文字目以降に何がきてもOK。

sedでおねがいします。

**nobodyさん** · 04/02/11 22:18

/..(.)\1(.)\2/

**nobodyさん** · 04/02/11 22:24

それｔってPerlじゃないんですか・・・？

**nobodyさん** · 04/02/11 22:33

/..$.$\1$.$\2/

**nobodyさん** · 04/02/12 01:00

>>185
あんたは何処の誰

**nobodyさん** · 04/02/12 01:23

サンタはホモのひげ

**nobodyさん** · 04/02/12 01:38

/^(..(.)\2|...(.)\3)/

こうか？

**nobodyさん** · 04/02/12 02:26

coffee
tattoo
balloon
saccees

あたりがひっかかればいいのか？

**189** · 04/02/12 02:40

すまん、質問文全体的に読み間違えてた。。。

/^..$.$\1$.$\2/

でいいんじゃない？

**nobodyさん** · 04/02/12 02:44

ありがとうございます。
Perlで\1とかが使えるのは知ってたのですが、sedでもつかえるとは思って無かったです。

ぶしつけがましいかもしれませんが、Perlで!~と表される「マッチ以外」を
sedで実装するにはどうすればいいのでしょうか。

実は今回初めてsedというものに触れることになったもので・・・
Perlみたく正規表現が使える、というのは知ってたのですが仕様が違うらしくうまくいかなくて・・・

**nobodyさん** · 04/02/12 02:57

>>192
>>1 の正規表現メモを見れ。

**nobodyさん** · 04/02/12 16:51

>>192
!

マニュアルは死んでも見ない主義か？

**nobodyさん** · 04/02/12 23:51

PHPで2chのスレッドURLの正規表現（ereg）は
http://(.)+\.2ch\.net/test/read\.cgi/(.)+/[0-9]{10}/
これでいいですか？
もうちょっとスマートなのあればお願いします。

**nobodyさん** · 04/02/13 04:16

↑ｷﾀｰ

**nobodyさん** · 04/02/13 17:14

>>195
bbspink.comとmachi.toが抜けてるよ。
(.)はわざと？

**nobodyさん** · 04/02/13 17:38

>>196 >>197
ごめんなさい。素人なものでよくわからないのです・・・
任意の文字は、「(..)+」じゃないんでしょうか・・・
「.+」でいいですか？
http://(.+\.2ch\.net|.+\.bbspink\.com|.+\.machi\.to)/test/read\.cgi/.+/[0-9]{10}/
でいいでしょうか？
それと、Perlでは、10個の数字なら「\10d」でできたと思うのですが、PHPではできないみたいですね・・・

**195** · 04/02/13 22:04

お騒がせしました。自分のﾀﾞﾒﾀﾞﾒでしたね。
http://([a-zA-Z0-9]+\.2ch\.net|[a-zA-Z0-9]+\.bbspink\.com|[a-zA-Z0-9]+\.machi\.to)/test/read\.cgi/[a-zA-Z0-9]+/[0-9]{10}/
これでOKですね。

**nobodyさん** · 04/02/14 02:42

正規表現でどう書くのかと言っても目的によって変わる場合があるからな