正規表現道場 Part2
■ このスレッドは過去ログ倉庫に格納されています
0001nobodyさん
2012/09/19(水) 18:58:43.51ID:bdgNsY2f・言語不問
・質問も大歓迎。使用言語を書くのを忘れずに。
正規表現と関係ない話・質問は他スレへどうぞ。
前スレ
正規表現道場
http://kohada.2ch.net/test/read.cgi/php/1168450843/
0002nobodyさん
2012/09/20(木) 03:58:43.36ID:???●過去スレ
正規表現道場@2ch
http://pc.2ch.net/test/read.cgi/php/996105815/
正規表現道場@2ch Part2
http://pc5.2ch.net/test/read.cgi/php/1038146241/
正規表現道場@2ch Part3 s/煽り|荒らし/あぼーん/g
http://pc5.2ch.net/test/read.cgi/php/1069245758/
正規表現道場@2ch Part4
http://pc8.2ch.net/test/read.cgi/php/1105930285/
●過去スレのテンプレにあった参考サイトたち
Perlメモ
http://www.din.or.jp/~ohzaki/perl.htm
正規表現メモ
http://www.kt.rim.or.jp/~kbk/regex/regex.html
Regex::Diagram.pm
http://www.cc.rim.or.jp/~midorin/mad-p/RegexDiagram.html
正規表現
http://www.cc.rim.or.jp/~midorin/mad-p/perl/benkyou/PRC2kRegex/
UNIX正規表現入門
http://web.archive.org/web/20021219021503/http://www01.u-page.so-net.ne.jp/jc4/hiroyuki/rex_index.html
Regular Expression(Riue ちゃんの正規表現講座)
http://www.sixnine.net/regexp/
ほとんどは↓のリンク集にまとまっています。
正規表現/文字コード最新リンク2005
http://www2.famille.ne.jp/~akio1998/l_grep.html (Not Found)
0003nobodyさん
2012/09/22(土) 03:58:02.23ID:???|:::ハ:.:.:.:.:.:i:.:.:i.:.:i./.:.://メノ 左ォ}::::ノ::ノノ
|::::i:::';::::::::l、::i:::ハ:/,ィチ爪' {ヒチ'!::イイ
|ハ::::::ヾ::::ハ 'Vリ ゙´ {、込ソ ゛″!:::i:.:l
|:.::ト、:.:.:ヾ:.ハーi| :::::::: 〉 ノ::::i::.|
{:.:.ト、ヾ.:.:.:ヾハ lト、 _, , イ:.:.:.:i.:ハ
ヾ::ヽゞ、\.::.\!! ヽ、. ´ /!.::!.:.i:.:!:.!:l >>1乙ぱい
, '" ヾ\ \:::::::::k /` ー ' `メ'リ:.:.ノ.ノ:ノノ
/ 川 リllVハ. ( i `\ ,イイ// //
/ |l ̄`ヽ ノ `メ、
,/ {:} `ー'- ニ_
,/ _∠ |l \ , \
/ _ ,. イ´: |l \ ,λ
/ -‐‐‐-<´ .! / |l ' , _,ィ'ンy}
〈 \ .ノ`ー斗rェ,,_,_,_|l ,.ir'彡イy-´ !
`ヽ、 ` ' <._ {jt=t-t-ミ`^Yーrヘr-彡'水k} !:} .ノ
` ー- .._ ` -ヽ. l`亠^{:i ̄ {:リ |ハ ノノ/ノ
_,. -‐ '  ̄ ´ ̄` ー- 、 \{{ {:l {:i ノ_,ィニ_ン´
// `ヽ 、\ \ {:l {∠ニァ--'
/ / `ヽミニ>ァ┴ '´
/\V| /
./ ヾ.、 ,. ' ´
0004nobodyさん
2012/10/15(月) 10:43:51.98ID:???正規表現最新リンク集2005
http://web.archive.org/web/20100410230942/http://www2.famille.ne.jp/~akio1998/l_grep.html
個人名載ってるしこのまま外しちゃってもいいかもしれない
0005nobodyさん
2012/10/19(金) 12:38:26.99ID:ZQDqri430007nobodyさん
2012/10/19(金) 19:53:20.37ID:???0008nobodyさん
2012/10/30(火) 16:10:01.92ID:???拒否したいワード例
・ばか
・ばっかやろー
・ばーか
掲示板の拒否ワード機能を使って上のような言葉を
^(ばか|ばっか|ばーか)
このようにまとめているのですが、
もっと効率よくまとめられるような気がしています
^ば(0または任意の1文字)か
以上のように、
まとめることは可能でしょうか?
0009nobodyさん
2012/10/30(火) 17:54:51.44ID:???ばいか(売価)とかも入るけどねー
0010nobodyさん
2012/10/30(火) 21:28:35.04ID:???ばっかり
ばんから
00128
2012/10/31(水) 12:31:50.64ID:???皆さんご指摘のことを読むと確かにおっしゃるとおりですよねー
ば.?か、のような書式で運用できるかできないか、
掲示板のログとにらめっこしてみることにします
ともあれ、お答えくださった皆さん、とても参考になり助かりました
ありがとうございました
0013nobodyさん
2013/01/29(火) 08:17:24.91ID:???^(ば(か|っか|ーか))
0014nobodyさん
2013/02/10(日) 11:51:32.02ID:m9q+FHWZ半角アルファベットと半角数字の組み合わせで8文字以上
という条件を考えてるんですが、以下じゃダメですよね?
preg_match('/^[a-zA-z0-9]{8,}$/', $s);
アルファベットと数字の組み合わせ(アルファベットも数字もどちらもある)とするには
どうしたら良いでしょうか?
0016nobodyさん
2013/02/13(水) 23:30:20.10ID:???数字英字 もしくは 英字数字という並びが存在する英数字8文字以上
0017nobodyさん
2013/02/14(木) 00:13:02.40ID:???>>14と「英字を含む」「数字を含む」の計3回チェックするのとで、どのくらい
ここまで書いたところで自分でいろいろ試してみた。
$s = '3066058kczgr9784685fwn874fos847fos8djtkcrzu9q58nzfc';
for($i=0; $i<1000000 && preg_match('/^(?=(.*\d[a-zA-Z].*)|(.*[a-zA-Z]\d.*))\w{8,}$/', $s); $i++){} //2.3948659897 sec.
for($i=0; $i<1000000 && preg_match('/^[a-zA-z0-9]{8,}$/', $s) && preg_match('/[a-zA-z]/', $s) && preg_match('/[0-9]/', $s); $i++){} //5.7406949997 sec.
for($i=0; $i<1000000 && preg_match('/^[a-zA-z0-9]{8,}$/', $s) && !preg_match('/^[0-9]+$/', $s); $i++){} //3.9960801601 sec.
for($i=0; $i<1000000 && 8<=strlen($s) && ctype_alnum($s) && !ctype_digit($s); $i++){} //2.2285568714 sec.
$s = '1';
for($i=0; $i<1000000 && preg_match('/^(?=(.*\d[a-zA-Z].*)|(.*[a-zA-Z]\d.*))\w{8,}$/', $s); $i++){} //0.0000748634 sec.
for($i=0; $i<1000000 && preg_match('/^[a-zA-z0-9]{8,}$/', $s) && preg_match('/[a-zA-z]/', $s) && preg_match('/[0-9]/', $s); $i++){} //0.0000240803 sec.
for($i=0; $i<1000000 && preg_match('/^[a-zA-z0-9]{8,}$/', $s) && !preg_match('/^[0-9]+$/', $s); $i++){} //0.0000209808 sec.
for($i=0; $i<1000000 && 8<=strlen($s) && ctype_alnum($s) && !ctype_digit($s); $i++){} //0.0000181198 sec.
おもしろかった。
0019nobodyさん
2013/03/09(土) 22:12:30.87ID:???はダメ?
0020nobodyさん
2013/03/09(土) 23:24:50.86ID:???0021nobodyさん
2013/03/10(日) 23:50:57.56ID:???大文字と小文字を区別したいってことなら
^(?=.*[A-Z])(?=.*[a-z])(?=.*[0-9])[A-Za-z0-9]{8,}$
でおk
0022nobodyさん
2013/03/18(月) 20:02:10.97ID:XSCUuGgihttp://www.rider-n.sakura.ne.jp/regexp/regexp.php
で試す限りはうまくいくんだけどPHP上でうまくいかない。
スクリプト SJIS
マッチング文字列 SJIS
PHP内部文字エンコ SJIS
の環境下で
【サッカー】xxxxx【野球】
で最初のサッカーだけをマッチングしたいので
/^【([^】])】/i
としているんだけど、サッカーの時はマッチしない。
【テニス】xxxxx【卓球】ならちゃんとテニスがマッチする。
なんで?(´・ω・`)
0023nobodyさん
2013/03/18(月) 20:21:31.67ID:???それだとテニスもマッチしないはずだが
[^】] は「 】」以外の1文字ってことになる
それとShift_JISなんて捨ててUTF-8使おうぜ
0024nobodyさん
2013/03/18(月) 22:12:52.90ID:XSCUuGgiすません、[^】]+です。
SJISで何とか…
0025nobodyさん
2013/03/19(火) 00:22:00.75ID:???mb_ereg ("^【([^】]+)】" ,$txt,$ret);
pregはSJIS使えません
0027nobodyさん
2013/05/16(木) 11:13:37.06ID:???/^(?:(?:http|https):\/\/(\w+:{0,1}\w*@)?(\S+)(:[0-9]+)?(\/|\/([\w#!:.?+=&%@!\-\/]))?)*$/
上記はURLをチェックする簡単な正規表現だと思うのですが
そのURLがRSSかどうかチェックする正規表現にしたいのです
RSSの拡張子は .rss .rdf .xml です。
URLの最後の拡張子にこの文字列が入ってるかチェック出来るようにしたいのですが
どうすればいいでしょうか?
お願いします。
0028nobodyさん
2013/05/16(木) 11:28:59.91ID:???\.(rss|rdf|xml)$/
0029nobodyさん
2013/05/16(木) 11:38:31.44ID:???レスありがとうございます
ただこれに差し替えるだけだと
http://www.example.com/.rss
これも正常として判断されてしまうのですがどうしたら良いでしょうか?
よろしくお願いします。
0030nobodyさん
2013/05/16(木) 11:47:36.80ID:???0032nobodyさん
2013/07/20(土) NY:AN:NY.ANID:75R8ikZF<a href="http://www.test.jp/" title="test"><img src="test.png" alt="ALT" title="TITLE" /></a>
上記のようなHTMLを正規表現でヒットさせ、
<li>TITLE</li>
に変換させたいのですが、正規表現ではどう表したらいいのでしょうか?
0033nobodyさん
2013/07/21(日) NY:AN:NY.ANID:???0034nobodyさん
2013/07/25(木) NY:AN:NY.ANID:2TH+2Iiw"ver.2 test.Test"という文字列を"ver.2 test. Test"のように
ピリオドの次の文字が大文字のときに限り半角スペースを挿入したいのですが
良い方法はないでしょうか?
0036nobodyさん
2013/07/25(木) NY:AN:NY.ANID:???0038nobodyさん
2013/09/06(金) 20:12:17.12ID:???見ての通り超手抜きだけど例の通りか属性値のダブルクォートが無いぐらいならこれで大丈夫
検索文字列: /^(.+<img.+title=\")(.+)(\" \/><\/a>)$/
置換文字列: <li>$2</li>
http://regex101.com/r/qI6aG4
> PHPのpregでの正規表現
実はPHP分からないんだけど↓みたいな感じ?w
preg_replace("/^(.+<img.+title=\")(.+)(\" \/><\/a>)$/i", "<li>$2</li>", $input_lines);
0039nobodyさん
2013/09/14(土) 18:05:14.35ID:0qKO1mtdPHP5で
preg_match ("/.*'.*/s", $_POST["value"])
としたときにvalueに「'」があってもマッチしない場合があるらしいのですがどういう文字列の場合でしょうか?
preg_matchはPCRE関数でPerl互換です。マルチバイトに対応していないのでその辺りに落し穴があるのかなと思うのですが。
0040nobodyさん
2013/09/14(土) 19:42:16.21ID:QgtFjJm6NGワードフィルターが正規表現なのですが教えて頂けないでしょうか。
"韓国"というキーワードをフィルタリングしたいです。
http://userscripts.org/scripts/show/172085
0041nobodyさん
2013/09/15(日) 10:40:22.03ID:???マッチしない場合があるとは思えないけど、一応マッチしない場合があると言った人に聞いてみれば?
まぁ、$_POST["value"]が送信されて来なければ話は別だけど・・
ちなみにそれは preg_match("/'/", $_POST["value"]) のようにシンプルに書くこともできる
0043nobodyさん
2013/09/15(日) 15:21:48.42ID:???2chMate 0.8.5.6 dev/HTC/HTL21/4.1.1
2chMate 0.8.5.4/SHARP/SBM003SH/2.3.4
↑こんなやつです
一応専ブラはjanestyleということでどなたか教えていただけませんでしょうか
0044nobodyさん
2013/09/16(月) 04:52:23.59ID:V1KLg8Lz004539
2013/09/16(月) 18:13:41.90ID:???マッチしない場合は無いようでした。
phpの設定の問題でpreg_matchがマッチできずfalseを返す場合があるらしいです。
0046nobodyさん
2013/09/19(木) 16:03:12.92ID:XGTpu0pg最近2ちゃんで同じ文字列を数行繰り返す荒らしがいますが
最近2ちゃんで同じ文字列を数行繰り返す荒らしがいますが
↑こんな感じです
改行を挟まない場合もあります
Janeでこれをあぼーんしたいんですが
同じ文字列が数行続いたかを調べられる正規表現はありませんか
0047nobodyさん
2013/09/19(木) 19:40:04.05ID:???1行文の2連投
http://thinkarc.blogspot.jp/2007/07/janeviewngex.html#NGEx_Contiguous_single-line
んでこれ以上は下で NGEx.txtを晒すスレ4
http://mattari.plusvip.jp/test/read.cgi/jane2ch/1325934427
0049nobodyさん
2013/09/22(日) 00:52:59.03ID:PBzP1rLUNN\s.*?VBNでうまくいかない(最長マッチが返ってくる)のですが、何が悪いのでしょうか?
In_IN Israel_NNP ,_, freedom_NN of_IN opinion_NN and_CC risk_NN taking_NN are_VBP strongly_RB supported_VBN ._.
0050nobodyさん
2013/09/22(日) 02:25:21.73ID:V8cai0+K最短で後続するVBNまでがマッチする
こうじゃないか?
.*(NN\s.*?VBN)
005149
2013/09/22(日) 08:30:46.88ID:???ありがとうございます。
しかし、、、.*(NN\s.*?VBN) だと、今度は、行全体がマッチしてしまいます。。。
ムムム
005349
2013/09/22(日) 15:17:49.08ID:???>>52
ありがとうござしました。
プログラム板でも聞いてみたところ、下のような表現を教えてもらいました。
NN\s((?!NN).)*?VBN
0055nobodyさん
2013/09/23(月) 15:50:05.13ID:???webprog板の面汚しめ
0056nobodyさん
2013/09/23(月) 21:29:41.29ID:???0057nobodyさん
2013/09/23(月) 21:37:40.88ID:???0059nobodyさん
2013/10/07(月) 05:09:32.74ID:???'hoge山田
太郎2様hoge'
(2の数字は色々変わります)
の中から'太郎2様'をマッチさせたいのですが
/山田[\s\S]*?(/太郎.*?様/u)様/u
でうまくいかないです。どなたか教えて下さいまし。。。
0060nobodyさん
2013/10/07(月) 15:52:08.10ID:???0062nobodyさん
2013/10/09(水) 23:36:54.74ID:???([a-z0-9]){9}$
$(([a-z0-9]){9})
と思ったのですが、うまくいかないです。
0063nobodyさん
2013/10/10(木) 10:38:47.00ID:???0064nobodyさん
2013/10/10(木) 11:09:37.77ID:???0065nobodyさん
2013/10/31(木) 18:34:38.76ID:GYE7WPbHとある時
(.*?)
で"(cd)"は返ってきますが、
"cd" とカッコの中身だけを取りたい時はどうすればいいでしょうか
"(" と ")" を置換するしかないですか?
0066nobodyさん
2013/10/31(木) 18:49:48.33ID:???0067nobodyさん
2013/10/31(木) 21:18:35.06ID:odoD21Ul0068nobodyさん
2013/11/29(金) 11:12:23.82ID:???パターンは、/<a>.*<\/a>/
対象文字列は、<a>テスト1</a><a>テスト2</a>
preg_match('/<a>.*<\/a>/', '<a>テスト1</a><a>テスト2</a>', $result)
でマッチした文字列は、
$result[0]:<a>テスト1</a>
$result[1]:<a>テスト2</a>
となることを期待しているのですが、
実際は、
$result[0]:<a>テスト1</a><a>テスト2</a>
となりました。
<a></a>は独自タグで間に入る文字列長、フォーマットは不定です。
どうすれば期待通りの振る舞いに出来るでしょうか?
0069nobodyさん
2013/11/29(金) 11:36:29.05ID:???すみません。訂正します。
× preg_match('/<a>.*<\/a>/', '<a>テスト1</a><a>テスト2</a>', $result)
○ preg_match_all('/<a>.*<\/a>/', '<a>テスト1</a><a>テスト2</a>', $result)
0070nobodyさん
2013/11/30(土) 00:49:11.30ID:ykQSlGiP0071nobodyさん
2013/11/30(土) 23:20:57.87ID:???0072nobodyさん
2013/12/04(水) 06:52:39.64ID:???お題が欲しけりゃJaneのReplaceStr.txtとかNGEx.txtとか自分でいじってみればいいんじゃないの?
練習はReplaceStr Toolでやれるから。
グループ化を使って解析させると幾分わかりやすくなる。
0073nobodyさん
2013/12/08(日) 20:14:52.93ID:1LHzvpJQテーブルタグで囲っている、下記のような
HTMLの表があります。
名前 | ふなっしー
住所 | 東京都港区赤坂
電話番号 | 090-0000-0000
ふなっしー
東京都港区赤坂
090-0000-0000
という結果を期待して
名前(.*)
住所(.*)
電話番号(.*)
と書いたんですが、使い方を間違っているのか?
うまくいきません。
他の記述方法はないでしょうか?
0074nobodyさん
2013/12/20(金) 03:59:14.24ID:JjVtc12l■本スレ
Regular Expression(正規表現) Part12
http://toro.2ch.net/test/read.cgi/tech/1387257592/
■注意
工作員がわざと重複させて立てた偽スレを本スレだと偽って宣伝に来る可能性があります。
本スレは上記のみですので十分ご注意ください。
0076nobodyさん
2013/12/22(日) 08:24:16.49ID:???これだろ。
ttp://1st.geocities.jp/neeetest/RepStrTool_2.8.zip
0077nobodyさん
2014/01/12(日) 01:41:51.67ID:???保守。・・のついでに私的メモを書いていくかも。
檜山正幸のキマイラ飼育記
http://d.hatena.ne.jp/m-hiyama/20100603/1275546996
0078nobodyさん
2014/01/13(月) 23:30:11.42ID:???http://itpro.nikkeibp.co.jp/article/lecture/20061127/254890/?ST=selfup&P=3
0079nobodyさん
2014/01/15(水) 23:08:02.57ID:???http://www1.adachi.ne.jp/katz/primer/automata.html
会社の新人研修でオートマトンの講義を担当した。
0080nobodyさん
2014/01/16(木) 03:06:09.07ID:???http://www.amazon.co.jp/dp/4627821506
大阪大学 - コンピュータ数学
https://koan.osaka-u.ac.jp/syllabus_ex/campus?view=view.syllabus.ex.refer.sogo.search
&func=function.syllabus.ex.refer&nendo=2009&j_s_cd=09&j_cd=090508&langkbn=j
※ 全部正規表現に関係するリンクなんで荒らしではないです。
正規表現に関わるオートマトンの知識を付けたい方には参考になると思います。
0081nobodyさん
2014/01/18(土) 22:50:11.07ID:???ttp://www.i.kyushu-u.ac.jp/~takeda/Lectures/.../ComputationTheory01.pdf?
0082nobodyさん
2014/01/19(日) 07:18:17.70ID:???(?:(?!foo).)*
^(?:(?!foo).)*o$ → 「foo」 にマッチ出来ない。
先読みを使わない正規表現ならマッチ出来る。
→ (?:(?!foo).)* は厳密には間違い。
Q、では先読みを使って正しく動作させるにはどう書くべきか?
0083nobodyさん
2014/01/19(日) 11:23:45.74ID:???だろうが、
こんなの使うくらいなら
if (/foo/) {
} else {
※ここに書いたほうがいいに決まってる
}
で、もはや正規表現使うコストももったいないくらいだから
普通は strpos()みたいな関数使うべきだろう。
0084nobodyさん
2014/01/19(日) 15:12:27.67ID:U6WWS19riオプション必要なら代わりにlc
0085nobodyさん
2014/01/19(日) 15:26:00.19ID:???0086nobodyさん
2014/01/19(日) 17:13:11.44ID:???>>82の内容を理解出来てないね・・
(?:(?!foo).)* → fo にマッチ
o$ → o にマッチ
これ足して foo にマッチ「する」のが期待する文字列否定の動作。
fo の中に foo は含まれていないので fo にはマッチしなければならない。
>関数使うべき
マラソン選手に車使うべきって言ってるようなもん。
0087nobodyさん
2014/01/21(火) 04:23:32.47ID:???Perl正規表現雑技 - ある文字列を含まないものにマッチする正規表現
http://www.din.or.jp/~ohzaki/regex.htm#Without
0088nobodyさん
2014/01/24(金) 01:21:47.01ID:???既に文字列否定の正規表現を簡単に作れるようになってしまった。
チャリの運転と同じで、一旦出来るようになるとなんてことないね。
0089nobodyさん
2014/01/24(金) 05:08:57.49ID:???abc かつ def を含まない文字列を表す正規表現を作れ。ただし先読みはNG。
0090nobodyさん
2014/01/25(土) 14:00:24.10ID:peRg4Ln+言語は Java(Android開発) です。
やりたいことは、
・'a', 'b', 'c', '*' の4つの文字が使われた文字列を分割する
・'a*', 'b*', 'c*' は1文字として扱い、'*'のみの物は無い
になります。
例えば "aba*cb*" の場合は
a
b
a*
c
b*
に分割したいです。
どのように書けば良いのでしょうか、ご教授願います。
0091nobodyさん
2014/01/25(土) 17:37:15.39ID:VUYYCfMh0092nobodyさん
2014/01/26(日) 00:17:59.26ID:???糞質問・キチガイは↓こちらにお願いします。
Regular Expression(正規表現) Part12
http://toro.2ch.net/test/read.cgi/tech/1387257592/
009390
2014/01/26(日) 13:40:59.38ID:???ありがとうございました。勉強になります。
>>92
>>1も読めない糞は2chには向いていないと思うよ。
もう何十年も居座っていると予想されるが、そろそろ自覚しなよ。
0094nobodyさん
2014/01/26(日) 23:09:13.31ID:???わざわざ煽りにム板まで出張してきてるし。
0095nobodyさん
2014/01/27(月) 00:48:44.89ID:???0096nobodyさん
2014/01/27(月) 05:05:55.59ID:???http://d.hatena.ne.jp/junjun777/20110927/regexp_not_include
おや、あわわさんとやらが俺の代わりに知らせに行ってくれてたのか。
あわわさん乙。ありがとう。
正規表現 Part11
http://toro.2ch.net/test/read.cgi/tech/1363769640/337
ってあれ?あわわさんのほうが6時間早い。CPU時計の時差?
0097nobodyさん
2014/01/29(水) 03:59:46.05ID:???0098nobodyさん
2014/01/29(水) 04:05:21.14ID:???ただのクソスレ
0099nobodyさん
2014/01/29(水) 05:11:24.62ID:???0100nobodyさん
2014/01/29(水) 08:45:10.20ID:???当たりw
266の書き方は考えたけど,今回のケースでは267の書き方で大丈夫と考えた.
そういや質問者は「1」を含まないって書いてあるのに,なぜ「123」? とは思ったなw
後ろに他の正規表現を続けたりするとバックトラックして,
271の通りの可能性があるから初心者には266の方がいいのは確か.
ただ,他にもいろいろ考え出すと,最も内側のものだけ削除したいのなら,
ABC(?:(?!123|ABC|DEF).)*DEF
と書いた方がいいとかもある.
ちなみに266のミソは↓の辺りで微妙に使っていたりする.
http://www.din.or.jp/~ohzaki/regex.htm#NoEndTag
0101nobodyさん
2014/01/29(水) 15:23:04.24ID:???ああ、考えてみればABCも入れたほうがいいね。質問者の対象データが対になってる
データだったから必要性を感じなかったが入れるべきだった、さすが雑技たん。
>なぜ「123」?
1というのは実データとは違う省略形と考えた。
初心者には文字と文字列の違いが分からないから文字列のつもりで1と書いてしまった
可能性がある。そこで文字列に対応しておけば1文字にも対応出来るってわけ。
>ABC(?:(?!123|ABC|DEF).)*DEF
これが基本形やね。高速化するなら*+とか、もっとやるなら[^1AD]*+使ってごちゃごちゃ書いたり。
>NoEnd
ミソは否定の中に分岐を入れることだからそれとはちょっと違うw
それと <\2> だと <font> になってしまうで・・ <\2\b やね。
0102nobodyさん
2014/01/30(木) 00:29:41.02ID:???>1というのは実データとは違う省略形と考えた。
なるほど.確かに,初心者ほど状況説明が下手だからね.
>それと <\2> だと <font> になってしまうで・・ <\2\b やね。
単純なミスだな.指摘ありがとう.
0103nobodyさん
2014/01/30(木) 07:11:02.94ID:???$_ = "zzzABC XYDEFzzDEFz";
if ( m/
# Perl 5.10 以降で有効
ABC
[^XAD]*
(?:
(?!XYZ|ABC|DEF).
[^XAD]*
)*
(*PRUNE) # バックトラックステートの削除
(*SKIP) # 次回の走査開始位置をここに飛ばす
(?:XY?)? # XYZとDEFの競合を想定した取りこぼし回収
DEF
/xgsiaap )
{ print "match! <".${^MATCH}.">"; }
else
{ print "no match."; }
>>102
修正乙!
0104nobodyさん
2014/01/30(木) 13:46:05.59ID:???while ($html =~ /
<(NOBR|CODE|B|PRE|FONT)\b
(?=
(
(?:(?!<\/\1>).)*?
(?:<\1\b|$)
)
)
/sixg
) {
print "<".$1.$2, "\n";
}
------------- perl.htm -------------
<b><font><pre><b>aaa
------------- perl.htm -------------
*? はなるべく使いたくないなぁ・・ [^<]*+ を使って最適化したいw
0105nobodyさん
2014/01/31(金) 02:30:50.66ID:???(*VERB:ARG) ってのは知らなかったなぁ.
今回のケースだと(*PRUNE)は(?>pattern)で置き換えができると思うが,
マニュアルの 「(*PRUNE) は (?>pattern) 単独では表現できないケースを扱うために使えます。」ってのがどういうケースなのか想像できん.
>>104
修正ありがと.
元のやつだと後ろを吸い込んじゃうからマッチ位置が先に進んでしまう.
そうならないように先読みを使うと,先読み部分は後方参照に含まれなくなるから,先読みの中で改めて補足が必要って感じだね.
0106nobodyさん
2014/01/31(金) 04:37:54.39ID:???>単独では
・・・ ( ・・・ (*PRUNE) )
みたいに ( ) で分断されてる場合とか? (?> だと2つ以上必要になる。
>マッチが先に
当たり〜。printのとこは""の中にまとめて書いても大丈夫だったのか、勉強になりますた。
改めて修正乙。
0107nobodyさん
2014/01/31(金) 10:29:26.11ID:???「XYZとDEFの競合」ってのはXYZの後半封舶ェがDEFの前半部分と同じ場合ってことかな?
例えば,xydとdef,とか,xdeとdefみたいな
もしそういう,後半部分と前半部分が重なる場合を考え出すと,話がもう少しややこしくなる.
つまり,ABCDとCDEFがキーだったときに,ABCDEFという文字があったら,
それはABCD+EFと解釈するのか,AB+CDEFと解釈するのか,という問題.
その解釈がすべて前方優先なのか,すべて後方優先なのか,それともキーの相互の優先度で決まるのか,
あるいは,あらゆる可能性を許すのか,あらゆる可能性を許さないのか.
キー自身が重なる場合もある.
例えば,ABCABみたいなキーだったとき,ABCABCABは,ABCAB+CABなのか,ABC+ABCABなのか.
0108nobodyさん
2014/01/31(金) 10:34:35.37ID:???>・・・ ( ・・・ (*PRUNE) )
なるほど,括弧の深いところで使うと,(?> で表現するのは大変そうだ.
しかも,もしそれが中間レベルで分岐してたりすると,(?> では表現しきれないかな.
0109nobodyさん
2014/01/31(金) 16:13:45.49ID:???ぶっちゃけその辺は何も考えてない。試作品とかテンプレートみたいな感じで作っただけ。
競合対策の部分は普通の使い方をするならいらないね、HTMLやXMLタグで挟まれた文字列にマッチさせるときとか。
こういうの以外に使い道が思い当たらないし。(だったら付けるな)
>>108
>分岐
なるほど、(?> ではお手上げだ。俺も年末に覚えたばかりでよく分かってない。
0110nobodyさん
2014/02/01(土) 16:48:52.03ID:???$_ = "12";
if (
m/^1((*COMMIT)3|2)/
){ print "match!\n"; }
# 分岐の中で踏まれると以後ほかの分岐要素を走査することがなくなる。
# 現在の分岐要素がマッチ失敗したら全体もマッチ失敗となり検索はそこで完全終了する。
m/^1(*COMMIT)(3|2)/
# 下位層の分岐は走査され、マッチが成功する。
$_ = "12";
@test = $_ =~ m/^1(*COMMIT)A|\d/g;
print "@test\n";
# /g でも次位置からの走査は行われない。
@test = $_ =~ m/^1(*COMMIT)|\d/g;
# 結果 = 1 2 。マッチが成功した場合は走査を止めることはない。(失敗したときだけ止める)
0111nobodyさん
2014/02/01(土) 17:24:27.45ID:???$_ = "123";
@test = $_ =~ m/1|2|3/g;
print "@test\n";
↑2 がマッチ成功したときに /g を止め、3がマッチしないようにする。
フラグ変数を用意、チェックすれば可能だがもっと手軽な手段はないか。
0112nobodyさん
2014/02/02(日) 07:59:18.35ID:???COMMIT があるのにこれがないのはとても不可解だ。
# 先読みの中の (*SKIP) は機能しない。
@test = $_ =~ m/1|2(?=.*(*SKIP))|3/g;
# while 文の last を使う。
$_ = "123";
while ( m/1|2|3/gp )
{ print "${^MATCH}\n";
last; } # 1 で止まる。
# (?{code}) で last → 効果なし
while ( m/1|2(?{ last; })|3/gp )
# while 文に名前を付けて (?{code}) で last → 効果なし
TEST : while ( m/1|2(?{ last TEST; })|3/gp )
perl陣営に言えば新しいコマンド作ってくれそうだなぁ。
0113nobodyさん
2014/02/02(日) 08:47:00.66ID:???while ( m/1|2(?-g)|3/g )
# 苦肉の策 (現実的でない)
while (
m/(1)|(2).*|(3)/g
)
{ print "${^N}\n"; }
# 苦肉の策 + 最後の空文字列にマッチしない対策 (現実的でない)
while (
m/\z(*COMMIT)(*F)|(1)|(2).*|$/g
)
{ print "match! ${^N}\n"; }
0114nobodyさん
2014/02/02(日) 10:19:23.61ID:???>>112 >>123
/g がループというのはちょっと違う.
リストコンテキストで評価したときはループと言えるが,スカラーコンテキストで評価したときはループではなく,
単に前回マッチした場所を覚えていて続きからマッチングを行うというだけ.
この問題はリストコンテキストで /g を評価したときに,マッチ成功後に途中で止めるいい方法はないかって言う問題だと解釈した.
スカラーコンテキストで評価したときに止めるんなら last を使えば簡単に止まる話.
つまり,while を使っていいんなら,
while (/1|2(*:STOP)|3/g) {
push(@test, $&);
last if $REGMARK eq 'STOP';
}
print "'@test'\n";
リストコンテキストで評価したときに途中で止めるには,かなり条件が限定されるが,
@test = $_ =~ m/(?(?<=2)\G(*COMMIT)(*FAIL))(?:1|2|3)/g;
ぐらいしか思いつかなかった.
これではフラグを使った方が簡単だろう.
>ループというのはちょっと違う
そのへんはちゃんと理解してるから大丈夫。foreachとか<>みたいなつもりで書いてるから。
>リストコンテキストで /g を評価したときに,マッチ成功後に途中で止めるいい方法はないか
その通り。
>(*:STOP)
これはフラグ変数を使うやり方とまったく同じだからボツ・・。{ } の中で last するのはナシ。
m/ / の中で止められないか、という話だから。
しかも$REGMARKと$REGERRORは予期しない動きをすることがあるから
普通にフラグを使ったほうが確実。(後述)
>これではフラグを使った方が簡単だろう
やっぱそうかぁ、雑技たんでもダメなら無理そうだね。考えてくれてありがとう。
0116nobodyさん
2014/02/02(日) 14:08:53.79ID:???# マッチ失敗でも$REGERRORが偽を返す例
$_ = "11";
m/^(*MARK:NAME)12/;
if ($REGERROR){ print "yes\n" }else{ print "no\n"; };
結果 → no
# 2 を (?!) や (*FAIL) に変えると・・?
m/^(*MARK:NAME)1(?!)/;
結果 → yes
2 を $ にすると no のまま。
0117nobodyさん
2014/02/02(日) 14:12:45.66ID:???ごめん、使えないのは $REGERROR だけかも。
0118nobodyさん
2014/02/02(日) 14:30:37.56ID:???あ、ちゃう、これ分かってなかった。場所覚えてるだけだったのか、違和感感じてたんだけど
やっと理解出来たよ、ありがとう。
あと雑技たんのサイトだけど
>回文にマッチする正規表現 # 再帰版
× (??{$palindrome})*
○ (??{$palindrome})?
だね。前者だと回文を繋げた文字列 121454989・・・ みたいなのを拾ってしまう。
# リストコンテキスト + /p のマッチング中に break する。
$_ = "123";
@test = $_ =~ m/
1
|2
(?{ $last = "${^MATCH}"; })
(*COMMIT)(*F)
|3
/xgp;
push(@test,$last);
print "@test\n";
# リストコンテキスト + /p のマッチング中に break する。( push版 )
push(@test,
m/
1
|2
(?{ $last= ${^MATCH}; })
(*COMMIT)(*F)
|3
/xgp
,
$last
);
>>119
仕事はやっ!修正乙〜
----------------------------------------------
# 先読みの中の (*SKIP) は正しく機能する。(× >>112)
$_ = "123";
@test = $_ =~ m/1|2(?=.*\z(*SKIP)(*F))|3/g;
print "@test\n";
# 結果 → 1
# 先読みの中の (*SKIP) が失敗する例もある
@test = $_ =~ m/1|2(?=.*\z(*SKIP))(*F)|3/g;
# 結果 → 1 3
# perl内部の最適化の影響により (?=) より早く (*F) が判定されている?
# $REGERROR が期待通りに動かない原因も最適化が犯人? (最適化は 詳説 正規表現 参照)
----------------------------------------------
# \z で始まる正規表現 + while( /g )
while (
m/\z(?{ print "in code\n"; })/g
)
{ print "match!\n"; }
<結果>
in code
match!
in code
2回走査されてる。2回目は走査しといてマッチ失敗。/g により1つ先に進む動作の副作用?
(?{code}) が2回実行されるのでプログラムが想定外の動作になる可能性。
/g を忘れると走査開始位置が毎回先頭に戻り、無限ループになる。
0122nobodyさん
2014/02/03(月) 17:57:59.62ID:???$_ = "12223";
@test = $_ =~ m/
1
|2
(?{ $last = "$&"; })
.*\z # 余った文字列を全部マッチさせる。
|3
/xgs;
$test[$#test] = $last; # 最後の要素の入れ替え
print "@test\n";
これらを "break出来てる" と言うのはちょっとおこがましいかも知れない。やはり break コマンドが欲しい。
my $cnt = 0;
$_ = "11";
m/^(?{ $cnt++;})1(*F)/;
print "$cnt\n";
# 結果 → 1
my $cnt = 0;
$_ = "11";
m/^(?{ $cnt++;})12/;
print "$cnt\n";
# 結果 → 0
$REGERROR さんに無罪判決。冤罪でした。
0124nobodyさん
2014/02/04(火) 13:39:28.33ID:???テキスト内の文字を置き換えるアプリ(Devas)で作業をしています
正規表現で文字検索と置き換えしたいのですが表現法がわかりませんので
詳しい方アドバイス下さいませんでしょうか?
テキスト内には
.(ドット)abc"IMG
.(ドット)def"IMG
.(ドット)ghr"IMG
など . と "IMG で囲まれた数パターンの文字列がありこれに元文字列を利用し .photo を付け加えたいのです
.(ドット).photo.abc"IMG
.(ドット).photo.def"IMG
.(ドット).photo.ghr"IMG
検索、置き換え 共に正規表現が使えるアプリなのですがそれぞれどう表現して良いのか教えてくださいませんか?
よろしくお願いいたします
$_ = "ABC ABC DEF ABCDEF";
while ( m/
# Perl 5.10 以降で有効
ABC
[^ADX]* # 先頭の文字を使った高速処理
(?:
(?:
DEF (*ACCEPT) # マッチ成功
|\K ABC # 今までマッチした文字列を捨ててリスタート
|XYZ (*PRUNE) (*SKIP) (*F) # NGワード検出、マッチ失敗
|. # ↑の3つ以外の1文字
)
[^ADX]*
)*
(*COMMIT) (*F) # DEFで閉じられないまま終端に到達。
/xgsiaap )
{ print "match! <${^MATCH}>\n"; }
# NGワード、開始タグ、閉じタグの競合は想定していない。
# 例、NGワード="</" 、 閉じタグ="</div>"
0126nobodyさん
2014/02/04(火) 20:09:35.38ID:xuvSG1oC行頭限定の場合
<検索>
\.([a-z\d]{1,4}"IMG\b)
<置換>
..photo.$1
\. を ( ) に入れてないのは処理効率を上げるため。
「abc」の部分は拡張子と考えて数字も許可した。(1文字以上4文字以下の英数字)
何かまずかったら遠慮なく。
0128124
2014/02/06(木) 18:00:16.14ID:???お礼が遅れまして申し訳ありません
127様の \.([a-z\d]{1,4}"IMG\b) で無事検索できることができました
しかし置き換えでは マッチした文字列が ..photo.$1 に置き換わるだけで $1にマッチした語句が適応されません
検索結果
○○○○○○.abc" IMG が ○○○○○○..photo.$1 となります
希望では
○○○○○○.photo.abc" IMG となることです(単純に .拡張子 前に .photo を入れたい)
先の書き込みでの訂正がありました 申し訳ありません
検索したい文字列には " と IMG の間に半角スペースがありました
半角があっても上手く検索にひっかっかっていますが
上手く置き換えができないのはこの半角が原因なのでしょうか?
引き続きご指導いただければ幸いです よろしくお願いいたします
ごめんなさい、こちらにも見落としがいくつかありました。
( Devasにはメジャーな正規表現エンジンが使われていると考えて作りましたが違ったようです )
・通常版 (上行=検索、下行=置換)
\.[a-zA-Z\d]{1,4}" ?IMG\b
.photo\0
・拡張子を小文字に変換する版 (例 .JPG → .jpg )
\.([a-zA-Z\d]{1,4})(" ?IMG\b)
.photo.\L\1\E\2
・ 「"」 と IMG の間のスペースがあっても無くてもスペース1個にする版
\.([a-zA-Z\d]{1,4})" ?IMG\b
.photo.\L\1\E" IMG
# \L と \E を削除すれば拡張子の小文字変換はしなくなります。
# 本当は .photo.photo.jpg のような複数回置換による重複を防ぎたかったんですが
# この正規表現エンジンでは無理なようです。(>_<)
0130nobodyさん
2014/02/06(木) 22:22:42.47ID:???度々のレスありがとうございます
正規表現エンジンにもいろいろなものがあるとは知りませんでした
お手数をおかけいたしまして申し訳ありません
いくつものパターンを示してくださいまして
重ねて感謝いたします
通常版にて理想の変換ができました
今回教えて頂いたような知識を深めて、もっと便利にPCを使えるようになりたいと思います
勉強になりました ありがとうございます m(_ _)m
0131nobodyさん
2014/02/09(日) 02:41:58.21ID:???phpのpreg_match関数でwebページから文字列を抽出したいと考えています。
以下を使用して抽出していますが、改行が含まれると抽出ができませんでした。
$text = '/value="(.*?)" id="latest"/';
preg_match($text, $source, $matches);
$word = $matches[1];
色々調べて$textを以下のようにしてみましたが、うまくいきませんでした。
$text = '/value="(.*?)" id="latest"/s';
$text = '/value="([\s\S]*?)" id="latest"/';
$text = '/value="((\n|.)*?)" id="latest"/';
何故うまくいかないのかよくわかりません。
なにかアイデアはありませんでしょうか?
0132nobodyさん
2014/02/09(日) 08:07:39.87ID:J9pikab5/value="([^"]*)"\s+id="latest"/
0134nobodyさん
2014/02/09(日) 17:39:19.85ID:J9pikab50136nobodyさん
2014/02/11(火) 10:03:59.12ID:???動かないサンプルコードをアップして見てもらえば確実に原因教えてもらえると思う。
0137nobodyさん
2014/02/11(火) 13:41:52.16ID:???マトリョーシカの中にダルマを入れられる感じ。
0139nobodyさん
2014/02/15(土) 18:56:47.98ID:???http://www.kt.rim.or.jp/~kbk/regex/regex.html#NOTINCLUDED
「調整中」
気付いてもらえたのかそうでないのかいまいち分からんす。
このサイトはあんまアテにしないほうが良さそうだ。
\K が分岐の先頭にあることで処理速度に遅れが出るかどうか調べる。
また、\K を使わない書き方とどちらが早いか調べる。
Perl6 正規表現 I
http://dl.dropboxusercontent.com/u/16667824/perl6/AdventCalender/1/5.html
http://search.cpan.org/~lichtkind/Perl6-Doc-0.36/lib/Perl6/Doc/Overview/Rule.pod
[foo|bar]+
Perl6ではこれが正しい書き方になるらしい。初心者がハマりそう・・罠的な意味で。
先読み、戻り読みは書きにくくなった感が否めない。
文字クラスも加算、減算をしないときでも <> で囲う必要があるのはめんどくさい。
が、新しいオモチャとしては十分楽しめそう。ついでに英語も覚えてしまおう。
http://feather.perl6.nl/syn/S05.html
> Last Modified: 11 Feb 2014, Version: 174
A05
http://search.cpan.org/dist/Perl6-Doc/share/Apocalypse/A05.pod
> Last Modified: 18 May 2006, Number: 5, Version: 7
perl6ではもはや正規表現ではないという意味を込めて 「regex」 と呼んでるらしい。
perl5の正規表現にあった 「ゴチャゴチャ感」 が綺麗に一掃されてる感がある。
:ratchet があるのは最高だなぁ。
0145nobodyさん
2014/03/01(土) 19:39:32.33ID:n8n41uDihttp://anago.2ch.net/test/read.cgi/applism/1393578532/157
この書込の方を正規表現でNGにしたいと思っています。
条件は
最初の行とは限らないが、「・」で初める行がある。何文字かの後、改行
その次の行は空の行
この2セットを正規表現で表すにはどうすればいいでしょうか?
.*?・.*?\r\n\r\n
としてみましたがダメでした。
2chブラウザ用でいいのかな?処理速度重視で作った。
(?:^|<br>)(?>\s*)・(?>[^<]*(?:(?!<br>).[^<]*)*)<br>(?>\s*)<br>
0147nobodyさん
2014/03/01(土) 20:45:21.19ID:n8n41uDi素敵!
神!
すっきりしました!
テキストじゃなくhtmlに対して正規表現だったのですね、勉強になりました。
ありがとうございました!
0148nobodyさん
2014/03/02(日) 02:32:48.90ID:2i/vkXtz(?:^|<br>) は分岐のバックトラックが残るから (?><br>|\A) としたほうが良さそう。
この2つは動作が完全なイコールではないので注意が必要、文頭が <br> だった場合に
絶対に \A がマッチ出来なくなるため。これが問題になることはほとんど無いだろうけど。
0150nobodyさん
2014/03/05(水) 08:18:57.21ID:???S05
ttp://perlcabal.org/syn/S05.html
>Last Modified: 27 Feb 2014
Jeffrey Friedl
ttp://regex.info/
Jeffrey Friedl - 第3版のコード ※ CGIなので直リンは避けたほうが良い。
regex.info/listing.cgi?ed=3&p=all
第2刷に対する正誤表 - 詳説 正規表現 第3版
ttp://www.oreilly.co.jp/books/9784873113593/#errata0
Google Books 詳説 正規表現 ※ 立ち読み可能
ttps://www.google.co.jp/search?tbm=bks&hl=ja&q=%E8%A9%B3%E8%AA%AC%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE
0151nobodyさん
2014/03/13(木) 06:24:42.94ID:???!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~
0152nobodyさん
2014/03/17(月) 17:00:03.12ID:???>Perl6 正規表現 I
ここのサイト主、先読みを理解出来てないな・・。beforeとafterも逆だし。
0153nobodyさん
2014/03/21(金) 12:20:24.42ID:???0154nobodyさん
2014/03/22(土) 00:49:43.59ID:???---------
C:\WINDOWS\system32\cmd.exe /k C:\test.pl6
---------
/k は実行後にウインドウを閉じないオプション。
拡張子 pl6 を perl6.exe に関連付けしておく。
test.pl6 にperl6のテストコードを書いて実験する。
0155nobodyさん
2014/03/23(日) 15:15:41.32ID:???my $str;
$str := "AAABBBCCC";
say $str.trans( 'A'=>'a', 'B'=>'b', 'C'=>'c' );
say "\n"~$str;
---結果---
aaabbbccc
AAABBBCCC
0156nobodyさん
2014/03/26(水) 20:28:04.50ID:???!!! 試すときは仮想マシンを使うこと。環境が壊れて文字化けだらけになるため。 !!!
1、「コントロールパネル」 → 「地域と言語のオプション」
2、「日本語」 や 「日本」 と設定されている所を全て 「エストニア」 に設定する。
3、PC再起動
=> perl から et_EE.ISO8859-1 が使用可能になる。
順番が s z t u に変わったことを確認。ただ、 [a-z] で t 以降もマッチするのは変わらず。
[FreeBSD] - 2005/9/3 ( => FreeBSD4.10? )
http://lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014529.html
http://lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014531.html
正規表現 Part11
http://toro.2ch.net/test/read.cgi/tech/1363769640/330,325
0157nobodyさん
2014/03/26(水) 22:02:12.05ID:???http://lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014529.html
http://lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014531.html
正規表現 Part11
http://toro.2ch.net/test/read.cgi/tech/1363769640/330,325
[[ winXPで et_EE.ISO8859-1 を使う ]]
1、「コントロールパネル」 => 「地域と言語のオプション」
2、「日本」 「日本語」 を全て「エストニア」 に変更。
3、PC再起動
perlで s z t u の順になるのを確認。しかし [a-z] が t u 以降にもマッチするのは変わらなかった。
=> 順番が変わることによるトラブルを避けるために対策されている?
※ これをやると環境の一部がエストニア語で上書きされ日本語に戻せなくなるので
試すなら 「VM ware」 や 「Virtual PC」 等の仮想マシンで試しましょう。
2005/9/5 に問題報告がされているのでそれ以前にリリースされたFreeBSDを使って試せば
完全に再現出来る可能性大。そして 4.11で再現出来なくなっていれば対策が取られたということになる。
0158nobodyさん
2014/03/30(日) 04:03:56.61ID:???use locale;
print +(sort grep /[a-z]/i, map { chr } 0..255), "\n";
--------c:\test.pl-----------
C:\>perl test.pl
aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsSzZtTuUvVwWxXyY
C:\>perl -v
This is perl 5, version 16, subversion 3 (v5.16.3) built for MSWin32-x86-multi-thread
-----------------------------------
↓これを使わなくても順番が変わった。
use POSIX qw(setlocale LC_ALL);
setlocale(LC_ALL, "et_EE.ISO8859-1");
コンパネで「エストニア」と指定しただけで「et_EE.ISO8859-1」は未指定の状態。
-----------------------------------
/[a-z]/i を /\w/ に変えると英字以外の文字も英字の間に
挟まっていることが確認出来る。
0159nobodyさん
2014/03/30(日) 04:24:51.20ID:???use locale; # これが無いと順番が変わらない
use POSIX qw(setlocale LC_ALL); # コメントアウトしても変化なし
setlocale(LC_ALL, "et_EE.ISO8859-1"); # コメントアウトしても変化なし
my $abc;
$abc = "STU";
$abc =~ s/[A-Z]/hit/g;
print $abc."\n";
--------c:\test.pl-----------
[結果] hithithit
順番が変わっていれば S にしかマッチしないはずだが3文字すべてに
マッチしている。
LC_ALL を LC_CTYPE や、 LANG などに変えたり、test.plを保存するときの
文字コードをutf-8からshift_jisに変えたりしても結果変わらず。
XPsp3+perl5.16.3の環境で S だけにマッチさせる手段は無いと思われる。
0160nobodyさん
2014/03/30(日) 05:25:46.81ID:???「辞書順」はロケールに依存するが「文字コード順」は文字コードに依存する、んじゃね?
文字集合の範囲指定が文字コード順と定義されているなら、
いくらロケール切り替えても文字コード切り替えない限り無意味だろう。
で、文字集合の範囲指定ってどっちだと定義されてるの?
0161nobodyさん
2014/03/30(日) 14:02:22.42ID:???俺はロケールや文字コードの知識はほとんど無いんでよく分かってない。
↓は winXPsp3 + perl5.16.3 + ロケール = 「日本」 の環境での実験結果。
・ [ァ-ィ] が ア にマッチするか実験。( 文字コード順ならマッチしないはず )
----------------------------------------
use locale;
if ( "ア" =~/[ァ-ィ]/ ){ print "hit\n"; }
else { print "no hit\n"; };
----------------------------------------
結果: hit ( マッチしたので文字コード順ではない )
この環境での範囲指定は↓の順みたい。これはshift_jisの並び順とは違う。(これが辞書順?)
----------------------------------------
_0123456789aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsStTuUvVwWxXyYzZァアィ
スセソタチッツテトナニヌネノハヒフヘホマミムメモャヤュユョヨラリルレロワヲン
----------------------------------------
文字コードでなくロケールに依存するという発想は思い付かなかったわ、そっちの線で
また実験しながら遊んでみるよ、辞書順とやらも調べてみる。ヒントありがとう。
0162nobodyさん
2014/03/31(月) 00:44:57.15ID:???ついに [a-z] が t 以降にマッチしない動作の再現に成功!
et_EE.ISO8859-1 の代わりに et_EE.ISO8859-15 を使ったら再現出来ました!
今まで助言をくれたみなさんありがとう〜。自分一人じゃ絶対無理だった。
↓こちらの方々にも感謝〜
初心者もOK! FreeBSD質問スレッド その117
http://toro.2ch.net/test/read.cgi/unix/1380865524/938-954n
詳しい手順はもう少し調べて整理してから載せます。
0163nobodyさん
2014/04/01(火) 22:34:44.19ID:???http://akiba.geocities.jp/hp20140401/
とりあえず場所確保。
0164nobodyさん
2014/04/12(土) 17:21:41.17ID:???正規表現道場 Part2
http://nozomi.2ch .sc/test/read.cgi/php/1348048723/l50
■ 2ch.netの問題点
・ 2chscがNGワードになってるので正規表現をスレに貼るのに支障が出る。何より言論統制はイクナイ。
・ 管理人が今後どう動くか予測が付かない。
自暴自棄になりIPや書き込み履歴を大公開して逃走する可能性すらある。会社IPの人は注意。
0165nobodyさん
2014/04/12(土) 20:53:07.28ID:kZRku0LV0166nobodyさん
2014/04/15(火) 11:21:18.41ID:qQPWwAKLhttp://d.hatena.ne.jp/dacs/20080422/1208868051
○○/△△&#xd;[□□
という文字列から△△だけを抜き出したくて、色々試してみているのですがどうもうまくいきません
".*/" -> replace -> ""
"\&#xd;.+" -> replace -> ""
だと思うのですが、何か間違いがあるのでしょうか?
ちなみに
"[.+" -> replace -> ""
も試してみましたがダメでした
0167nobodyさん
2014/04/15(火) 20:38:11.07ID:CfZz5H/X文字列の開始も終わりも指定してないということは
.*/で一番最後の/までが対象として消える可能性はある
0169nobodyさん
2014/05/08(木) 02:37:21.25ID:???d:\\abc\\123\\ のように入力しているのですが、間違っていますか?
0170nobodyさん
2014/05/08(木) 03:20:39.96ID:Zyar7s4i0171nobodyさん
2014/05/22(木) 01:25:49.65ID:???0172nobodyさん
2014/05/22(木) 14:43:31.27ID:???>qr/\"((?:\\[\\\"]|.)*?)\"/
> これはよっぽど自信がないと書けない書き方だ。
今考えると弾たんは単に2文字否定の作り方を知らなかっただけだな・・。
知ってたらこんなあやふやなものを作ろうなんて思わないし。
早さに拘るのに早い正規表現の作り方を知らないというちょっと残念な弾たん。
他の正規表現を見ても正規表現自体のスキルは高くない。
なんでもこなすオールラウンダーだから薄く広くになるんだろうな。
しかしこの程度の正規表現スキルでcpanのモジュール作って大丈夫なんだろうか。
探せばバグが出てきそうな予感。
0173nobodyさん
2014/05/22(木) 15:18:43.78ID:???0174nobodyさん
2014/05/22(木) 16:18:04.88ID:???0175nobodyさん
2014/05/22(木) 16:49:22.13ID:???弾はなんだかんだ色々作ってるし色々な方面に貢献してる。
0176nobodyさん
2014/05/22(木) 18:11:53.77ID:???0177nobodyさん
2014/05/23(金) 17:54:18.09ID:???## m//
キャッシュを保持してない状態では空文字列にマッチする。
うっかりするとバグの原因になり得る。
0178nobodyさん
2014/05/23(金) 19:00:28.59ID:???Webブラウザで投稿したらBOT疑惑なのでCapchaしろになってそれで解除できた。
URLを貼りまくって連投規制になった場合は知らん。
0179nobodyさん
2014/05/23(金) 19:22:48.54ID:???俺の場合は「連続投稿は禁止されています。Error!」って出るだけ。
普通に連続投稿が原因で規制食らってるみたいだからもうダメかも分からんね。
人が少ないから自然に独り言みたいになるのにそれで規制されたら
ますます人少なくなるなw
0180nobodyさん
2014/05/23(金) 20:03:59.73ID:Hym2JLxi0181nobodyさん
2014/05/23(金) 22:52:00.36ID:???http://omatomen.net/archives/1002062987.html
0182nobodyさん
2014/05/24(土) 02:35:30.04ID:???(?num) の説明文にある・・
-------------------
(\()?[^()]+(?(1)\))
-------------------
これは (?num) とはまったく関係ない正規表現。ただの条件文。
0183nobodyさん
2014/05/24(土) 15:06:27.80ID:???----------------------------
(?(R)...) PCREで、再帰的パターンの開始を示します。
<(?:(?(R)\\d++|[^<>]*+)|(?R))*>
----------------------------
説明文は間違い。これは条件式の条件。\\d は \d の間違い。
perldoc.jp
http://perldoc.jp/docs/perl/5.14.1/perlre.pod
(?(condition)yes-pattern|no-pattern) の項目を参照。
0184nobodyさん
2014/05/27(火) 02:44:28.34ID:???・古本
初版 &nbsp;500円 → 1998円
2版 1600円 → 3150円
3版 4000円 → 3709円
・新品
3版 5184円
Amazon - "正規表現"
http://www.amazon.co.jp/s/field-keywords=%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE
0185nobodyさん
2014/05/27(火) 03:16:35.15ID:???0186nobodyさん
2014/05/27(火) 03:43:16.09ID:???↓ ^ か \A 忘れてね?
------------------------
$method =~ s/.*:://o;
------------------------
0187nobodyさん
2014/05/27(火) 03:49:35.83ID:???my ($hex, $name) = ($line =~ /^([0-9A-Fa-f]+)\s+(.*)/);
next if $name =~ /[a-z]/; # range, not character
----------------------------------------------------------
2行目だけ小文字に限定されてる。これで良いのか悪いのかは分からないが。
0188nobodyさん
2014/05/27(火) 14:20:55.14ID:???-----
せっかく [eE] と書いてるのに /i
= ($num =~ /([+-])?(\d+)(?:\.(\d+))?(?:[eE]([+-]?\d+))?/io);
-----
ちゃんと動くんだろうけどアンカー付けないのが気持ち悪い。
$int =~ s/(.*)(.{48})\z/$2/o;
-----
これミスでね? [k|g]
if ($style =~ /(?:romaji|[k|g]ana)$/){
0189nobodyさん
2014/05/27(火) 14:23:03.78ID:???皆はこうならぬように
0190nobodyさん
2014/05/27(火) 14:28:03.82ID:???$ja =~ tr/[G-Z]//d;
ITPro: tr///d
http://itpro.nikkeibp.co.jp/article/Reference/20080930/315784/
0191nobodyさん
2014/05/27(火) 14:50:18.14ID:???使われてなかったんだろう。ああいう時こそ効果的なのに。
0192nobodyさん
2014/05/27(火) 15:43:22.68ID:???/o なし
12724/s
/o あり
31689/s
/o あり は2.5倍早い。これは報告したほうがいいかも。
0193nobodyさん
2014/05/27(火) 16:02:40.01ID:???これに /o がついてるとなんか笑ってしまうw
余談追加。俺は報告なんかしないんで報告したい人がいたらしてね。
小飼 弾が手負いのうちに容赦なくツッコミを入れておく
http://akiba.geocities.jp/hp20140401/2014/006.html
0194nobodyさん
2014/05/29(木) 03:21:04.45ID:???---------------
use utf8;
---------------
\d
---------------
弾たんにならこれで通じるだろう。(確信)
0195nobodyさん
2014/05/29(木) 16:45:47.77ID:???ttp://kurt.scitec.kobe-u.ac.jp/~kikyo/lec/07/automaton/k5.pdf
行列の次は集合か・・もう忘れたよ・・覚えたことないけど。
0196nobodyさん
2014/05/30(金) 01:37:35.60ID:???http://www.kwansei.ac.jp/hs/z90010/sugaku1/kakuritu/syugo/set.htm
とっても分かりやすい。・・あれ?これ大学でやる内容か?中がっ(ry
0197nobodyさん
2014/05/30(金) 01:52:56.08ID:???0198nobodyさん
2014/05/30(金) 06:37:19.19ID:???0199nobodyさん
2014/05/30(金) 19:16:27.41ID:???結果 hit
答え、なし
0200nobodyさん
2014/05/30(金) 21:43:37.74ID:???() eq ""
() == ""
"" eq undef
"" == undef
() eq undef
() == undef
すべてtrueが返る。
0201nobodyさん
2014/05/30(金) 22:31:10.55ID:???http://blog.livedoor.jp/dankogai/archives/51268304.html
ちなみにブログのトップではGoogle Chromecastをボロクソに叩きつつ、Chromecastへのamazonアフィを
張るというすご技を展開されております。
こういう人相手に>>193を報告しにいってもスルーされるだけだと思うよ。カネにならないからね。
0202nobodyさん
2014/06/01(日) 03:26:43.94ID:???0204nobodyさん
2014/06/01(日) 10:29:53.68ID:???0205nobodyさん
2014/06/06(金) 06:34:46.02ID:???0206nobodyさん
2014/06/06(金) 06:36:44.82ID:???0207nobodyさん
2014/06/06(金) 06:39:17.80ID:qyn3RpL30208nobodyさん
2014/06/09(月) 20:39:55.26ID:Xlk9Lxk9lat = 'あい';
body = '<a href="あい">あい</a>';
reg = new RegExp(">[^<][\s\S]*?" + lat + "[\s\S]*?<","m");
body.match(reg);
console.log(reg.index);
13が返って欲しいのですが、undifinedになります。
0209nobodyさん
2014/06/10(火) 15:56:17.87ID:???Regular Expression(正規表現) Part12
http://peace.2ch.net/test/read.cgi/tech/1387257592/
jsならieか否か、または両方かも書いたほうが良いでしょう。
0210nobodyさん
2014/06/10(火) 18:29:25.24ID:pkqjoeBFご誘導ありがとうございます!
0211nobodyさん
2014/06/19(木) 11:10:47.66ID:???計算機基礎論 - set.pdf
0212nobodyさん
2014/06/21(土) 14:09:56.93ID:???関連スレのテンプレ入り
理論計算機科学
http://peace.2ch.net/test/read.cgi/tech/1403321199/
0213nobodyさん
2014/06/25(水) 15:49:19.16ID:???http://aozoragakuen.sakura. ne.jp/probability/probability.html
豪快に脱線中。言論統制対策でスペース。
0214nobodyさん
2014/06/25(水) 16:17:08.28ID:???0215nobodyさん
2014/06/25(水) 16:21:27.13ID:???0216nobodyさん
2014/06/25(水) 16:26:13.98ID:???0217nobodyさん
2014/06/26(木) 14:34:09.08ID:???http://www.math.kobe-u.ac.jp/HOME/saji/mathyomi/probability.html
確率は正規表現の処理効率向上に使う。
"|" による分岐で確率の高いほうを前に置いたほうが早くなるetc..
0218nobodyさん
2014/06/27(金) 22:19:38.37ID:???my $cnt=0;
for (my $i=0; $i<1000000; $i++){
if ( int(rand(3)) == 0 || int(rand(3)) == 2 || int(rand(3)) == 1)
{
$cnt++;
}# if
} #for
print "$cnt\n";
__END__
&& ・・・ A∧B
|| ・・・ A∨B
0219nobodyさん
2014/06/29(日) 14:17:12.43ID:???■ このスレッドは過去ログ倉庫に格納されています