連番のH画像/動画を一気にダウンロードする2
■ このスレッドは過去ログ倉庫に格納されています
0001前スレ1
2005/12/26(月) 02:56:22実践されているノウハウを教えていただきたく再度、スレを立てさせてもらいました。
前スレ 連番のH画像を一気にダウンロードする
http://pc8.2ch.net/test/read.cgi/unix/979106537/
0721名無しさん@お腹いっぱい。
2010/03/31(水) 05:59:520722名無しさん@お腹いっぱい。
2010/03/31(水) 11:10:53帯域制限か接続エラー三回で、次のプロクシを使うよ
プロクシファイルを編集すれば、お好きなプロクシを
順番に試してくれるよ
0723名無しさん@お腹いっぱい。
2010/03/31(水) 12:44:590724名無しさん@お腹いっぱい。
2010/03/31(水) 13:02:390725名無しさん@お腹いっぱい。
2010/03/31(水) 14:47:33>>722
サンクス、確かに後で変わってた
0726名無しさん@お腹いっぱい。
2010/03/31(水) 15:09:09でもgの方で強制転送ページが来たら、lofiの/3/を調べて取るしかない。
0727名無しさん@お腹いっぱい。
2010/03/31(水) 15:19:06紹介されていたよ
http://s-io.dyndns.tv/up/1/_/jump/1269758101.txt/attatch
PASS:game
0728名無しさん@お腹いっぱい。
2010/03/31(水) 15:47:090729名無しさん@お腹いっぱい。
2010/03/31(水) 16:18:17なんか懐かしすぎて泣ける
0730名無しさん@お腹いっぱい。
2010/03/31(水) 16:23:370731名無しさん@お腹いっぱい。
2010/03/31(水) 16:45:090732名無しさん@お腹いっぱい。
2010/03/31(水) 16:49:320733名無しさん@お腹いっぱい。
2010/04/01(木) 03:39:010734名無しさん@お腹いっぱい。
2010/04/01(木) 03:52:53>>732
対応したって?
0735名無しさん@お腹いっぱい。
2010/04/01(木) 06:39:150736名無しさん@お腹いっぱい。
2010/04/01(木) 07:22:22>>701の言うところの「穴」を e-hentai が塞いだ、って意味だと思う。
ツールを改良して新仕様に対応させた、って意味ではないと思うよ。
0737736
2010/04/01(木) 07:26:43やっぱり後者の意味に読めてきた。まぁどうでもいいや。
0738名無しさん@お腹いっぱい。
2010/04/01(木) 07:43:09検索クエリに "loli" があると弾いているみたいだから
"lol" や "con" だとhitするみたいね。
当然検索精度は幾分落ちる(余計なものまでhitする)けど。
0739名無しさん@お腹いっぱい。
2010/04/01(木) 07:47:130740名無しさん@お腹いっぱい。
2010/04/01(木) 10:15:490741名無しさん@お腹いっぱい。
2010/04/01(木) 11:00:07ページ規制はかかってるぽい
gの画像鯖のurlが短く&http//IP:ポートになった
規制とかはシラネ
0742名無しさん@お腹いっぱい。
2010/04/01(木) 12:35:53これ暗号化解けた香具師どれくらいいるの?
復号出来ずに釣られたとかいう香具師って情弱なわけ?w
0743名無しさん@お腹いっぱい。
2010/04/01(木) 12:36:59死すプリとか懐かしいな
0744名無しさん@お腹いっぱい。
2010/04/01(木) 17:50:17エロシーンが200ページあるなかで6〜7ページあるだけじゃねーか
うっあぜぇえええ
0745名無しさん@お腹いっぱい。
2010/04/02(金) 04:05:10Not found image address. Check dummy.html file
ってなっちまう。
サイトの仕様変わった?
0746名無しさん@お腹いっぱい。
2010/04/02(金) 05:32:120747名無しさん@お腹いっぱい。
2010/04/02(金) 17:43:180748名無しさん@お腹いっぱい。
2010/04/02(金) 22:53:080%から進まないな
対策済みって事かね?
0749名無しさん@お腹いっぱい。
2010/04/02(金) 23:46:16ずっと残ってるわけじゃないんだな
0750名無しさん@お腹いっぱい。
2010/04/03(土) 00:05:100751名無しさん@お腹いっぱい。
2010/04/03(土) 00:23:310752名無しさん@お腹いっぱい。
2010/04/03(土) 01:07:100753名無しさん@お腹いっぱい。
2010/04/03(土) 02:01:42ここが一番E-hentaiというサイトについて
2ちゃんで一番熱くレス交換されてるスレだからしゃーない
0754名無しさん@お腹いっぱい。
2010/04/03(土) 03:19:100755名無しさん@お腹いっぱい。
2010/04/03(土) 09:44:310756名無しさん@お腹いっぱい。
2010/04/03(土) 11:05:55sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ( $ofn ) = @_;
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach my $img_tag ($tree->find("img")) {
my @div_tag = $img_tag->look_up('_tag' => 'div');
if(scalar(@div_tag) == 1){
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
my $returlimgname = $img_tag->attr('alt');
$tree->delete;
return($returlimg, $returlimgname);
}
}
$tree->delete;
return "";
}
HTML::TreeBuilderがない?そんなの知らん。
0757名無しさん@お腹いっぱい。
2010/04/03(土) 14:03:550758名無しさん@お腹いっぱい。
2010/04/03(土) 20:43:480759名無しさん@お腹いっぱい。
2010/04/03(土) 21:47:070760名無しさん@お腹いっぱい。
2010/04/03(土) 22:14:380761名無しさん@お腹いっぱい。
2010/04/04(日) 03:52:27無論俺は後者。
0762名無しさん@お腹いっぱい。
2010/04/04(日) 04:26:44これつかいかたおしえろ!>>761
0763名無しさん@お腹いっぱい。
2010/04/04(日) 04:27:26>>762
w
0764名無しさん@お腹いっぱい。
2010/04/04(日) 17:10:130765名無しさん@お腹いっぱい。
2010/04/04(日) 18:28:380766名無しさん@お腹いっぱい。
2010/04/04(日) 19:21:08つまんね
0767名無しさん@お腹いっぱい。
2010/04/04(日) 20:25:57http://maniax.dlsite.com/work/=/product_id/RJ052315.html
0768名無しさん@お腹いっぱい。
2010/04/04(日) 21:59:260769名無しさん@お腹いっぱい。
2010/04/04(日) 23:01:030770名無しさん@お腹いっぱい。
2010/04/04(日) 23:37:270771名無しさん@お腹いっぱい。
2010/04/04(日) 23:54:270772名無しさん@お腹いっぱい。
2010/04/07(水) 03:28:48スレの勢いのなさ
ロリばっかだったのかこのスレ
0773名無しさん@お腹いっぱい。
2010/04/07(水) 05:08:490774名無しさん@お腹いっぱい。
2010/04/07(水) 14:05:260775名無しさん@お腹いっぱい。
2010/04/07(水) 18:35:00また仕様変えやがったよE変態
ちんロダよりタチ悪いわ
まぁ著作ゴロ対策にはいいかもしれんがな
0776名無しさん@お腹いっぱい。
2010/04/07(水) 21:09:450777名無しさん@お腹いっぱい。
2010/04/07(水) 21:16:360778756
2010/04/07(水) 23:16:04試したら、普通に落とせたが?
せめて何が落とせなかったとか、エラーとかがあれば、
誰かが何かしてくれるかもしれない。
ソースしか書く気がないので、
説明とかファイル修正とかは他人に任せる。
0779名無しさん@お腹いっぱい。
2010/04/07(水) 23:33:26改良しちゃいなよ。
0780名無しさん@お腹いっぱい。
2010/04/08(木) 00:11:370781775
2010/04/08(木) 09:19:43改めて落とし直したら今度はうまくいったわ。
どうやら刺してた串が原因だったみたい。
あと上で「これつかいかたおしえろ!」と嘆いてる
かわいそうな人に教えてやる
get.plのsub scrapeimgurl(@) { 以降を書き換えればおk
0782名無しさん@お腹いっぱい。
2010/04/08(木) 14:36:110783名無しさん@お腹いっぱい。
2010/04/08(木) 18:17:350784名無しさん@お腹いっぱい。
2010/04/08(木) 20:41:15HTML::TreeBuildermのインスト?モジュールの更新?がわからん
http://search.cpan.org/~petek/HTML-Tree-3.23/lib/HTML/TreeBuilder.pm
ここまでは来れた誰か教えてエロイ人
0785名無しさん@お腹いっぱい。
2010/04/08(木) 20:57:08板違い。
Perlについての質問箱 43箱目
http://pc12.2ch.net/test/read.cgi/tech/1266565626/
0786名無しさん@お腹いっぱい。
2010/04/08(木) 23:44:19sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ( $ofn ) = @_;
my $size = ( -s $ofn );
my $content = "";
open( DM, "<", $ofn ) || die $!;
read( DM, $content, $size );
close ( DM );
$content =~ s/<img/¥n<img/g;
my @html = split /¥n/, $content;
my ( $retLink, $retName ) = ( "", "" );
my %tmp = ();
for ( @html ) {
$tmp{$1}++ if ( m|(<img src=".*?[a-f0-9]{40}-.*?" class=)| );
}
my $url = "";
while ( my ( $key, $val ) = ( each %tmp ) ) {
$url = $key, last if ( $val == 1 );
}
if ( $url =~ /src="(.*?)"/ ) {
( $retLink = $1 ) =~ s/&/&/g;
if ( $url =~ m{alt="(.+?)"} ) {
( $retName = $1 ) =~ tr/¥/ /_/d;
} else {
$retName = "unknown.jpg";
}
}
return ( $retLink, $retName );
}
0787名無しさん@お腹いっぱい。
2010/04/09(金) 00:04:43『サーバの運用費が掛かるわりに寄付してくれる人が少ないんだよ。
だから比率的に広告主の発言力が増して今回みたいに言うこと聞かなきゃならないんだ。
自由にやるにはもっと金がいるんだ。ちゃんとユーザー登録してくれよ。メール送るからさ。
お前らタダ読みなんてモラル低いぞ』だってさ。
やっぱモラルは大切だよねぇ。
0788名無しさん@お腹いっぱい。
2010/04/09(金) 00:15:03誰でも思いつく変化はOKなの?
0789名無しさん@お腹いっぱい。
2010/04/09(金) 00:42:36そこまで正規表現にこってもしょうがない気がする。
変更が、あったらサックと直せばいいし。
<( |)img(¥t|)=....やってられん。可能性を探せば無数に有る。
0790名無しさん@お腹いっぱい。
2010/04/09(金) 01:05:06政権交代じゃなく、利権交代なんだし
0791名無しさん@お腹いっぱい。
2010/04/09(金) 01:16:170792名無しさん@お腹いっぱい。
2010/04/09(金) 01:17:14ごめん
0793756
2010/04/09(金) 04:33:19ちなみこれはhtmlの大文字小文字とかスペースとか軽微な変更なら無問題。
sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ( $ofn ) = @_;
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach my $img_tag ($tree->find("img")) {
my @div_tag = $img_tag->look_up('_tag' => 'div');
if(scalar(@div_tag) == 1) {
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
my $returlimgname = 'unk' . time . '.jpg';
if(defined($img_tag->attr('alt'))) {
$returlimgname = $img_tag->attr('alt');
$returlimgname =~ s/\s/_/g;
$returlimgname =~ tr/\\\/:*?"<>|/_/;
}
$tree->delete;
return($returlimg, $returlimgname);
}
}
$tree->delete;
return "";
}
0794名無しさん@お腹いっぱい。
2010/04/09(金) 23:29:440795名無しさん@お腹いっぱい。
2010/04/09(金) 23:42:340796名無しさん@お腹いっぱい。
2010/04/10(土) 08:57:37頑張ってください。
0797名無しさん@お腹いっぱい。
2010/04/10(土) 22:34:02403の画像が時々落ちてきて煩わしい。。 何か対策不足なのだろうか?
教えてエロイ人><
0798名無しさん@お腹いっぱい。
2010/04/10(土) 22:57:10誰かちゃんと動く最新版まとめておくれよぅ。
0799名無しさん@お腹いっぱい。
2010/04/10(土) 22:57:49400が出るってことね。
0800名無しさん@お腹いっぱい。
2010/04/10(土) 23:42:15それ多分、サーバーに存在しないファイルにアクセスしようとしてる。
文字参照あたりかも?
>>798
400エラー出てないな。少々改造したget.plだけど。改造する前も見た事ないな。
0801名無しさん@お腹いっぱい。
2010/04/11(日) 00:27:16で、上で書かれてる関数に入れ替えたら400エラーが出るようになったんだよ。
つまり、修正された関数を使うための何かが足りてないような気がするんだ。
0802名無しさん@お腹いっぱい。
2010/04/11(日) 00:37:31試しに、get.plv10.95に、>>786のパッチ当ててみた。
これと言ったエラーも出ずにダウン出来てます。
0803名無しさん@お腹いっぱい。
2010/04/11(日) 01:12:280804名無しさん@お腹いっぱい。
2010/04/11(日) 01:27:40ご理解とご協力お願いを致します。
アルゴリズムの意見交換や、一部コード晒しによる意見交換は、大いにやりましょう。
0805名無しさん@お腹いっぱい。
2010/04/11(日) 01:29:32それはそうと、最新版の再うpを誰かおながいします。
今調べたらボクのversion 1.1.1でした。テヘ。
0806名無しさん@お腹いっぱい。
2010/04/11(日) 01:32:00死ね消えろ
0807名無しさん@お腹いっぱい。
2010/04/11(日) 01:32:39わからない奴はシラネならいいけど(勉強すれば追いつける)、
最新版が既にDLできない状態でそういう置いてきぼりはないんでない?
0808名無しさん@お腹いっぱい。
2010/04/11(日) 01:34:02壁にぶち当たったり飽きたりして開発・または意見できる奴が減ったらそれまでじゃないか。
0809名無しさん@お腹いっぱい。
2010/04/11(日) 01:40:43以前、パイソン・ルビー・PHPで作ってる人が居たんだから。
みんな気軽にトライしろよ。スクリプトの作成くらい。
ここ何板と思ってんだ。くれくれなら帰れ。
0810名無しさん@お腹いっぱい。
2010/04/11(日) 01:42:39ってのもありじゃないか。ここは先導者として後に続くものの道を
作ってやるもの一つなんじゃないかな。
0811名無しさん@お腹いっぱい。
2010/04/11(日) 01:54:36あなたの持っているバージョンが、オリジナルget.pl最新版だと思われます。
0812名無しさん@お腹いっぱい。
2010/04/11(日) 02:22:20よし君が先導者だまかせたぜ
0813名無しさん@お腹いっぱい。
2010/04/11(日) 02:36:28いやいや派生版最新をよこせってことですよー
0814名無しさん@お腹いっぱい。
2010/04/11(日) 03:09:540815名無しさん@お腹いっぱい。
2010/04/11(日) 08:23:06正しいリンクの中に時々amp;って含まれてるから削ってアクセスしてみるといいよ
自作ツールでなく一般のブラウザでテストして自作ツールに反映してみるといい
0816名無しさん@お腹いっぱい。
2010/04/11(日) 09:18:29オレ様ルールふりかざしてんじゃねーよボケクズ
史ねやゴミ
自治厨は巣窟にとっととカエレ
0817名無しさん@お腹いっぱい。
2010/04/11(日) 09:46:07ただしくは'&'の記号はアンパサント(Ampersand)と読んでHMLの文法上は
意味のある特殊文字なので、だたの&は"&"と記述する。
他にも ">" とか """ とかあるからさ。
ちなみに '&' は "&" じゃなく "?" とも書けることをお忘れなく。
php なら htmlspecialchars_decode() が手っ取り早い。
0818名無しさん@お腹いっぱい。
2010/04/11(日) 09:49:11>>815
ただしくは'&'の記号はアンパサント(Ampersand)と読んでHMLの文法上は
意味のある特殊文字なので、だたの&は"&apm;amp;"と記述する。
他にも "&apm;gt;" とか """ とかあるからさ。
ちなみに '&' は "&" じゃなく "&" とも書けることをお忘れなく。
php なら htmlspecialchars_decode() が手っ取り早い。
0819名無しさん@お腹いっぱい。
2010/04/11(日) 09:51:170820名無しさん@お腹いっぱい。
2010/04/11(日) 09:53:01■ このスレッドは過去ログ倉庫に格納されています