連番のH画像/動画を一気にダウンロードする2
■ このスレッドは過去ログ倉庫に格納されています
0001前スレ1
2005/12/26(月) 02:56:22実践されているノウハウを教えていただきたく再度、スレを立てさせてもらいました。
前スレ 連番のH画像を一気にダウンロードする
http://pc8.2ch.net/test/read.cgi/unix/979106537/
0702名無しさん@お腹いっぱい。
2010/03/28(日) 21:59:37言ってるはじから書いちゃったがアンカーミス。
>>674じゃなくて>>681。
0703名無しさん@お腹いっぱい。
2010/03/28(日) 22:35:190704名無しさん@お腹いっぱい。
2010/03/28(日) 23:46:490705名無しさん@お腹いっぱい。
2010/03/29(月) 01:20:59スポンサー、パトロン、おっかないね
まぁ、ビジネスだからしょうがないか…
ロリショタケモ規制の活動して飯食ってる連中いるのかな
0706名無しさん@お腹いっぱい。
2010/03/29(月) 02:35:43別にそんなこと無いのね…残念
0707名無しさん@お腹いっぱい。
2010/03/29(月) 04:21:470708名無しさん@お腹いっぱい。
2010/03/29(月) 07:10:390709名無しさん@お腹いっぱい。
2010/03/29(月) 13:58:54あーこいつはやられたかなと思ってたがやっぱりか…
まぁそのうちサイトが潰れるか日本からのアクセスの制限がかかるだろうとは予想してたけど
圧力で特定タグだけ潰されるとは
全部見れなくなったわけじゃないけどそれが逆にスッキリしなくて歯がゆいな
0710名無しさん@お腹いっぱい。
2010/03/29(月) 15:51:390711名無しさん@お腹いっぱい。
2010/03/29(月) 18:23:480712名無しさん@お腹いっぱい。
2010/03/29(月) 18:48:520713名無しさん@お腹いっぱい。
2010/03/29(月) 19:08:020714名無しさん@お腹いっぱい。
2010/03/29(月) 21:42:18すべてのページが飛ばされるページになってるわけじゃないのね
大ページはクッキー食わせてれば大のまま?かな
0715名無しさん@お腹いっぱい。
2010/03/30(火) 06:07:040716名無しさん@お腹いっぱい。
2010/03/30(火) 06:54:580717名無しさん@お腹いっぱい。
2010/03/30(火) 08:33:10って出て止まっちまう画像があるな・・・・
0718名無しさん@お腹いっぱい。
2010/03/30(火) 13:23:55>>613
0719名無しさん@お腹いっぱい。
2010/03/30(火) 22:22:150720名無しさん@お腹いっぱい。
2010/03/31(水) 05:54:36プロキシはどのくらいの間隔で変わるようになってるんでしょうか?
プロキシファイルは読み込めてるっぽいですが先頭のプロキシから次に行かない?です
0721名無しさん@お腹いっぱい。
2010/03/31(水) 05:59:520722名無しさん@お腹いっぱい。
2010/03/31(水) 11:10:53帯域制限か接続エラー三回で、次のプロクシを使うよ
プロクシファイルを編集すれば、お好きなプロクシを
順番に試してくれるよ
0723名無しさん@お腹いっぱい。
2010/03/31(水) 12:44:590724名無しさん@お腹いっぱい。
2010/03/31(水) 13:02:390725名無しさん@お腹いっぱい。
2010/03/31(水) 14:47:33>>722
サンクス、確かに後で変わってた
0726名無しさん@お腹いっぱい。
2010/03/31(水) 15:09:09でもgの方で強制転送ページが来たら、lofiの/3/を調べて取るしかない。
0727名無しさん@お腹いっぱい。
2010/03/31(水) 15:19:06紹介されていたよ
http://s-io.dyndns.tv/up/1/_/jump/1269758101.txt/attatch
PASS:game
0728名無しさん@お腹いっぱい。
2010/03/31(水) 15:47:090729名無しさん@お腹いっぱい。
2010/03/31(水) 16:18:17なんか懐かしすぎて泣ける
0730名無しさん@お腹いっぱい。
2010/03/31(水) 16:23:370731名無しさん@お腹いっぱい。
2010/03/31(水) 16:45:090732名無しさん@お腹いっぱい。
2010/03/31(水) 16:49:320733名無しさん@お腹いっぱい。
2010/04/01(木) 03:39:010734名無しさん@お腹いっぱい。
2010/04/01(木) 03:52:53>>732
対応したって?
0735名無しさん@お腹いっぱい。
2010/04/01(木) 06:39:150736名無しさん@お腹いっぱい。
2010/04/01(木) 07:22:22>>701の言うところの「穴」を e-hentai が塞いだ、って意味だと思う。
ツールを改良して新仕様に対応させた、って意味ではないと思うよ。
0737736
2010/04/01(木) 07:26:43やっぱり後者の意味に読めてきた。まぁどうでもいいや。
0738名無しさん@お腹いっぱい。
2010/04/01(木) 07:43:09検索クエリに "loli" があると弾いているみたいだから
"lol" や "con" だとhitするみたいね。
当然検索精度は幾分落ちる(余計なものまでhitする)けど。
0739名無しさん@お腹いっぱい。
2010/04/01(木) 07:47:130740名無しさん@お腹いっぱい。
2010/04/01(木) 10:15:490741名無しさん@お腹いっぱい。
2010/04/01(木) 11:00:07ページ規制はかかってるぽい
gの画像鯖のurlが短く&http//IP:ポートになった
規制とかはシラネ
0742名無しさん@お腹いっぱい。
2010/04/01(木) 12:35:53これ暗号化解けた香具師どれくらいいるの?
復号出来ずに釣られたとかいう香具師って情弱なわけ?w
0743名無しさん@お腹いっぱい。
2010/04/01(木) 12:36:59死すプリとか懐かしいな
0744名無しさん@お腹いっぱい。
2010/04/01(木) 17:50:17エロシーンが200ページあるなかで6〜7ページあるだけじゃねーか
うっあぜぇえええ
0745名無しさん@お腹いっぱい。
2010/04/02(金) 04:05:10Not found image address. Check dummy.html file
ってなっちまう。
サイトの仕様変わった?
0746名無しさん@お腹いっぱい。
2010/04/02(金) 05:32:120747名無しさん@お腹いっぱい。
2010/04/02(金) 17:43:180748名無しさん@お腹いっぱい。
2010/04/02(金) 22:53:080%から進まないな
対策済みって事かね?
0749名無しさん@お腹いっぱい。
2010/04/02(金) 23:46:16ずっと残ってるわけじゃないんだな
0750名無しさん@お腹いっぱい。
2010/04/03(土) 00:05:100751名無しさん@お腹いっぱい。
2010/04/03(土) 00:23:310752名無しさん@お腹いっぱい。
2010/04/03(土) 01:07:100753名無しさん@お腹いっぱい。
2010/04/03(土) 02:01:42ここが一番E-hentaiというサイトについて
2ちゃんで一番熱くレス交換されてるスレだからしゃーない
0754名無しさん@お腹いっぱい。
2010/04/03(土) 03:19:100755名無しさん@お腹いっぱい。
2010/04/03(土) 09:44:310756名無しさん@お腹いっぱい。
2010/04/03(土) 11:05:55sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ( $ofn ) = @_;
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach my $img_tag ($tree->find("img")) {
my @div_tag = $img_tag->look_up('_tag' => 'div');
if(scalar(@div_tag) == 1){
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
my $returlimgname = $img_tag->attr('alt');
$tree->delete;
return($returlimg, $returlimgname);
}
}
$tree->delete;
return "";
}
HTML::TreeBuilderがない?そんなの知らん。
0757名無しさん@お腹いっぱい。
2010/04/03(土) 14:03:550758名無しさん@お腹いっぱい。
2010/04/03(土) 20:43:480759名無しさん@お腹いっぱい。
2010/04/03(土) 21:47:070760名無しさん@お腹いっぱい。
2010/04/03(土) 22:14:380761名無しさん@お腹いっぱい。
2010/04/04(日) 03:52:27無論俺は後者。
0762名無しさん@お腹いっぱい。
2010/04/04(日) 04:26:44これつかいかたおしえろ!>>761
0763名無しさん@お腹いっぱい。
2010/04/04(日) 04:27:26>>762
w
0764名無しさん@お腹いっぱい。
2010/04/04(日) 17:10:130765名無しさん@お腹いっぱい。
2010/04/04(日) 18:28:380766名無しさん@お腹いっぱい。
2010/04/04(日) 19:21:08つまんね
0767名無しさん@お腹いっぱい。
2010/04/04(日) 20:25:57http://maniax.dlsite.com/work/=/product_id/RJ052315.html
0768名無しさん@お腹いっぱい。
2010/04/04(日) 21:59:260769名無しさん@お腹いっぱい。
2010/04/04(日) 23:01:030770名無しさん@お腹いっぱい。
2010/04/04(日) 23:37:270771名無しさん@お腹いっぱい。
2010/04/04(日) 23:54:270772名無しさん@お腹いっぱい。
2010/04/07(水) 03:28:48スレの勢いのなさ
ロリばっかだったのかこのスレ
0773名無しさん@お腹いっぱい。
2010/04/07(水) 05:08:490774名無しさん@お腹いっぱい。
2010/04/07(水) 14:05:260775名無しさん@お腹いっぱい。
2010/04/07(水) 18:35:00また仕様変えやがったよE変態
ちんロダよりタチ悪いわ
まぁ著作ゴロ対策にはいいかもしれんがな
0776名無しさん@お腹いっぱい。
2010/04/07(水) 21:09:450777名無しさん@お腹いっぱい。
2010/04/07(水) 21:16:360778756
2010/04/07(水) 23:16:04試したら、普通に落とせたが?
せめて何が落とせなかったとか、エラーとかがあれば、
誰かが何かしてくれるかもしれない。
ソースしか書く気がないので、
説明とかファイル修正とかは他人に任せる。
0779名無しさん@お腹いっぱい。
2010/04/07(水) 23:33:26改良しちゃいなよ。
0780名無しさん@お腹いっぱい。
2010/04/08(木) 00:11:370781775
2010/04/08(木) 09:19:43改めて落とし直したら今度はうまくいったわ。
どうやら刺してた串が原因だったみたい。
あと上で「これつかいかたおしえろ!」と嘆いてる
かわいそうな人に教えてやる
get.plのsub scrapeimgurl(@) { 以降を書き換えればおk
0782名無しさん@お腹いっぱい。
2010/04/08(木) 14:36:110783名無しさん@お腹いっぱい。
2010/04/08(木) 18:17:350784名無しさん@お腹いっぱい。
2010/04/08(木) 20:41:15HTML::TreeBuildermのインスト?モジュールの更新?がわからん
http://search.cpan.org/~petek/HTML-Tree-3.23/lib/HTML/TreeBuilder.pm
ここまでは来れた誰か教えてエロイ人
0785名無しさん@お腹いっぱい。
2010/04/08(木) 20:57:08板違い。
Perlについての質問箱 43箱目
http://pc12.2ch.net/test/read.cgi/tech/1266565626/
0786名無しさん@お腹いっぱい。
2010/04/08(木) 23:44:19sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ( $ofn ) = @_;
my $size = ( -s $ofn );
my $content = "";
open( DM, "<", $ofn ) || die $!;
read( DM, $content, $size );
close ( DM );
$content =~ s/<img/¥n<img/g;
my @html = split /¥n/, $content;
my ( $retLink, $retName ) = ( "", "" );
my %tmp = ();
for ( @html ) {
$tmp{$1}++ if ( m|(<img src=".*?[a-f0-9]{40}-.*?" class=)| );
}
my $url = "";
while ( my ( $key, $val ) = ( each %tmp ) ) {
$url = $key, last if ( $val == 1 );
}
if ( $url =~ /src="(.*?)"/ ) {
( $retLink = $1 ) =~ s/&/&/g;
if ( $url =~ m{alt="(.+?)"} ) {
( $retName = $1 ) =~ tr/¥/ /_/d;
} else {
$retName = "unknown.jpg";
}
}
return ( $retLink, $retName );
}
0787名無しさん@お腹いっぱい。
2010/04/09(金) 00:04:43『サーバの運用費が掛かるわりに寄付してくれる人が少ないんだよ。
だから比率的に広告主の発言力が増して今回みたいに言うこと聞かなきゃならないんだ。
自由にやるにはもっと金がいるんだ。ちゃんとユーザー登録してくれよ。メール送るからさ。
お前らタダ読みなんてモラル低いぞ』だってさ。
やっぱモラルは大切だよねぇ。
0788名無しさん@お腹いっぱい。
2010/04/09(金) 00:15:03誰でも思いつく変化はOKなの?
0789名無しさん@お腹いっぱい。
2010/04/09(金) 00:42:36そこまで正規表現にこってもしょうがない気がする。
変更が、あったらサックと直せばいいし。
<( |)img(¥t|)=....やってられん。可能性を探せば無数に有る。
0790名無しさん@お腹いっぱい。
2010/04/09(金) 01:05:06政権交代じゃなく、利権交代なんだし
0791名無しさん@お腹いっぱい。
2010/04/09(金) 01:16:170792名無しさん@お腹いっぱい。
2010/04/09(金) 01:17:14ごめん
0793756
2010/04/09(金) 04:33:19ちなみこれはhtmlの大文字小文字とかスペースとか軽微な変更なら無問題。
sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ( $ofn ) = @_;
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach my $img_tag ($tree->find("img")) {
my @div_tag = $img_tag->look_up('_tag' => 'div');
if(scalar(@div_tag) == 1) {
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
my $returlimgname = 'unk' . time . '.jpg';
if(defined($img_tag->attr('alt'))) {
$returlimgname = $img_tag->attr('alt');
$returlimgname =~ s/\s/_/g;
$returlimgname =~ tr/\\\/:*?"<>|/_/;
}
$tree->delete;
return($returlimg, $returlimgname);
}
}
$tree->delete;
return "";
}
0794名無しさん@お腹いっぱい。
2010/04/09(金) 23:29:440795名無しさん@お腹いっぱい。
2010/04/09(金) 23:42:340796名無しさん@お腹いっぱい。
2010/04/10(土) 08:57:37頑張ってください。
0797名無しさん@お腹いっぱい。
2010/04/10(土) 22:34:02403の画像が時々落ちてきて煩わしい。。 何か対策不足なのだろうか?
教えてエロイ人><
0798名無しさん@お腹いっぱい。
2010/04/10(土) 22:57:10誰かちゃんと動く最新版まとめておくれよぅ。
0799名無しさん@お腹いっぱい。
2010/04/10(土) 22:57:49400が出るってことね。
0800名無しさん@お腹いっぱい。
2010/04/10(土) 23:42:15それ多分、サーバーに存在しないファイルにアクセスしようとしてる。
文字参照あたりかも?
>>798
400エラー出てないな。少々改造したget.plだけど。改造する前も見た事ないな。
0801名無しさん@お腹いっぱい。
2010/04/11(日) 00:27:16で、上で書かれてる関数に入れ替えたら400エラーが出るようになったんだよ。
つまり、修正された関数を使うための何かが足りてないような気がするんだ。
■ このスレッドは過去ログ倉庫に格納されています