連番のH画像/動画を一気にダウンロードする2
■ このスレッドは過去ログ倉庫に格納されています
0001前スレ1
2005/12/26(月) 02:56:22実践されているノウハウを教えていただきたく再度、スレを立てさせてもらいました。
前スレ 連番のH画像を一気にダウンロードする
http://pc8.2ch.net/test/read.cgi/unix/979106537/
0522名無しさん@お腹いっぱい。
2010/03/21(日) 01:30:51ないから串がどうのこうの上で言ってるわけ
0523名無しさん@お腹いっぱい。
2010/03/21(日) 01:31:13登録してログインできるようになると
規制回避できるんだな
0524名無しさん@お腹いっぱい。
2010/03/21(日) 02:08:290525名無しさん@お腹いっぱい。
2010/03/21(日) 11:59:44サーバが多い場合は帯域制限に引っかかりにくいな。
そればっか続くと何処までも行ける気がする。
プロクシの良し悪し言ってる中には実はこれだったってのもあるんじゃね?
0526名無しさん@お腹いっぱい。
2010/03/21(日) 12:49:47すんません
それ以前に、画像も串使わないと落とせないと勘違いしてました
ソースページだけ串で落として画像の直リン貰えば終了なのね
へこい串でもソースくらいなら落とせるから、画像は光でガンガン落とせてます
外人ポルノも落とせそうなくらい俺のクローラーが暇してます
1ipで制限にかかりにくくなったから少ない串で大量に落とせるとはいえ
依然として串の奪い合いなのは変わらんからツールは上げれないけど
0527名無しさん@お腹いっぱい。
2010/03/21(日) 19:46:52帯域制限の対象になっていて、画像自体は制限の対象
に、なってないって事?
0528名無しさん@お腹いっぱい。
2010/03/21(日) 19:50:070529名無しさん@お腹いっぱい。
2010/03/21(日) 19:56:22画像鯖自体も時々509.gifよこすけど、ほんと時々。ウェイトで回避できる。
基本規制はソース鯖だけ。
URLリストとかを共有できたら串問題も突破できるんだけど。
アップロードや鯖ソケットはやばいからなぁ。
そもそも時限式のアドレスっぽいからリストの鮮度維持せにゃならんし。
0530名無しさん@お腹いっぱい。
2010/03/21(日) 20:00:40どちらにせよ置かれてる状況に変わりはないんだがな。
0531名無しさん@お腹いっぱい。
2010/03/21(日) 20:03:47ちなみにimage.phpに渡るのはUnix秒を3600で割った値な。
有効期限は1時間内
0532名無しさん@お腹いっぱい。
2010/03/21(日) 20:19:11こんなことしょっちゅうやっているお方なのか、すさまじい直感っすね
あのハッシュについて特に気にもとめてなかったです
なるほどソース取り直せばウェイト要らなかったんですね
ありがとうございます
0533名無しさん@お腹いっぱい。
2010/03/21(日) 20:23:17おれはそんなこと言ってない。勝手に解釈するな。
それにしてもあんた数字に対する直観力ないな。
0534名無しさん@お腹いっぱい。
2010/03/21(日) 20:41:23う〜ん、やっぱり509も返す事あるのか。
画像のアドレスだけ集めて、後でまとめてダウンと考えていたけど
時間制限もあるから無理そうだし。
できるだけ、生ipは温存したいしなあ。
めんどからやっぱプロクシ両方とも通すかな。
0535名無しさん@お腹いっぱい。
2010/03/21(日) 21:04:35ありがとうございます、モンスター出てるのに全然気が付かなかった・・・
マジックあるだけ使って、後はアタックしたら勝てました
レジェンド?とかいうのは効果は何なんだろ
0536名無しさん@お腹いっぱい。
2010/03/21(日) 21:11:030537名無しさん@お腹いっぱい。
2010/03/21(日) 22:11:000538名無しさん@お腹いっぱい。
2010/03/21(日) 22:42:05E-Hentai攻略スレッドやまとめWikiが必要なようだな
0539名無しさん@お腹いっぱい。
2010/03/21(日) 23:01:07俺まさにそれでやってるんだけど、
経験的に言って画像URLは24時間程度は有効っぽいけど?
0540名無しさん@お腹いっぱい。
2010/03/21(日) 23:01:510541539
2010/03/21(日) 23:07:01鯖の生成する画像URLは確かに結構な頻度(1時間毎?)で変わるんだけど、
変わってもすぐさま前のURLが無効とはならない、という意味。
0542名無しさん@お腹いっぱい。
2010/03/21(日) 23:11:00串通してる?画像のURLはクライアントのIPには左右されないの?
0543539
2010/03/21(日) 23:20:41画像URLをゲットする時はIPアドレス切り替えていくけど、
画像本体取得時は生IP1本です。
> 画像のURLはクライアントのIPには左右されないの?
その後IP切り替えても問題なく取得出来るので、アドレスには依存しないか、
仮にするにしてもある程度の範囲は受け入れているんだと思う。
0544名無しさん@お腹いっぱい。
2010/03/21(日) 23:23:22早い回答ありがとう。参考になったよ。
0545名無しさん@お腹いっぱい。
2010/03/21(日) 23:29:350546名無しさん@お腹いっぱい。
2010/03/21(日) 23:47:47あの手のアドレスの再処理どうしてます?
0547名無しさん@お腹いっぱい。
2010/03/22(月) 00:16:010548名無しさん@お腹いっぱい。
2010/03/22(月) 00:39:18大体何分で再び見られるようになるんだ?
0549名無しさん@お腹いっぱい。
2010/03/22(月) 00:51:03いきなり画像が矢印ばかりに
0550名無しさん@お腹いっぱい。
2010/03/22(月) 00:58:160551480
2010/03/22(月) 01:03:17get.plのうpをお待ちになっている方は、近日中にアップデートします。
今日中には、アップデートは無理かも知れません。用事が入っているので。
0552名無しさん@お腹いっぱい。
2010/03/22(月) 01:47:30autopagerizeを導入した時点で弾かれるんだが…
0553名無しさん@お腹いっぱい。
2010/03/22(月) 04:17:01俺だけじゃなかったか……
0554名無しさん@お腹いっぱい。
2010/03/22(月) 06:48:48数枚だけキチンと取れてるのもあるが
0555名無しさん@お腹いっぱい。
2010/03/22(月) 07:16:28get.plではないが >>352 の後divの階層を見るようにしている自分に影響は出ないよ。
緊急の対処療法としては b.tlcとかw.ffsとかの単語を含むURLを排除することかな。
あるいはUnix時刻の話がタイムリーだが、サーバレスポンスの Date から時間値を逆算して
それの値が含まれる画像URLを見るとかね。(これ以外と堅いな)
0556名無しさん@お腹いっぱい。
2010/03/22(月) 07:38:10で探せばいいと思う。直前が閉じDIVになっているやつが本命。
オレ製ツールはこれでずっと問題なく動いてる。
0557480
2010/03/22(月) 08:04:21http://www1.axfc.net/uploader/Sc/so/95087
キーワードは、hentaiget と変らずです。
0558名無しさん@お腹いっぱい。
2010/03/22(月) 09:12:250559名無しさん@お腹いっぱい。
2010/03/22(月) 09:28:33誰もツールアップしなくなるだけだろ。
0560名無しさん@お腹いっぱい。
2010/03/22(月) 10:21:55Searchに打ち込んでも反映されないよ
0561名無しさん@お腹いっぱい。
2010/03/22(月) 10:31:570562名無しさん@お腹いっぱい。
2010/03/22(月) 10:43:10タイトルに日本語が含まれている場合のみ、検索対象に日本語が
使えます
そして、スレ違い
0563名無しさん@お腹いっぱい。
2010/03/22(月) 12:35:37これがエロの力か……
0564名無しさん@お腹いっぱい。
2010/03/22(月) 14:34:12それだけにget.plとそのプロキシ版の方には感謝
0565名無しさん@お腹いっぱい。
2010/03/22(月) 14:40:07俺はツール自作してて弾かれなんて無縁だ、でもうpはしないぜヒャッハーが常駐してる意味がわからない
0566名無しさん@お腹いっぱい。
2010/03/22(月) 14:54:500567名無しさん@お腹いっぱい。
2010/03/22(月) 16:24:59オナニーじゃなくて誰にでも簡単に扱えるツールを作れよカスオナニー猿ども
0568名無しさん@お腹いっぱい。
2010/03/22(月) 16:55:19知ったことかカスw
0569名無しさん@お腹いっぱい。
2010/03/22(月) 16:57:47あんたならビルゲイツに勝てる
0570名無しさん@お腹いっぱい。
2010/03/22(月) 16:58:04# afk|tlc|lol|qqm を無視
sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ($ofn, $url) = @_ ;
print "url : $url\n";
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach my $img ($tree->find("img")) {
next if($img->attr('src') =~ /(afk|tlc|lol|qqm)$/);
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
$tree->delete;
return $returlimg;
}
$tree->delete;
return "";
}
>>567
get.pl程度も使えない猿が何しにココ来てるの?
0571名無しさん@お腹いっぱい。
2010/03/22(月) 16:58:46sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ($ofn, , $url) = @_ ;
print "url : $url\n";
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach $img_tag ($tree->find("img")) {
my @div_tag = $img_tag->look_up('_tag' => 'div');
if(scalar(@div_tag) == 1){
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
$tree->delete;
return $returlimg;
}
}
$tree->delete;
return "";
}
0572名無しさん@お腹いっぱい。
2010/03/22(月) 17:00:07image落とせなくね?
矢印以前に一枚も
0573名無しさん@お腹いっぱい。
2010/03/22(月) 17:02:470574名無しさん@お腹いっぱい。
2010/03/22(月) 17:11:44img要素のaltとsrcを調べて拡張子が一致する場合に画像を保存するようにしてる
var alt = img.getAttribute('alt'), src = img.getAttribute('src');
if (alt.substr(-4) == src.substr(-4)) {
// ここで保存
}
みたいな感じで
0575名無しさん@お腹いっぱい。
2010/03/22(月) 17:29:30おぉっ、それなら明日のビルゲイツ君も喜ぶんじゃないかい。
0576名無しさん@お腹いっぱい。
2010/03/22(月) 17:41:53つか拡張子に4文字決め打ちってのはどうなんだろうか。
それに alt は別に必須オプションじゃなかろうし必ずファイル名を書くもんでもない。
実際には "xxx.j pg" のように空白が入っていた時期もある。(最近見んけど)
いずれにせよ将来の改変には要注意だね。
でもアドオンは凄く素敵だよ。
0577名無しさん@お腹いっぱい。
2010/03/22(月) 18:00:030578名無しさん@お腹いっぱい。
2010/03/22(月) 18:10:59|∧
/ /
(^o^)/ てめえらがどうしても
/( ) ツール開発しないなら
(^o^) 三 / / >
\ (\\ 三
(/o^) < \ 三
( /
/ く まずはそのふざけた
E-hentaiとかいうサイトぶっ潰す
0579名無しさん@お腹いっぱい。
2010/03/22(月) 18:25:480580名無しさん@お腹いっぱい。
2010/03/22(月) 20:19:580581名無しさん@お腹いっぱい。
2010/03/22(月) 20:42:09一度zipで落としたのは何度も落とせるんだし
0582名無しさん@お腹いっぱい。
2010/03/22(月) 20:46:360583名無しさん@お腹いっぱい。
2010/03/22(月) 21:05:34これやるから向こうで遊んできなさい。
0584480
2010/03/22(月) 21:57:07>>572
えっ、なんか間違ったか?と思って確認してみたが、うちでは
落とせてる。
サーバー障害か経路障害でもあったかなあ?
他に落とせない人いますか?
>>570
ヒントありがとう。
でも、HTML::TreeBuilder は、標準モジュールじゃないんだ。
それ言ったら、LWP はどうなんだって話ですが、perl配布パッケージ
に付いてくる場合が多いからなんだけど。
0585名無しさん@お腹いっぱい。
2010/03/22(月) 22:25:40標準モジュールじゃないのは知ってるけど、
自分の入れた ActivePerl 5.10.1 Build 1007 (win)には最初からあったのでつかってみた。
入ってなかったら使ってない。
div と img に絞るなら自分でパースしてもそんなもんだと思うけど。
0587名無しさん@お腹いっぱい。
2010/03/22(月) 22:37:59450行: my ($p, $d, $i) = ($_[0], "dummy.html", 1) ;
は衝突回避を考えて
450行: my ($p, $d, $i) = ($_[0], "$p/dummy.html", 1) ;
の方がいいと思う。
というか、そもそもファイル出力しなくても…
0588480
2010/03/22(月) 22:56:59衝突回避は、考えていなかったです。
元のget.plに手を加えるのが、やっとの俺です。
ファイル出力はデバッグやりやすいって事で、これも元のままです。
次の修正案に生かしたいです。ありがとうです
0589名無しさん@お腹いっぱい。
2010/03/23(火) 00:10:45また仕様変わったのかな
0590名無しさん@お腹いっぱい。
2010/03/23(火) 00:18:450591名無しさん@お腹いっぱい。
2010/03/23(火) 00:30:42プログラマーの知識ないから使えん
俺もファイル落としたい
0592名無しさん@お腹いっぱい。
2010/03/23(火) 00:43:320593名無しさん@お腹いっぱい。
2010/03/23(火) 00:47:06ダメだあれ
意味わからん
0594名無しさん@お腹いっぱい。
2010/03/23(火) 01:01:29ブラウザでまず個別ギャラリーのページに移動
ブラウザのアドレス欄をコピー
コマンドプロンプトかターミナルで
perl -u "hentaiget "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s
を実行したら、hoge234.list なんてファイルが出来る。
もう一度コマンドプロンプトから、
perl -l "hoge234.list " を実行。
それなりに時間掛かるので覚悟してくれ。
ActivePerl 5.10.1はインストールしてるんだよな。それともLinuxか?
じゃなかったらそれを先にやっておくべし。
この説明で分からないなら、素養が無いのでおきらめてくれ。
0595名無しさん@お腹いっぱい。
2010/03/23(火) 01:10:02正 perl hentaiget -l "hoge234.list " を実行。
うっかりミスだゆるされよ
0596名無しさん@お腹いっぱい。
2010/03/23(火) 01:12:56誤 perl -u "hentaiget "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s
正 perl "hentaiget -u "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s
すまん、またポカやってた。
これでオK?
0597名無しさん@お腹いっぱい。
2010/03/23(火) 01:13:29先ほど作成したリストを元に、 -u を -s に変えてやってるけど
最初に -u -s にしておくと結果って違うのかい?
0598名無しさん@お腹いっぱい。
2010/03/23(火) 01:17:51は、リストファイルを作成したらストップする。
hentaiget -l "hogehogehoe"
で、画像の取り出し option -s をこれにつけても意味がない。
0599名無しさん@お腹いっぱい。
2010/03/23(火) 01:19:580600名無しさん@お腹いっぱい。
2010/03/23(火) 01:20:180601名無しさん@お腹いっぱい。
2010/03/23(火) 01:24:42最初からつかるか、すべての処理が終わってからフォルダー名を
リネームするかの違いだから。好きにして
0602名無しさん@お腹いっぱい。
2010/03/23(火) 01:25:460603名無しさん@お腹いっぱい。
2010/03/23(火) 03:06:21ダウンロードはじまらねーぞ
嘘つくんじゃねーよ
内部コマンドまたは外部コマンド、操作可能なプログラム
またはバッチ ファイルとして認識されていませんって
拒否されんじゃねーか
0604名無しさん@お腹いっぱい。
2010/03/23(火) 03:09:120605名無しさん@お腹いっぱい。
2010/03/23(火) 07:47:31さっさとperlインストールしやがれこの野郎
話はそれからだ
0606名無しさん@お腹いっぱい。
2010/03/23(火) 07:55:25コテハンつけてくれ。
0607名無しさん@お腹いっぱい。
2010/03/23(火) 07:55:59get.plがある場所をカレントにすることも知らねぇんじゃないか?
コマンドプロンプトの基礎知識つけてreadme嫁
プログラマーの知識(笑)なんざいらねぇよ
ttp://www5f.biglobe.ne.jp/~ayum/command/command.html
get.pl使えるようになったら、さっさと消えてくれ
0608名無しさん@お腹いっぱい。
2010/03/23(火) 09:50:26板違いってことでいいんじゃなかろうか…
0609名無しさん@お腹いっぱい。
2010/03/23(火) 10:50:30>>603の無能っぷりと釣りっぷりと来たら(ry
0610名無しさん@お腹いっぱい。
2010/03/23(火) 11:16:52一瞬ここが何板だか確認してしまったよ
0611名無しさん@お腹いっぱい。
2010/03/23(火) 11:29:07検索で飛んでくる奴が多いのかな?
0612名無しさん@お腹いっぱい。
2010/03/23(火) 11:58:22Not found image address. Check dummy.html file.
と出て止まっちまう・・・・
0613名無しさん@お腹いっぱい。
2010/03/23(火) 12:05:13情報は、具体的に出した方がいいよ
どのページの何番目の画像とか
検証出来ないからね
0614名無しさん@お腹いっぱい。
2010/03/23(火) 15:16:43なんか説明みたいなのが表示されてlistが見あたらないんだけど
0615名無しさん@お腹いっぱい。
2010/03/23(火) 15:30:40listファイルはカレントにできるよ
>>612ではないんだけど、
http://g.e-hentai.org/g/207441/ad8546db23/
の八枚目とかが
Not found image address. Check dummy.html file.
になっちゃうな…
0616名無しさん@お腹いっぱい。
2010/03/23(火) 16:48:360617名無しさん@お腹いっぱい。
2010/03/23(火) 17:01:52http://ja.wikipedia.org/wiki/%E3%82%AB%E3%83%AC%E3%83%B3%E3%83%88%E3%83%87%E3%82%A3%E3%83%AC%E3%82%AF%E3%83%88%E3%83%AA
http://www.perl.org/
0619480
2010/03/23(火) 17:47:16改定バージョンですが、直ったかどうかまだ未確認です。
一応手元では、ダウン出来ているようです。
原因は二重チェックでアドレス確認に嵌まりました。
よけいな事しなけりゃよかった
>>587さんのファイル衝突回避を取入れました。
0620480
2010/03/23(火) 17:48:14■ このスレッドは過去ログ倉庫に格納されています