トップページunix
1001コメント292KB

連番のH画像/動画を一気にダウンロードする2

■ このスレッドは過去ログ倉庫に格納されています
0001前スレ12005/12/26(月) 02:56:22
前スレ5年間のご愛顧ありがとうございました。PGFは無事コンプしましたが、これからも皆様の日々
実践されているノウハウを教えていただきたく再度、スレを立てさせてもらいました。
前スレ 連番のH画像を一気にダウンロードする
http://pc8.2ch.net/test/read.cgi/unix/979106537/
0558名無しさん@お腹いっぱい。2010/03/22(月) 09:12:25
もしかしてツールの類を見つけて連絡するとクレジットもらえる...なんてシステムは無いだろな。
0559名無しさん@お腹いっぱい。2010/03/22(月) 09:28:33
そんなの、いやいやいや〜〜〜。
誰もツールアップしなくなるだけだろ。
0560名無しさん@お腹いっぱい。2010/03/22(月) 10:21:55
e-hentaiはどうやって作品検索すればよいのか教えて下さい
Searchに打ち込んでも反映されないよ
0561名無しさん@お腹いっぱい。2010/03/22(月) 10:31:57
Search?
0562名無しさん@お腹いっぱい。2010/03/22(月) 10:43:10
サーチキーワード(タグ)は、基本的に英語です
タイトルに日本語が含まれている場合のみ、検索対象に日本語が
使えます
そして、スレ違い
0563名無しさん@お腹いっぱい。2010/03/22(月) 12:35:37
scriptだけからサーバの話に飛んでいる……
これがエロの力か……
0564名無しさん@お腹いっぱい。2010/03/22(月) 14:34:12
知識がない俺にはわけわかめだぜ……
それだけにget.plとそのプロキシ版の方には感謝
0565名無しさん@お腹いっぱい。2010/03/22(月) 14:40:07
アップしたり報告したりしてる人はいいのだが
俺はツール自作してて弾かれなんて無縁だ、でもうpはしないぜヒャッハーが常駐してる意味がわからない
0566名無しさん@お腹いっぱい。2010/03/22(月) 14:54:50
彼がワカメのまま非実在青少年単純所持者分別君に迷い込みませんように
0567名無しさん@お腹いっぱい。2010/03/22(月) 16:24:59
get.plなんてプログラマーどもにしか使えない
オナニーじゃなくて誰にでも簡単に扱えるツールを作れよカスオナニー猿ども
0568名無しさん@お腹いっぱい。2010/03/22(月) 16:55:19
>>567
知ったことかカスw
0569名無しさん@お腹いっぱい。2010/03/22(月) 16:57:47
>>567
あんたならビルゲイツに勝てる
0570名無しさん@お腹いっぱい。2010/03/22(月) 16:58:04
get.plを使っているわけではないけどなんとなく

# afk|tlc|lol|qqm を無視
sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ($ofn, $url) = @_ ;
print "url : $url\n";

use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach my $img ($tree->find("img")) {
next if($img->attr('src') =~ /(afk|tlc|lol|qqm)$/);

(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
$tree->delete;
return $returlimg;
}
$tree->delete;
return "";
}

>>567
get.pl程度も使えない猿が何しにココ来てるの?
0571名無しさん@お腹いっぱい。2010/03/22(月) 16:58:46
# divの階層
sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ($ofn, , $url) = @_ ;
print "url : $url\n";

use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();

foreach $img_tag ($tree->find("img")) {
my @div_tag = $img_tag->look_up('_tag' => 'div');
if(scalar(@div_tag) == 1){
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
$tree->delete;
return $returlimg;
}
}
$tree->delete;
return "";
}
0572名無しさん@お腹いっぱい。2010/03/22(月) 17:00:07
>>557
image落とせなくね?
矢印以前に一枚も
0573名無しさん@お腹いっぱい。2010/03/22(月) 17:02:47
あ、コピペしたら/&/&/が/&/&/に…
0574名無しさん@お腹いっぱい。2010/03/22(月) 17:11:44
俺はFirefoxの拡張でやってるけど
img要素のaltとsrcを調べて拡張子が一致する場合に画像を保存するようにしてる

var alt = img.getAttribute('alt'), src = img.getAttribute('src');
if (alt.substr(-4) == src.substr(-4)) {
// ここで保存
}

みたいな感じで
0575名無しさん@お腹いっぱい。2010/03/22(月) 17:29:30
>>574
おぉっ、それなら明日のビルゲイツ君も喜ぶんじゃないかい。
0576名無しさん@お腹いっぱい。2010/03/22(月) 17:41:53
>>575
つか拡張子に4文字決め打ちってのはどうなんだろうか。
それに alt は別に必須オプションじゃなかろうし必ずファイル名を書くもんでもない。
実際には "xxx.j pg" のように空白が入っていた時期もある。(最近見んけど)
いずれにせよ将来の改変には要注意だね。
でもアドオンは凄く素敵だよ。
0577名無しさん@お腹いっぱい。2010/03/22(月) 18:00:03
ツール開発しないならE-hentaiとかいうサイトぶっ潰す
0578名無しさん@お腹いっぱい。2010/03/22(月) 18:10:59
                       ヘ(^o^)ヘ いいぜ
                         |∧  
                     /  /
                 (^o^)/ てめえらがどうしても
                /(  )    ツール開発しないなら
       (^o^) 三  / / >
 \     (\\ 三
 (/o^)  < \ 三 
 ( /
 / く  まずはそのふざけた
       E-hentaiとかいうサイトぶっ潰す
0579名無しさん@お腹いっぱい。2010/03/22(月) 18:25:48
わざわざsageて書くことか。まず親に頼め。
0580名無しさん@お腹いっぱい。2010/03/22(月) 20:19:58
agesageの時空が乱れる
0581名無しさん@お腹いっぱい。2010/03/22(月) 20:42:09
このスレで共有アカウント作って協力してcredits貯めるようにすればいいんじゃないの
一度zipで落としたのは何度も落とせるんだし
0582名無しさん@お腹いっぱい。2010/03/22(月) 20:46:36
フクナガちょー嬉しーんですけどぉお〜 アハハハハハ!アハハハハハハ!
0583名無しさん@お腹いっぱい。2010/03/22(月) 21:05:34
ttp://www.hongfire.com/forum/forumdisplay.php?f=115
これやるから向こうで遊んできなさい。
05844802010/03/22(月) 21:57:07
やっと帰っこれた。
>>572
えっ、なんか間違ったか?と思って確認してみたが、うちでは
落とせてる。
サーバー障害か経路障害でもあったかなあ?
他に落とせない人いますか?

>>570
ヒントありがとう。
でも、HTML::TreeBuilder は、標準モジュールじゃないんだ。
それ言ったら、LWP はどうなんだって話ですが、perl配布パッケージ
に付いてくる場合が多いからなんだけど。
0585名無しさん@お腹いっぱい。2010/03/22(月) 22:25:40
>>584
標準モジュールじゃないのは知ってるけど、
自分の入れた ActivePerl 5.10.1 Build 1007 (win)には最初からあったのでつかってみた。
入ってなかったら使ってない。
div と img に絞るなら自分でパースしてもそんなもんだと思うけど。
05864802010/03/22(月) 22:36:33
>>585
なるほど、winには入っているのか。
って言うか、うちのが perl5.8.6 使ってるからかも。
0587名無しさん@お腹いっぱい。2010/03/22(月) 22:37:59
ついでに言うと
450行: my ($p, $d, $i) = ($_[0], "dummy.html", 1) ;
は衝突回避を考えて
450行: my ($p, $d, $i) = ($_[0], "$p/dummy.html", 1) ;
の方がいいと思う。
というか、そもそもファイル出力しなくても…
05884802010/03/22(月) 22:56:59
>>587
衝突回避は、考えていなかったです。
元のget.plに手を加えるのが、やっとの俺です。
ファイル出力はデバッグやりやすいって事で、これも元のままです。
次の修正案に生かしたいです。ありがとうです
0589名無しさん@お腹いっぱい。2010/03/23(火) 00:10:45
あれ、十二時になったらget.plでおとせなくなった。
また仕様変わったのかな
0590名無しさん@お腹いっぱい。2010/03/23(火) 00:18:45
いあ、普通に落ちてくるな
0591名無しさん@お腹いっぱい。2010/03/23(火) 00:30:42
get.plの使い方教えろ
プログラマーの知識ないから使えん
俺もファイル落としたい
0592名無しさん@お腹いっぱい。2010/03/23(火) 00:43:32
付属のreadmi.txt嫁
0593名無しさん@お腹いっぱい。2010/03/23(火) 00:47:06
>>592
ダメだあれ
意味わからん
0594名無しさん@お腹いっぱい。2010/03/23(火) 01:01:29
一回だけ教えてやる
ブラウザでまず個別ギャラリーのページに移動
ブラウザのアドレス欄をコピー
コマンドプロンプトかターミナルで
perl -u "hentaiget "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s
を実行したら、hoge234.list なんてファイルが出来る。
もう一度コマンドプロンプトから、
perl -l "hoge234.list " を実行。
それなりに時間掛かるので覚悟してくれ。
ActivePerl 5.10.1はインストールしてるんだよな。それともLinuxか?
じゃなかったらそれを先にやっておくべし。

この説明で分からないなら、素養が無いのでおきらめてくれ。
0595名無しさん@お腹いっぱい。2010/03/23(火) 01:10:02
誤 perl -l "hoge234.list " を実行。
正 perl hentaiget -l "hoge234.list " を実行。
うっかりミスだゆるされよ
0596名無しさん@お腹いっぱい。2010/03/23(火) 01:12:56
>>594
誤 perl -u "hentaiget "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s
正 perl "hentaiget -u "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s
すまん、またポカやってた。
これでオK?
0597名無しさん@お腹いっぱい。2010/03/23(火) 01:13:29
俺いつも -s つけないで落として、弾かれたら次からは
先ほど作成したリストを元に、 -u を -s に変えてやってるけど
最初に -u -s にしておくと結果って違うのかい?
0598名無しさん@お腹いっぱい。2010/03/23(火) 01:17:51
hentaiget -u "hogehogehoe" -s
は、リストファイルを作成したらストップする。
hentaiget -l "hogehogehoe"
で、画像の取り出し option -s をこれにつけても意味がない。
0599名無しさん@お腹いっぱい。2010/03/23(火) 01:19:58
わざわざ処理を訳でルのは、,list に適当な分かりやすい名前を付ける為。
0600名無しさん@お腹いっぱい。2010/03/23(火) 01:20:18
じゃやっぱ最初に-sつける意味なくね?
0601名無しさん@お腹いっぱい。2010/03/23(火) 01:24:42
それ言っちゃうと、人それぞれの好みとしか言い様がない。
最初からつかるか、すべての処理が終わってからフォルダー名を
リネームするかの違いだから。好きにして
0602名無しさん@お腹いっぱい。2010/03/23(火) 01:25:46
なんか誤字脱字だらけだ。疲れてんのカナ
0603名無しさん@お腹いっぱい。2010/03/23(火) 03:06:21
おい>>596コピペしてコマンドプロントに貼り付けてエンター押しても
ダウンロードはじまらねーぞ
嘘つくんじゃねーよ
内部コマンドまたは外部コマンド、操作可能なプログラム
またはバッチ ファイルとして認識されていませんって
拒否されんじゃねーか
0604名無しさん@お腹いっぱい。2010/03/23(火) 03:09:12
マジわけわかんねーからツールで出してくれ
0605名無しさん@お腹いっぱい。2010/03/23(火) 07:47:31
>>603
さっさとperlインストールしやがれこの野郎
話はそれからだ
0606名無しさん@お腹いっぱい。2010/03/23(火) 07:55:25
>>603
コテハンつけてくれ。
0607名無しさん@お腹いっぱい。2010/03/23(火) 07:55:59
厨房が自分の無能さを棚に上げて文句言ってらぁ
get.plがある場所をカレントにすることも知らねぇんじゃないか?
コマンドプロンプトの基礎知識つけてreadme嫁
プログラマーの知識(笑)なんざいらねぇよ

ttp://www5f.biglobe.ne.jp/~ayum/command/command.html

get.pl使えるようになったら、さっさと消えてくれ
0608名無しさん@お腹いっぱい。2010/03/23(火) 09:50:26
少なくとも unix の知識自体がないっぽいから
板違いってことでいいんじゃなかろうか…
0609名無しさん@お腹いっぱい。2010/03/23(火) 10:50:30
全く知識が無い俺ですら、perlインスコして適当コマンド入力でファイルにありつけてるというのに
>>603の無能っぷりと釣りっぷりと来たら(ry
0610名無しさん@お腹いっぱい。2010/03/23(火) 11:16:52
コマンドプロンプトだのバッチファイルだの
一瞬ここが何板だか確認してしまったよ
0611名無しさん@お腹いっぱい。2010/03/23(火) 11:29:07
エロに国境(板違い)なしと言う事か
検索で飛んでくる奴が多いのかな?
0612名無しさん@お腹いっぱい。2010/03/23(火) 11:58:22
普通の画像だとDLできるが横長の画像がくると
Not found image address. Check dummy.html file.
と出て止まっちまう・・・・
0613名無しさん@お腹いっぱい。2010/03/23(火) 12:05:13
>>612
情報は、具体的に出した方がいいよ
どのページの何番目の画像とか
検証出来ないからね
0614名無しさん@お腹いっぱい。2010/03/23(火) 15:16:43
get.plってどこにlistができるのかな? カレント?
なんか説明みたいなのが表示されてlistが見あたらないんだけど
0615名無しさん@お腹いっぱい。2010/03/23(火) 15:30:40
>>614
listファイルはカレントにできるよ


>>612ではないんだけど、
http://g.e-hentai.org/g/207441/ad8546db23/
の八枚目とかが
Not found image address. Check dummy.html file.
になっちゃうな…
0616名無しさん@お腹いっぱい。2010/03/23(火) 16:48:36
カレントって何?perlってどこでDLできるの?
0617名無しさん@お腹いっぱい。2010/03/23(火) 17:01:52
>>616
http://ja.wikipedia.org/wiki/%E3%82%AB%E3%83%AC%E3%83%B3%E3%83%88%E3%83%87%E3%82%A3%E3%83%AC%E3%82%AF%E3%83%88%E3%83%AA
http://www.perl.org/
06184802010/03/23(火) 17:05:02
>>615
ありがとうございます確認しました。
出来るだけ早く直します。
06194802010/03/23(火) 17:47:16
http://www1.axfc.net/uploader/Sc/so/95533
改定バージョンですが、直ったかどうかまだ未確認です。
一応手元では、ダウン出来ているようです。

原因は二重チェックでアドレス確認に嵌まりました。
よけいな事しなけりゃよかった

>>587さんのファイル衝突回避を取入れました。
06204802010/03/23(火) 17:48:14
ダウンロードキーワードは、例のですのでよしなに
0621名無しさん@お腹いっぱい。2010/03/23(火) 18:10:50
>>473-479
>>479 >>462のどこを>>473-474にするのかが分かんねーよ
0622名無しさん@お腹いっぱい。2010/03/23(火) 18:38:16
意味わかんねー
スクリプトじゃなくてツールで出せよツールで
06234802010/03/23(火) 18:45:04
タイポ発見w
動くから、まあいいか

get.pl(hentaiget)のメッセージで
Not found image address. Check dummy.html file.
場合は、もう一つ原因があります。
プロキシサーバーが、接続先サイトを何らかの理由でブロックしている場合です。
この場合は、リストファイルを指定してプログラムを再スタートすれば、次の
プロキシが使われます。
それでもダウンしない場合は、プログラムミスかe-hentaiの仕様が変ったのどちらかです。
0624名無しさん@お腹いっぱい。2010/03/23(火) 19:03:27
>>615
[居酒屋よっちゃん] 二次の園オールスター DX1 (同人CG集)をげっt
thx
0625名無しさん@お腹いっぱい。2010/03/23(火) 19:04:50
なんかワロタ
0626名無しさん@お腹いっぱい。2010/03/23(火) 19:25:12
なんか香ばしいやつがいるな
0627名無しさん@お腹いっぱい。2010/03/23(火) 19:29:17
何なのこの流れ
0628名無しさん@お腹いっぱい。2010/03/23(火) 19:38:47
スルースルー
0629名無しさん@お腹いっぱい。2010/03/23(火) 19:48:20
落としました宣言パネェwww
さすがお客さんは違うな
0630名無しさん@お腹いっぱい。2010/03/23(火) 20:27:15
つぅかスレ勿体無えからやめろ。俺も今から30日間romるからさ。
0631名無しさん@お腹いっぱい。2010/03/23(火) 23:09:08
さっさとツール開発しろ
開発者どものオナニーで盛り上がってんじゃなくて
一般にも普及させろ
じゃないと放流も増えない
0632名無しさん@お腹いっぱい。2010/03/24(水) 00:04:31
なんかよくわからんけど「ツール」はNGワード指定か?
0633名無しさん@お腹いっぱい。2010/03/24(水) 00:13:40
俺がその気になって2ちゃんで呼びかければ
E-hentaiというサイトなんて簡単に潰せるということを
知っておいてほしい
0634名無しさん@お腹いっぱい。2010/03/24(水) 00:25:57
はいスルースルー
0635名無しさん@お腹いっぱい。2010/03/24(水) 00:32:12
馬鹿の相手するのも難だし、これからはラテン語で話そう。
そうすりゃ馬鹿は会話に参加することすらできなくなる。

↓じゃまず一人目
0636名無しさん@お腹いっぱい。2010/03/24(水) 00:32:29
パン
0637名無しさん@お腹いっぱい。2010/03/24(水) 00:39:09
シナチク
0638名無しさん@お腹いっぱい。2010/03/24(水) 00:48:14
俺がその気になってネットで呼びかければ
2-chというサイトなんて簡単に潰せるということを
知っておいてほしい
0639名無しさん@お腹いっぱい。2010/03/24(水) 01:23:14
>>462のsh scriptを参考にperlで書いて見た。
取りあえず、アンジェリーナ・ジョリーを連続ダウンロード
1122ダウンロードできた。
あれ、インデックスに書いて有る1139より少ない。
エラー処理さぼってるので、サーバーにうまく繋がらなかった場合は
スキップさせてるからだろう。
でも、ダウン出来た者に破損は見当たらない。まずまずである。
0640名無しさん@お腹いっぱい。2010/03/24(水) 01:29:49
imgタグのalt属性をファイル名にしてたら
同名のファイルを上書きしていて泣いたことならちらほら
0641名無しさん@お腹いっぱい。2010/03/24(水) 01:37:15
連続ダウンはファイル頭に連番追加はデフォですね
06426392010/03/24(水) 13:31:49
http://ideone.com/TGGhVvjC
取りあえず貼付けてみた
間違いあったら指摘よろしく
0643名無しさん@お腹いっぱい。2010/03/24(水) 15:33:20
>>642 すごいすごい。
完全他力本願な100%サルのオイラでも
ナタリーポートマンの画像386枚一気に落とせた。
ファイル名の桁数も自動で揃えてくれると完璧だけど、
これ以上の贅沢は言いません。感謝感激雨霰。
0644名無しさん@お腹いっぱい。2010/03/24(水) 17:30:10
プロンプトじゃなくてGUIでお願いします;
GUIが無理なら、ド級初心者でもできるような解説ページでもorz
0645名無しさん@お腹いっぱい。2010/03/24(水) 17:45:41
Linuxの入門書でも買ってこい
0646名無しさん@お腹いっぱい。2010/03/24(水) 17:50:44
厨房相手にしてるやつは氏ねばいいのに
0647名無しさん@お腹いっぱい。2010/03/24(水) 22:18:10
あのバッテンは何です?
0648名無しさん@お腹いっぱい。2010/03/24(水) 23:00:35
pspでe-hentaiが見れん・・・
何が問題なんだ?
0649名無しさん@お腹いっぱい。2010/03/24(水) 23:39:12
pspって自作ブラウザなんだね
最近e-henがgzipになったけどそれかな?
↓のページから サンプルプログラムを実行する っていうリンク踏んで
http://www.kawa.net/works/perl/contenc/gzip-test.html
CGI実行させてYESって出なければ駄目っぽいね
設定いじくって駄目ならソニーにgzip-1.4入れてくださいってメールするしか
0650名無しさん@お腹いっぱい。2010/03/25(木) 00:09:31
>>643
sub saveimageサブルーチンの以下に変更すれば名前の桁は揃う。
if ( $add =~ m|/¥d+_([a-zA-Z]+?)¥d+_.*(¥.[a-zA-Z]{3,})$| ) {
$name = ( sprintf "%04d_", $number++ ) . $1 . $2;

んが、わざわざサーバーと一緒の名前にしてるって事は、ダウンミスを
発見しやすくするためじゃね?
0651名無しさん@お腹いっぱい。2010/03/25(木) 04:39:10
e-hentaiを語る本スレみたいな場所ってないの?
0652名無しさん@お腹いっぱい。2010/03/25(木) 07:32:49
>594-596でやってみたけど
Can't open perl script "hentaiget -u "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s": Invalid argument
って出るorz
どなたかご教授お願いします。
0653名無しさん@お腹いっぱい。2010/03/25(木) 07:47:43
付属のreadme.txt嫁
それとエラーメッセージくらい理解出来るようにしたら?
0654名無しさん@お腹いっぱい。2010/03/25(木) 08:05:50
"画像ダウンロードに必要な前処理"っていうのが分からない…
get.pl -u http://g.e-hentai.org/g/139479/439ab3d366/を入れても
何も出てこないしlistもできません
get.pl -u http://g.e-hentai.org/g/139479/439ab3d366/
http://g.e-hentai.org/g/420624/2c12345d24dc/が仮定のurlかと思って
適当なの試してみたけど駄目だったorz
0655名無しさん@お腹いっぱい。2010/03/25(木) 09:22:16
このスレ始めてみたけどレベル酷いねw
0656名無しさん@お腹いっぱい。2010/03/25(木) 09:41:59
一部がひどいだけだよ。
0657名無しさん@お腹いっぱい。2010/03/25(木) 11:18:18
こんな便利なことが出来たとは……
凄いねget.pl
■ このスレッドは過去ログ倉庫に格納されています