連番のH画像/動画を一気にダウンロードする2
レス数が1000を超えています。これ以上書き込みはできません。
0001前スレ1
2005/12/26(月) 02:56:22実践されているノウハウを教えていただきたく再度、スレを立てさせてもらいました。
前スレ 連番のH画像を一気にダウンロードする
http://pc8.2ch.net/test/read.cgi/unix/979106537/
0002名無しさん@お腹いっぱい。
2005/12/26(月) 03:35:40http://pc8.2ch.net/test/read.cgi/unix/964944018/
0003名無しさん@お腹いっぱい。
2005/12/26(月) 04:52:56% mplayer *
とやっても全部の動画が再生される前に落ちてしまうので
わざわざ for i in *.wmv とかやってる。5年間のノウハウで何とかならんかね。
0004名無しさん@お腹いっぱい。
2005/12/26(月) 08:15:49カレント以下のjpgファイルとかをシーケンシャルな名前で
カレントディレクトリに持ってくる(リネームする) スクリプトを
書いたので採点お願いします.
使用例) $Rname wmv idol
でカレントディレクトリ以下にあった*.wmvファイルが
カレントディレクトリにidol001.wmvからidol00x.wmvという
名前でリネームされます.
# 続く
00054
2005/12/26(月) 08:18:29#!/bin/bash
# parameter analyze
SUF=$1
if [ -z $1 ] ; then
echo 'no suffix specified. default: *.jpg will be used';
SUF='jpg';
fi
PRE=$2
if [ -z $2 ] ; then
echo 'no prefix specified. default X will be used';
PRE='X'
fi
# fatal situation?
if [ $(find . -name "$PRE*.$SUF"| head -1) ] ; then
echo ' Fatal situation. Please think again the prefix. Exit.'
exit;
fi
# 続く
00064
2005/12/26(月) 08:20:18num=1
find . -name "*.$SUF" |
while read fpath
do
echo mv $fpath $PRE$(printf %03d $num).$SUF
let num=$num+1
done
# Is this OK?
echo -n 'Right?[y/n]'
read ans
# exec operation
if [ $ans = 'y' ] ; then
num=1
find . -name "*.$SUF" |
while read fpath
do
eval mv $fpath $PRE$(printf %03d $num).$SUF
let num=$num+1
done
fi
# 終わり
0007名無しさん@お腹いっぱい。
2005/12/26(月) 14:45:110008名無しさん@お腹いっぱい。
2006/01/07(土) 23:56:59の画像がブラウザで見れて、wgetでは落とすことができません。
wget --referer=http://blogfiles.naver.net/ http://blogfiles.naver.net/data6/2005/4/7/57/704_166291_101-hanic71.jpg
referer とかも設定しているつもりなんですけど、どうやればコマンドラインで落とすことができますか?
よろしくおねがいします。
0009名無しさん@お腹いっぱい。
2006/01/08(日) 00:06:40wget --referer=〜の行をコピペして実行したらウチではいけたよ
0010名無しさん@お腹いっぱい。
2006/01/08(日) 02:01:51そうなんですか。うちでは
HTTP request sent, awaiting response... 404 Object Not Found
02:00:06 ERROR 404: Object Not Found.
とか言われてしまいます。なんでだろ
0011名無しさん@お腹いっぱい。
2006/01/08(日) 06:58:51古めの108番にあるものはリファーとUAだけですんなり行くんですが
新しめのだと403エラーになります。(IEにコピペ直飛びだとOK
URL同リファ→一段づつ削る、無し
UA各種
-r -npでディレクトリDL
001.jpgで単品DL
と思いつく限り試したのですがダメでした。
できたかたいましたらヒントだけでも結構ですので参考に教えて頂けませんか。
〆参考urlです p://comic118.464.jp/data/yosidaakimi/bananafissyu1/020.jpg
0012名無しさん@お腹いっぱい。
2006/01/08(日) 14:41:27Forbidden
You don't have permission to access /data/yosidaakimi/bananafissyu1/020.jpg on this server.
Apache/2.0.54 (Fedora) Server at comic2.464.jp Port 80
0013名無しさん@お腹いっぱい。
2006/01/08(日) 19:09:12確認したところ464に一旦ログインしないとアドレス直貼りでも見れないようでした。
なのでWGETのhttpuser,passを設定したもののエラーになり
ブラウザでも464にログインしただけでは駄目で一度該当巻のページに行くことで
やっとIEコピペ飛びいけました。
難しい設定されてるようで連番は無理っぽい気がしてきました。。
もし同様にトライされてるかたいましたら気長に情報お待ちしております、ありがとうございました。
0014名無しさん@お腹いっぱい。
2006/01/08(日) 21:02:56勘だけど、そのページのクッキーを解析してみな。
偽装はそれからだ。
0015名無しさん@お腹いっぱい。
2006/01/08(日) 22:08:43javascriptがあるだけでした。
スクリプトもxxx.jpgを表示、虫メガネ機能だけを書いたものでクッキー記述はなかったです。
またちょこちょこ調べてみます。ありがとうございました。
0016名無しさん@お腹いっぱい。
2006/01/19(木) 01:25:21の画像がWebMGetで落とせません。
また、DLHelperで上記のURLを表示させようとすると ttp://descargas.sectahentai.org/ へ飛ばされます。
解決方法はありますか?
よろしくお願いします。
0017名無しさん@お腹いっぱい。
2006/01/19(木) 02:24:290018名無しさん@お腹いっぱい。
2006/01/19(木) 04:39:480019名無しさん@お腹いっぱい。
2006/01/28(土) 08:56:57$zsh
%wget --referer=http://www.descargas.sectahentai.org/ http://www.descargas.sectahentai.org/uploads3/matthewkidman/hmangas_archivos/Incest%20and%20Straight%20Shota/Namadashi%20Cho%20Inbo/namadashi_{001..180}.jpg
0020名無しさん@お腹いっぱい。
2006/02/15(水) 01:25:59ブラウザで表示される文はきちんと取得できるのですが、
ページの一番下にある"次のページ"から先やカテゴリーといったリンクが取得できません。
エロ画像ではないと思いつつもダウンロードに関する適切なスレが分からないので
ここで質問してみました。教えて頂けると助かります
0021名無しさん@お腹いっぱい。
2006/02/15(水) 07:17:570022名無しさん@お腹いっぱい。
2006/02/15(水) 07:37:360023名無しさん@お腹いっぱい。
2006/03/19(日) 18:10:30$wget -r -np -l 20 http://hogehoge.jp/
0024名無しさん@お腹いっぱい。
2006/04/06(木) 23:48:33例えば ttp://zxz.jugem.jp/ のリンク先とか。
誰か支援お願いします。
0025名無しさん@お腹いっぱい。
2006/05/04(木) 19:03:09数字は可変
根こそぎ落とすにはどうすればいいでしょうか。
今は仕方ないので、シェルスクリプトでアドレスを片っ端から書いた
リストを作ってそれをwgetで読み込ませていますが、もっとスマートな方法が
無いものか。
0026名無しさん@お腹いっぱい。
2006/05/04(木) 20:37:08そうやって悩んでいろいろやっているうちに、
立派なUnix使いに成長していきますよ。
0027名無しさん@お腹いっぱい。
2006/05/04(木) 23:24:50神様はseqを与えられた。
0028名無しさん@お腹いっぱい。
2006/05/05(金) 16:37:430029名無しさん@お腹いっぱい。
2006/05/05(金) 17:21:54Firefox+FlashGotが(・∀・)イイ!!
0030名無しさん@お腹いっぱい。
2006/05/06(土) 17:41:31もうGW終わっちゃうよう。いつでも書けるけどまとまった時間で書きたかったのに
0031名無しさん@お腹いっぱい。
2006/05/06(土) 21:10:56意外と手強いパターン
ttp://x.warnet.ws/img/119/image/DDF2.htm
なかを見ると
ttp://img17.imagevenue.com/img.php?loc=loc24&image=28455_7519060.jpg
みたいな連番対策付きのファイル名になってて
実際のデータはさらにハッシュつきdirの中。
ttp://img17.imagevenue.com/aAfkjfp01fo1i-5116/loc24/28455_7519060.jpg
2段階再帰かければ届きそうだけど
0032名無しさん@お腹いっぱい。
2006/05/06(土) 23:23:27そんなの俺ならあきらめて俺も再帰だな
wgetに-lオプションつけて
0033名無しさん@お腹いっぱい。
2006/05/07(日) 01:15:17かける方法ってないもんか
0034名無しさん@お腹いっぱい。
2006/05/08(月) 19:00:10http://enum.ninpou.jp/
これ使えばいいじゃん(jpgのダウンで使用)
0035名無しさん@お腹いっぱい。
2006/05/08(月) 19:51:42宣伝乙
0036名無しさん@お腹いっぱい。
2006/05/09(火) 02:38:020037名無しさん@お腹いっぱい。
2006/05/13(土) 03:44:48http://theblind.liveadulthost.com/087/001.jpg
wget 出来ない(--referer は試した)
ナジェ?
0038名無しさん@お腹いっぱい。
2006/05/13(土) 09:35:49User-Agent
0039名無しさん@お腹いっぱい。
2006/05/18(木) 13:02:55そうみたいだね。
>>37
%wget -U='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0; .NET CLR 1.0.3705)' http://theblind.liveadulthost.com/087/{001..100}.jpg
004039
2006/05/18(木) 13:24:58100を120に訂正してね。
0041名無しさん@お腹いっぱい。
2006/05/19(金) 01:33:55001.jpgじゃなくて1.jpgにされてしまってだめだったぞ。
俺はこれ
seq -f http://theblind.liveadulthost.com/087/%03g.jpg 1 120|wget -U ' ' -i -
0042名無しさん@お腹いっぱい。
2006/05/19(金) 20:38:43俺は~/.wgetrcに以下を追加してる
user_agent=Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)
0043名無しさん@お腹いっぱい。
2006/05/27(土) 09:17:130044名無しさん@お腹いっぱい。
2006/05/27(土) 21:32:360045名無しさん@お腹いっぱい。
2006/06/12(月) 13:04:460046名無しさん@お腹いっぱい。
2006/06/15(木) 12:23:050047名無しさん@お腹いっぱい。
2006/06/30(金) 10:03:32ttp://www.imagefap.com/gallery.php?gid=188736
htmlパースして thumb => full 置換すればいいんだけど
順序が失われるんでカウンタ用意してリネーム...
そろそろ 手軽に の領域じゃねーな
0048名無しさん@お腹いっぱい。
2006/06/30(金) 20:05:05ttp://file300kb.run.buttobi.net/fl/src/Oil0393.txt
例えば>>47なら
$ ./exwgetr -a -o -d "/thumb/.*.jpg$" "http://www.imagefap.com/gallery.php?gid=188736 " | sed "s/thumb/full/" | wget -i -
0049名無しさん@お腹いっぱい。
2006/07/03(月) 12:22:33なかなか使えますね〜
ありがたく使わさせて頂きますです。(謝謝!
0050名無しさん@Vim%Chalice
2006/07/03(月) 23:02:34オイラも便利に使わしてもらってます。
今まで泥臭くやってたけど
一発でhtmlパースしてgrepまでこなしちゃうスクリプト素敵。
perl使いカコイイなぁ...素敵なスクリプトありが豚です。
0051名無しさん@お腹いっぱい。
2006/07/04(火) 00:22:47ttp://file300kb.run.buttobi.net/fl/src/Oil0405.txt
503とか通信エラーにめっぽう弱い(なんとリトライ機能がついてない!)のでご注意を……
0052名無しさん@お腹いっぱい。
2006/07/04(火) 03:26:512004/05/12見たいな感じで取り込まれてしまいます。
そうではなく、取り込んだ日付ex 2006/07/04に変更するwgetのオプションってありますか?
wget -N かと思ったのですが、どうも違うみたいです。
0053名無しさん@お腹いっぱい。
2006/07/04(火) 08:04:31005452
2006/07/05(水) 10:48:01touchで行けました。ありがとうございました。
touchでは、空のファイル(0バイト)に強制的になるのかと思ってました。
時刻だけ変更できるのですね。
0055名無しさん@お腹いっぱい。
2006/07/15(土) 11:40:15早速DVDーRに落とそうとしたのですが容量が大きいんです。
それで圧縮したまま落としたんですが今度は
コミックの画像をめくろうとしてもめくれなくなりました。
(すべて展開したときはめくれました)
そこでDVD-Rにコミックを上手に落とすやり方を教えてください。
0056名無しさん@お腹いっぱい。
2006/07/15(土) 11:51:46コミック程度の重さならどんな落しかたでも問題ないと思うよ。
0057名無しさん@お腹いっぱい。
2006/07/15(土) 17:22:21マジレスすると、ウインドウズ系の圧縮フォルダ機能は全て展開しないとページめくりは出来ない
結論
コミックくらい買え
0058名無しさん@お腹いっぱい。
2006/07/15(土) 18:09:210059名無しさん@お腹いっぱい。
2006/07/15(土) 20:03:05探せばあると思うよ
http://pc8.2ch.net/test/read.cgi/linux/1136386462/l50
0060名無しさん@お腹いっぱい。
2006/07/16(日) 00:17:490061名無しさん@お腹いっぱい。
2006/07/17(月) 14:11:33xv -vsmap が結局便利なんだよな
いいソフトあれば紹介よろしゅう
0062名無しさん@お腹いっぱい。
2006/07/17(月) 22:18:09再うpお願い出来ますでしょうか?
0063名無しさん@お腹いっぱい。
2006/07/17(月) 22:56:050064名無しさん@お腹いっぱい。
2006/07/17(月) 22:58:32個人的にはgimv使ってる。以前はxzgvが軽かったので使ってたのだけど、
ZIPファイルに入った同人誌をそのまま読めるので乗り換えた。
0065名無しさん@お腹いっぱい。
2006/07/17(月) 23:22:04サムネイル表示出来て、画像表示も見やすくて、スケーリングが高品質な所が気に入ってる。
0066名無しさん@お腹いっぱい。
2006/07/17(月) 23:29:31ミーヤ(Intel)のイメージライブラリとどっちが上?
0067名無しさん@お腹いっぱい。
2006/07/18(火) 00:00:37コミック類はnearestのほうがいいかなと思うけど、
いちいち切り替えるのがめんどうだからそのまんま。
で、どの方法と比較したいの?
0068名無しさん@お腹いっぱい。
2006/07/24(月) 06:17:28PCで見れるサイト見つけた!
無料で見れるものを凄く集まってる。
ハードディスクの容量足りない。(>_<)
http://piggy2doggy.googlepages.com/
0069名無しさん@お腹いっぱい。
2006/07/24(月) 11:21:12中身はHTMLで、画像へのリンクには乱数が入ってる。
つまりIEのContent-typeを無視するバグを利用しないと見れない。
とても嫌らしい。
0070名無しさん@お腹いっぱい。
2006/07/26(水) 04:48:40HTMLのソースからリンク抜きだしてwgetなりに渡すんじゃダメ?
0071名無しさん@お腹いっぱい。
2006/07/29(土) 15:12:17お気に入りでok
0072名無しさん@お腹いっぱい。
2006/07/29(土) 16:42:000073名無しさん@お腹いっぱい。
2006/07/29(土) 16:48:08>>34
宣伝乙
007471
2006/08/01(火) 15:19:52すまん
宣伝じゃないよw
0075名無しさん@お腹いっぱい。
2006/08/06(日) 14:23:150076名無しさん@お腹いっぱい。
2006/08/06(日) 22:55:240077名無しさん@お腹いっぱい。
2006/09/10(日) 13:07:120078名無しさん@お腹いっぱい。
2006/09/13(水) 16:44:200079名無しさん@お腹いっぱい。
2006/09/22(金) 12:27:18いい方法はない?
yahooとかlivedoor みたいなとこで。
0080名無しさん@お腹いっぱい。
2006/09/22(金) 12:35:56URIの実例プリーズ
0081名無しさん@お腹いっぱい。
2006/09/22(金) 13:02:34zip
0082名無しさん@お腹いっぱい。
2006/09/22(金) 18:59:58例えばこんなところで↓
http://geocities.yahoo.co.jp/
http://photos.yahoo.co.jp/
http://briefcase.yahoo.co.jp/
>>81
それを昔していましたがzip以外でしたいです。
0083名無しさん@お腹いっぱい。
2006/09/23(土) 08:49:55lha
0084名無しさん@お腹いっぱい。
2006/11/15(水) 13:15:50どうすればいいの?
0085名無しさん@お腹いっぱい。
2006/11/15(水) 23:46:360086名無しさん@お腹いっぱい。
2006/12/24(日) 18:16:39ステータスが200でtext/html返してきた時にリトライするようにしたかった。
0087名無しさん@お腹いっぱい。
2006/12/25(月) 01:56:180088名無しさん@お腹いっぱい。
2006/12/25(月) 02:02:000089名無しさん@お腹いっぱい。
2006/12/25(月) 02:21:000090名無しさん@お腹いっぱい。
2006/12/25(月) 02:38:410091!dama
2007/01/02(火) 04:02:340092名無しさん@お腹いっぱい。
2007/01/04(木) 01:35:380093名無しさん@お腹いっぱい。
2007/01/04(木) 01:43:480094名無しさん@お腹いっぱい。
2007/01/04(木) 02:40:27それとHTML::*やHTTP::*やLWP::*のお勉強
0095名無しさん@お腹いっぱい。
2007/01/20(土) 03:39:430096名無しさん@お腹いっぱい。
2007/04/02(月) 19:34:19imepita.jpなんかにうpされた画像を自動巡回して拾い集めたいなと思っています。
例えばこんなのとか http://imepita.jp/20070402/701450
このurlをブラウザーで開くと普通にみれるのですが。
curlやwgetでこのURLを開くと404になってしまい、
htmlが取得できず困っています。
うpされた画像のアドレスと表示用のURLに相関関係がないのでhtmlを調べないと画像が取得できません。
どなたか偉い方よろしくおねがいします
0097名無しさん@お腹いっぱい。
2007/04/02(月) 20:05:08お約束の User-Agent: とか Referer: あたりはどうよ。
0098名無しさん@お腹いっぱい。
2007/04/02(月) 20:39:36User-Agent:は試したのですが変わらず・・・。
ちょっとRefererもやってみます。
0099名無しさん@お腹いっぱい。
2007/04/02(月) 20:44:050100名無しさん@お腹いっぱい。
2007/04/02(月) 23:23:17Accept-Language: ja
とかは?
010196
2007/04/03(火) 08:31:48神!
ありがとうございました
0102名無しさん@お腹いっぱい。
2007/04/10(火) 23:16:28連番のH画像/動画を一気にダウンロードしたものを僕に下さい(>_<)(>_<)
0103名無しさん@お腹いっぱい。
2007/04/21(土) 16:02:05ブラウザでは保存可能でした。
wget --referer='http://imepita.jp/20070402/701450' -U='Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)' --header='Accept-Language: ja' 'http://imepita.jp/kp_img/trial/20070402/701450.jpg?FFunc=IConf&FFcom=%22off%22'
としています。
指摘よろしくおねがいします。
0104名無しさん@お腹いっぱい。
2007/05/01(火) 13:54:450105名無しさん@お腹いっぱい。
2007/05/01(火) 19:01:17とりあえずURLを書きなさいよ
0106名無しさん@お腹いっぱい。
2007/05/05(土) 09:35:29ttp://infostore.org/info/3078906?refer=2257986&rs=2
→ ttp://img44.imagevenue.com/aAfkjfp01fo1i-24835/loc286/27363_004pat060.jpg
0107名無しさん@お腹いっぱい。
2007/05/05(土) 10:51:18grep -o 'http://[^#]*' |
grep 'imagevenue.com/img.php' |
while read LINE; do
lynx -dump -image_links $LINE |
grep -o 'http://[^#]*' |
grep '/loc[0-9][0-9]*/'
done
0108名無しさん@お腹いっぱい。
2007/05/05(土) 11:08:02あとは sleep もいれたほうがいいかも
0109名無しさん@お腹いっぱい。
2007/05/05(土) 12:23:56$ cat hoge.sh
#!/bin/sh
curl -s "$1" |
grep imagevenue |
sed -n -e "s/href='\\([^']*\\)'/\\
HREF=\\1\\
/gp" |
sed -n -e "/HREF=/s/HREF=//p" |
while read URL
do
dir="`dirname \"$URL\"`"
file=`curl -s "$URL" | sed -n -e '/thepic/ {N; s/.*SRC="\([^"]*\)".*/\1/p;}'`
curl -s --referer "$URL" -O "$dir/$file"
done
$ ./hoge.sh 'http://infostore.org/info/3078906?refer=2257986&rs=2'
0110名無しさん@お腹いっぱい。
2007/05/05(土) 15:07:320111名無しさん@お腹いっぱい。
2007/05/05(土) 19:36:37>>105
0112名無しさん@お腹いっぱい。
2007/05/05(土) 23:32:55imagefapは
(1) ギャラリーページから全てのギャラリーページのURLを抽出
(2) 各ギャラリーページから画像ページのURLを抽出
(3) 画像ページから画像ファイルのURLを抽出
という手順になると思う。(3) のURLはJavaScriptでブラウザに生成させてるのでwgetとかでは無理っぽい。
0113名無しさん@お腹いっぱい。
2007/05/06(日) 09:10:45http://images.imagefap.com/images/thumb/11/141/1414518509.jpg
http://images.imagefap.com/images/full/11/141/1414518509.jpg
0114名無しさん@お腹いっぱい。
2007/05/06(日) 21:18:14for URL in `seq -f 'http://www.imagefap.com/gallery.php?gid=330938&page=%g' 0 8`; do
echo get: $URL >&2
get_links_from_url $URL | sed -n '/thumb/s/thumb/full/p'
done
0115名無しさん@お腹いっぱい。
2007/10/23(火) 21:46:500116名無しさん@お腹いっぱい。
2007/10/27(土) 02:27:200117名無しさん@お腹いっぱい。
2007/12/30(日) 00:22:46ttp://g.e-hentai.org/g/854/ed9b4c88ddfde2ab2ea93ee162b0ebf6315cef64/5-m-y/
0118名無しさん@お腹いっぱい。
2008/01/02(水) 21:10:52http://exgirlfriendmarket.com/perfect_tits_corina?
0119名無しさん@お腹いっぱい。
2008/01/02(水) 22:24:460120118
2008/01/03(木) 01:46:07さっそくの助言、ありがとうございます。
とりあえず curl をインストールして試してみました。拝見したところ、外部リンクになっているのを直接指定していますね。
これを Unix のコマンドの組み合わせで
・画像一覧ページから
・個別の画像、もしくは画像表示ページへのリンクを辿り
・自動で巡回して、一定サイズ以上の JPG はダウンロードする
ということはできませんでしょうか? 趣味と実益を兼ねて、こんな感じの Blog を巡回することが多いのです。
だめだったら Win のダウンローダーでも探しますが、やはり Unix で覚えたいので。
お手数ですが、よろしかったらお知恵を拝借させてください。m(_ _)m
0121名無しさん@お腹いっぱい。
2008/01/03(木) 09:38:02再帰ダウンロード時のフィルタ:
-A, --accept=LIST ダウンロードする拡張子をコンマ区切りで指定する
-R, --reject=LIST ダウンロードしない拡張子をコンマ区切りで指定する
-D, --domains=LIST ダウンロードするドメインをコンマ区切りで指定する
--exclude-domains=LIST ダウンロードしないドメインをコンマ区切りで指定する
--follow-ftp HTML 文書中の FTP リンクも取得対象にする
--follow-tags=LIST 取得対象にするタグ名をコンマ区切りで指定する
--ignore-tags=LIST 取得対象にしないタグ名をコンマ区切りで指定する
-H, --span-hosts 再帰中に別のホストもダウンロード対象にする
-L, --relative 相対リンクだけ取得対象にする
-I, --include-directories=LIST 取得対象にするディレクトリを指定する
-X, --exclude-directories=LIST 取得対象にしないディレクトリを指定する
-np, --no-parent 親ディレクトリを取得対象にしない
0122名無しさん@お腹いっぱい。
2008/02/27(水) 14:12:00今やそのスレが消えてしまったため、もう一度ここで質問させてください。
例えばここに置いてある松金洋子のデスクトップ用壁紙画像をターゲットとします。
http://www.sexydesktop.co.uk/youko.htm
ここには全部で4ページ分48種類の松金洋子の画像があります。
このサイトの画像はすべてデスクトップ用の壁紙を目的としているので、
一つの画像に関して数種類の解像度・縦横比の画像が用意されており、
アクセスしてきた人の使っているディスプレイ解像度を検出しては、
最適な解像度のものを優先的にプッシュするようになっています。
また、画像ファイルの命名ルールは非常に単純かつ形式的で、
たとえば例に挙げた松金洋子の画像の場合、
まず画像の名前を表す youko1 から youko48 までの48種類の画像が用意されています。
さらにそれぞれの解像度を表す 1280x800 や 800x600 の文字列が続き、最後に拡張子 .jpg が付いています。
注意する点は、例えば youko48 に対して youko01 だとか、1280x1024 に対して 0800x0600 といった、
命名上の「桁数合わせ」が一切行われていないという点です。
0123122-123
2008/02/27(水) 14:12:231). サイトがプッシュしてくるこちらのディスプレイ解像度に関係なく、
すべての画像に関して、より解像度の大きい物を、
番号の一番若いものから古いものまで全種類取って来たい。
2). その際、取って来た画像のファイル名を修正して、
youko48 に対しては youko01 、1280x1024 に対して 0800x0600 など、命名上の「桁数合わせ」をしたい。
3). さらに、ファイル名の中の画像名を表す文字列と、解像度を表す文字列とを _ で結ぶようにしたい。
具体的には、youko11600x1200.jpg と名付けられた youko1 という画像の 1600x1200 版のファイル名を、youko01_1600x1200.jpg としたい。同様に、youko481280x1024.jpg と名付けられた youko48 という画像の
1280x1024 版のファイル名を youko48_1280x1024.jpg としたい。
以上をまとめると、参考例の松金洋子の画像で言えば、
youko11600x1200.jpg から youko481280x1024.jpg までの画像を、
youko01_1600x1200.jpg から youko48_1280x1024.jpg として保存したい。
これを実現するスクリプトをどう書けばいいでしょうか?
なお、好みのタレントの画像が何種類用意されているか(松金洋子の場合は48種類)については、
ダウンロードを開始する前に手作業で調べることとします。
0124名無しさん@お腹いっぱい。
2008/02/27(水) 14:31:38コントンジョノイコ
スレタイを読んでからスクリプトスレに行け
0125名無しさん@お腹いっぱい。
2008/02/27(水) 14:43:56>これを実現するスクリプトをどう書けばいいでしょうか?
変な書きかたをせずに普通に書けばいいと思うよ
0126名無しさん@お腹いっぱい。
2008/02/27(水) 18:52:00むしろここをやりたいのかと思った… :-P
0127名無しさん@お腹いっぱい。
2008/03/01(土) 03:23:35まず自分で書くんだ
0128名無しさん@お腹いっぱい。
2008/03/03(月) 14:00:03これを-1.拡張子とすることはできないでしょうか?
通常は hoge.html, hoge.html.1, hoge.html.2 とファイルが出来て行くものを
hoge.html, hoge-1.html, hoge-2.html と名付けられて欲しいのです。
0129名無しさん@お腹いっぱい。
2008/03/03(月) 14:45:41for i in *.1 *.2
do
j=${i:r}
mv -i ${i} ${j:r}-${i:e}.${j:e}
done
0130名無しさん@お腹いっぱい。
2008/03/03(月) 19:01:42なるほど、-iをつけて重複したものに上書きするのを防ぐというわけですか。
自動でユニークなファイル名をつけるにはもうちょっとシェルスクリプト書けば良さそうですね。
wgetでダウンロードする時点ではでないんでしょうか。
for i in *.1 *.2
は *.整数 なもの全てに対応するには *.[0-9]* でいいのだろうか。
でもこれだと .3g2 もひっかかるか。
0131名無しさん@お腹いっぱい。
2008/03/03(月) 19:04:220132名無しさん@お腹いっぱい。
2008/03/22(土) 13:38:18@tmp=("Alina-G", "Anastasia-S", "Anna-T", "Anna-Z", "Iryna-M", "Kateryna-V", "Larisa-H", "Oksana", "Olga-S",
"Olha-D", "Sasha-D", "Sasha-L", "Svetlana-T", "Ulyana-A", "Ulyana-M", "Valeriya-L", "Victoria-D", "Victoria-S", "Yuliya-S", "Yuliya-Z");
$baseurl = "http://www.candydoll.tv/images/";
foreach $f(@tmp){
for ($i=1 ;$i < 7;$i++){
$imgname = sprintf"%s-images%02d", $f, $i
$url = sprintf "%s/%s.jpg",$baseurl,$imgname; system "wget " . $url;
$cnvcmd = sprintf "jpegtopnm %s.jpg > %s.pnm",$imgname,$imgname; system $cnvcmd;
}
$a = "pnmcat -lr ". sprintf "%s-images01.pnm ",$f; $a .= sprintf "%s-images02.pnm ", $f; $a .= sprintf "> %s-images_a.pnm", $f;
system $a;
$a = "pnmcat -lr ". sprintf "%s-images03.pnm ",$f; $a .= sprintf "%s-images04.pnm ", $f; $a .= sprintf "> %s-images_b.pnm", $f;
system $a;
$a = "pnmcat -lr " . sprintf "%s-images05.pnm ",$f; $a .= sprintf "%s-images06.pnm ", $f; $a .= sprintf "> %s-images_c.pnm", $f;
system $a;
$a = "pnmcat -tb ". sprintf "%s-images_[abc].pnm |pnmtojpeg > %s-image.jpg",$f,$f; system $a;
}
system "rm *.pnm";
0133名無しさん@お腹いっぱい。
2008/03/23(日) 09:03:530134名無しさん@お腹いっぱい。
2008/03/23(日) 20:41:1112
34
56
といった形で分割されてあげられてるんだけど、
これをうまく結合する方法を思いつかなかったんで一旦pnmに変換したんですよ。
なにかいい方法はないもんでしょうか。
0135名無しさん@お腹いっぱい。
2008/03/23(日) 21:13:20convert -append / +append かな?
0136132
2008/03/24(月) 02:21:15>>135さんの助言のおかげで無駄な変換をしないように修正したものをあげておきます。
#!/usr/bin/perl
@tmp=("Alina-G", "Anastasia-S", "Anna-T", "Anna-Z", "Iryna-M", "Kateryna-V", "Larisa-H", "Oksana", "Olga-S",
"Olha-D", "Sasha-D", "Sasha-L", "Svetlana-T", "Ulyana-A", "Ulyana-M", "Valeriya-L", "Victoria-D", "Victoria-S", "Yuliya-S", "Yuliya-Z");
$baseurl = "http://www.candydoll.tv/images/";
foreach $f(@tmp){
for ($i=1 ;$i < 7;$i++){
$imgname = sprintf "%s-images%02d", $f, $i;
$url = sprintf "%s/%s.jpg", $baseurl, $imgname; system "wget " . $url;
}
$a = sprintf "convert +append %s-images01.jpg %s-images02.jpg %s-images_a.ppm", $f, $f, $f;
system $a;
$a = sprintf "convert +append %s-images03.jpg %s-images04.jpg %s-images_b.ppm", $f, $f, $f;
system $a;
$a = sprintf "convert +append %s-images05.jpg %s-images06.jpg %s-images_c.ppm", $f, $f, $f;
system $a;
$a = sprintf "convert -append %s-images_[abc].ppm %s-image.jpg", $f, $f;
system $a;
}
system "rm *.ppm";
0137名無しさん@お腹いっぱい。
2008/03/24(月) 06:00:070138単なるスクリプト練習道場
2008/03/24(月) 09:38:420139名無しさん@お腹いっぱい。
2008/04/20(日) 01:18:07僕の使ってるやつだとサムネイル画像しか落とせないんですが。
0140名無しさん@お腹いっぱい。
2008/04/20(日) 02:24:422chブラウザみたいなやつでもあるの?
流れにまかせて適当に見るのが筋なのかな。
0141名無しさん@お腹いっぱい。
2008/05/06(火) 23:35:44http://www3.nhk.or.jp/news/
最近リニューアルしてから、ダウンロード出来なくなりました。
ブラウザのキャッシュにも残りません。swfを間にかましてるみたいです。
宜しくお願いします。
0142名無しさん@お腹いっぱい。
2008/05/07(水) 17:28:51まず見てるページのソースコードを見ると
wmvHigh = "http://cgi2.nhk.or.jp/news/cgibin/K10099999999_9999999999_0805071653_01t_mh.cgi
てなことが書いてある。次に
view-source:http://cgi2.nhk.or.jp/news/cgibin/K10099999999_9999999999_0805071653_01t_mh.cgi
でさらに見ると
<REF HREF="mms://a669.v90561.c9056.g.vm.akamaistream.net/5/669/9056/48216095/1a1a1ad74ec5f82d5bc9319cca39abd943b3e250b52c9f/K10044234611_0805071619_0805071653_mh.wmv"/>
とか書いてある。こいつを録画すればおk
0143名無しさん@お腹いっぱい。
2008/05/10(土) 21:01:38うまくいきました。丁寧に教えてもらって感謝です。
0144名無しさん@お腹いっぱい。
2008/05/31(土) 18:03:17http://jp.youtube.com/watch?v=looALHmz6aA&feature=related
http://jp.youtube.com/watch?v=XlJkpEsaYMY&NR=1
http://jp.youtube.com/watch?v=aJ47PkaeM_M&feature=related
http://jp.youtube.com/watch?v=vsbv9Y-oPxg&feature=related
http://jp.youtube.com/watch?v=srYyLjVihYQ&feature=related
http://jp.youtube.com/watch?v=GyY_GFtj5Tg&feature=related
http://jp.youtube.com/watch?v=9uF85UO9-lg&feature=related
http://jp.youtube.com/watch?v=svH44ZUVE4A&feature=related
http://jp.youtube.com/watch?v=k9OJL0c-CBg&feature=related
http://jp.youtube.com/watch?v=I7nMFPYuF7o&feature=related
http://jp.youtube.com/watch?v=Kci1bOlAOCY&NR=1
http://jp.youtube.com/watch?v=yXPS8v7VqVg&feature=related
http://jp.youtube.com/watch?v=jpgH4CrHXF8&NR=1
鉄道をこよなく愛する人たち
0145名無しさん@お腹いっぱい。
2008/05/31(土) 20:16:440146名無しさん@お腹いっぱい。
2008/07/05(土) 00:14:430147名無しさん@お腹いっぱい。
2008/07/05(土) 05:41:530148名無しさん@お腹いっぱい。
2008/07/05(土) 23:27:080149名無しさん@お腹いっぱい。
2008/07/06(日) 00:20:470150名無しさん@お腹いっぱい。
2008/09/21(日) 11:29:130151名無しさん@お腹いっぱい。
2008/09/27(土) 21:48:190152名無しさん@お腹いっぱい。
2008/11/13(木) 19:08:260153名無しさん@お腹いっぱい。
2009/01/06(火) 01:43:12なんかいいツールはない?
0154名無しさん@お腹いっぱい。
2009/01/10(土) 17:41:500155名無しさん@お腹いっぱい。
2009/01/23(金) 02:38:56http://www.nicovideo.jp/watch/sm5750285
0156名無しさん@お腹いっぱい。
2009/03/26(木) 19:55:23コラア!いてまうど!
0157名無しさん@お腹いっぱい。
2009/04/17(金) 11:58:35(knoppix 5.1.3)
original file name : getimgs.pl.txt
約5354.4日間保存
ttp://www1.axfc.net/uploader/File/so/21579.txt&key=vip
pass : vip
0158名無しさん@お腹いっぱい。
2009/06/04(木) 14:58:19222行目と223行目逆じゃない?
0159名無しさん@お腹いっぱい。
2009/06/05(金) 01:47:51うん、逆だな。
その他にも、幾つかバグがあるようだ。
でも、転送制限があるサイトなので、あんまり使う気しない。
※だいたい160枚前後で、転送休止ってどうなのよ?
0160名無しさん@お腹いっぱい。
2009/07/21(火) 01:34:07これを一気にダウンロードすると、相当な負荷をかけると思うので数秒おきにダウンロードするようにしたいのだけど、そんなことできる?
0161160
2009/07/21(火) 01:35:290162名無しさん@お腹いっぱい。
2009/07/21(火) 01:59:57よくわからんが
>数秒おきにダウンロードするようにしたい
っていうのが要件であるのならsleepでもかませればいいんでないの。
固定時間で、ダウンローダ使っているのを推測されるのが嫌なら
(そういうサイトがあるかはしらないけど)
sleepの引数を範囲絞って乱数にすりゃいいし。難しくはないだろ
0163157
2009/08/18(火) 23:34:32get.pl
readme.txt
をzipにて同梱。
http://www1.axfc.net/uploader/Sc/so/28498.zip&key=vip
0164名無しさん@お腹いっぱい。
2009/08/20(木) 00:41:03解凍してみたが、readme.txt ehg.txt
しか見当たらない。
get.plはいづこに?
0165名無しさん@お腹いっぱい。
2009/08/20(木) 10:00:110166157
2009/08/20(木) 15:44:14g.e-hentai.org スクリプト
get.pl
readme.txt
require_url.png
をzipにて同梱。
ttp://www1.axfc.net/uploader/Sc/so/28995.zip&key=vip
0167名無しさん@お腹いっぱい。
2009/08/20(木) 22:14:50おお、サンキュー
早速、ゲット開始。
なんか色々新しくなってるね。きちんとエラー処理してあって
便利になってる。
スクリプトいぢって遊んでみるわ。ありがとう。
0168187
2009/08/20(木) 22:41:18のmaskを、0777に変更しないとうまく動作しなかった。
デレクトリィは、できるけど書込み出来ない。
perl, v5.8.6 built for darwinでの動作報告
0169167
2009/08/20(木) 22:42:180171157
2009/08/25(火) 22:42:42fap.pl
readme.txt
require_url.png
を同梱。
使い方は、>>166のスクリプトと全く同じです。
ttp://www1.axfc.net/uploader/Sc/so/30657.zip
0172名無しさん@お腹いっぱい。
2009/08/29(土) 20:29:53動いたずら。
fap.plの改行コードがCR+LFだった。
0173名無しさん@お腹いっぱい。
2009/09/12(土) 12:14:31ありがてぇありがてぇ
0174名無しさん@お腹いっぱい。
2009/10/04(日) 23:34:230175名無しさん@お腹いっぱい。
2009/10/09(金) 19:12:20readme.txt 嫁
0176名無しさん@お腹いっぱい。
2009/10/09(金) 20:50:01ありがたいです
しかし、100枚超えると普通にはじかれますね・・・
串どうやって刺そうかな
0177名無しさん@お腹いっぱい。
2009/10/09(金) 22:49:02無料のおかず画像サイト集めてみました
http://s12.smhp%2ejp/abc1103
0178157
2009/10/10(土) 17:32:40待つ時間を長くすればするほど
単位時間のダウンロードの大きさが減るので、
730行目あたりの関数 waitp を
sub waitp {
# wait process and random sleep.
# process sleeps while ??? seconds, not "msec".
#
# if you want to use "msec" unit, use "select".
# same effect of 'sleep' while 250 msec is,
# "select(undef, undef, undef, 0.25) ;".
# but, can't use progress bar.
my $base = 10000 ; # random sleep from 1 sec to $base/1000 sec.
my $t = int ( rand ($base) / 1000 ) ;
progbar (++$t) ;
return 1 ;
}
などと書き換えてみてください。
帯域制限がかかりにくくなります。
0179名無しさん@お腹いっぱい。
2009/10/12(月) 10:05:00やるじゃん
0180名無しさん@お腹いっぱい。
2009/10/13(火) 02:45:36thx!
ここへは検索でたどり着いた他所者で申し訳ないが助かるわ
昔入社直後にならったプロンプト程度の知識でもいけるもんだな・・・使う分には
0181名無しさん@お腹いっぱい。
2009/10/13(火) 05:57:36付属のReadmeを読んでみて自分なりに試してみたのですがうまくいかず
本体を起動すると黒い窓と文字が一瞬表示されるのですが
すぐに消えてしまうためなんとかプリントスクリーンで撮影して
そこに書いてあったリストの作成などもしてみたのですけどダメでしたorz
プログラムなどの知識皆無なのでそもそも場違いとも思うのですが、
どなたか教えていただけないでしょうか?
0182名無しさん@お腹いっぱい。
2009/10/13(火) 06:47:37g.e-hentai.orgからアクセス制限がかかってる現在の状況下で
さらに自分で調べもしない人間達にでも使えるように説明しろと?
正気ですか?
お前の目の前にある箱はなんだよ?飾りか?
>自分なりに試してみたのですが
もっとやれ
もっともっとやれ
救いな事に>>157氏のファイルはインチキじゃない
自分で勉強すれば必ず結果が伴う
0183名無しさん@お腹いっぱい。
2009/10/14(水) 12:55:49>>181 Linux勉強してLinuxで実行するといいよ
0184名無しさん@お腹いっぱい。
2009/10/20(火) 09:36:45皆さんはどれくらいの期間、制限かかってます?
初めのころは1・2時間程度だったのになあ。
0185名無しさん@お腹いっぱい。
2009/10/21(水) 21:16:440186名無しさん@お腹いっぱい。
2009/10/23(金) 04:59:37串の設定項目が無いのでDL専用の仮想マシンを作ってシステム全体に串を噛まそうと思う
yumとかで実践されてるこの方法が一番かな
http://blog.livedoor.jp/glantank/archives/50952655.html
0187名無しさん@お腹いっぱい。
2009/10/23(金) 05:29:17これだけ神経質だとISPごとアク禁とか何のためらいもなくやりそうで怖いなw
0188名無しさん@お腹いっぱい。
2009/11/16(月) 09:44:270189名無しさん@お腹いっぱい。
2009/11/17(火) 02:10:06ぱす chinko
E-Hentaiからダウンするなら最近これ使ってるけどな。
転送制限もなぜかかかりにくい。600枚位連続で落としたが、まだいけそうだ。
どやって回避してんのかな。
Win用だからスレチかもしれんが。
0190名無しさん@お腹いっぱい。
2009/11/17(火) 21:28:52いつ解除されんのかな
0191名無しさん@お腹いっぱい。
2009/11/17(火) 22:46:25ちょっと、試してみた。
結局おれんトコでは、150枚くらいで転送制限になった。
転送制限中ですよ画像も、ダウンロードしちゃうよ。w
>>190
もう、そろそろじゃない?
五日くらい制限喰らった時も有ったような。
0192名無しさん@お腹いっぱい。
2009/11/18(水) 01:16:26you have temporarily reached the limit for how many images you can browse
-if you haven't already, you can double
your daily quota simply by signing up for
an absolutely free forums account at,
http://forums.e-hetai.org/
- you can run the hentai@home distributed image server to help us serve more images.
this will give you points which can be used to increase your page view limit,
and cache files locally so they are ready when you wish to view them.
(check the news dorum for moredetails and signup information)
please understand that e-hentai galleries is a free service, and to keep it free we
must limit the amount of images anyone person can view.
if you come back in a few hours, you will be able to download more.
暇だから写した
157氏のスクリプト試したら4枚で…
閲覧や手作業での保存も出来ず悶悶
解除されたらチンコの試そう
>>191
そんなにかかるのか
確認に行って509返されて期間延長とかないよな
0193名無しさん@お腹いっぱい。
2009/11/18(水) 01:56:14再うpキボンヌ
0194名無しさん@お腹いっぱい。
2009/11/19(木) 02:05:560195名無しさん@お腹いっぱい。
2009/11/30(月) 23:57:45はどんなツールだったの?
0196名無しさん@お腹いっぱい。
2009/12/01(火) 21:27:46画像ダウンロードアプリですよ。
ダウンする時に、サムネイルプレビューが見えるのが親切設計。
転送制限回避は、どうも環境によるとしか胃炎。つーか、分からん
0197名無しさん@お腹いっぱい。
2009/12/02(水) 01:30:520198名無しさん@お腹いっぱい。
2009/12/03(木) 14:41:23誰か作ってませんか?
0199名無しさん@お腹いっぱい。
2009/12/03(木) 16:08:22今日また使おうとしたら、
Invalid argument at get.pl line 438.
って吐き出して止まってしまう・・
0200名無しさん@お腹いっぱい。
2009/12/04(金) 03:35:56作成したときはwwwがなかったのかな
それと、それでも
the list file name is http://www.imagefap.com/gallery/*******.list.
the directory name will be http://www.imagefap.com/gallery/*******.
http://www.imagefap.com/gallery/******** does not exist.
Invalid argument at C:\Documents and Settings\-----\fap.pl line 239.
make a directory:
ってエラー出て止まるんだけどどうすればいいべさ
0201名無しさん@お腹いっぱい。
2009/12/06(日) 07:39:360202157
2009/12/06(日) 20:01:16239行目でもwww無しでURLチェックしてるので
そこにもwwwを加えてください
作成した時は多分wwwが無かったのだと思います
>>201
原因不明です
URLお願いします
0203名無しさん@お腹いっぱい。
2009/12/06(日) 21:34:25数日前は大丈夫だったはずなのに・・・
http://g.e-hentai.org/g/181326/7405b90607/
0204200
2009/12/06(日) 22:50:08秀丸使ってるんだけど239行目はmakedir中のprint〜でURLチェックとは無関係だす
とりあえず数箇所URLでimagefap.comがあるところの前(cache.imagefap/com除く)
にwww.をつけたらエラーなしで動いたけど今度は指定URLとは関係ないギャラリーの画像を取得した
保存されたフォルダは指定URLと同じ番号なのに中身が別物、別のギャラリーとか思って調べてみたけど
同じファイル数のギャラリーが存在してなかった、なんぞこれ
0205名無しさん@お腹いっぱい。
2009/12/06(日) 23:36:02見れるのと見れない画像の差を理解した。
ヒントはおまいらの好きなタグだw
そのタグに入ってたのは一切見れなくなってて
やっぱりなーと思った。
0206名無しさん@お腹いっぱい。
2009/12/07(月) 02:17:49困ってしまうなぁ
0207名無しさん@お腹いっぱい。
2009/12/07(月) 19:24:250208名無しさん@お腹いっぱい。
2009/12/07(月) 20:16:390209名無しさん@お腹いっぱい。
2009/12/08(火) 01:04:08もらえるポイントは他人の閲覧数とDL数で決まるからサムネイルで食いつきそうなの上げればいい
長くお世話になる気ならいつ使えなくなるか分からん上に更新も期待出来ないツールより、
いくつか定期的に提供して数クリックで快適にDL出来る方が俺にとっては便利だからそうしてる
0210名無しさん@お腹いっぱい。
2009/12/08(火) 15:30:160211名無しさん@お腹いっぱい。
2009/12/08(火) 23:29:140212名無しさん@お腹いっぱい。
2009/12/10(木) 17:56:06なぜ分からないのか・・・愚か過ぎる
0213名無しさん@お腹いっぱい。
2009/12/10(木) 21:30:24向こうはいつでも閉鎖できるんだし
0214名無しさん@お腹いっぱい。
2009/12/10(木) 21:41:52例えば100枚落として弾かれたら、次は101枚目からDL開始するとかは出来ないんでしょうか。
0215名無しさん@お腹いっぱい。
2009/12/11(金) 05:49:50だったらスクリプトが一枚画像にアクセスしたらインターバルを置いて(手作業で開いて保存するくらいの時間?)、
次のファイルにアクセスするようにすれば良いんじゃないでしょうか?
時間はかかるかもしれませんが、一枚一枚手作業で保存する手間を考えれば妥協できると思うんですが…
0216名無しさん@お腹いっぱい。
2009/12/11(金) 06:53:55>>178で既出の話題だな
とはいえそのインターバルがどれほどなのかは興味があるな
0217名無しさん@お腹いっぱい。
2009/12/12(土) 01:18:04インターバルとかダウンロード容量以外の影響も受けてると思う
そうなると全く分からん
そもそも各IPで制限してるのかすら分からないんだよ
串かましてダウソできてもダウソ可能数がまた違う
0218名無しさん@お腹いっぱい。
2009/12/12(土) 18:14:10既に公開されている素晴らしいツールらを組み合わせて何とかなった
ヒマがあったら作ってみたりゃ良い
0219名無しさん@お腹いっぱい。
2009/12/13(日) 12:33:460220名無しさん@お腹いっぱい。
2009/12/14(月) 21:54:13画像は一気に落とせたんだがなあ。
0221名無しさん@お腹いっぱい。
2009/12/16(水) 00:36:080222名無しさん@お腹いっぱい。
2009/12/16(水) 02:05:030223名無しさん@お腹いっぱい。
2009/12/16(水) 20:31:50サムネでロリっぽい画像使ってるやつも入れなくなってるみたいだし
0224名無しさん@お腹いっぱい。
2009/12/19(土) 02:10:141枚1枚ダウソしてたが 150枚くらいで。どうにかならないか…泣
0225名無しさん@お腹いっぱい。
2009/12/29(火) 02:15:45最初の数日はどんどんポイントが溜まっていった。
しかしこの頃は一日に100P入るかどうか、
日がたつにつれてgalleryごとにもらえる
ポイントのレートが下がってるのかな
0226名無しさん@お腹いっぱい。
2009/12/31(木) 14:31:420227名無しさん@お腹いっぱい。
2009/12/31(木) 14:43:510228名無しさん@お腹いっぱい。
2009/12/31(木) 17:11:06batch 処理で落とすためのスクリプトってないのかな?
最初の URL を wget でもってきて html を覗いて
<form action="http://... " method="post"> がそれっぽいんだけど
それを直接 wget しても×なんだよね…
0229名無しさん@お腹いっぱい。
2009/12/31(木) 19:35:56IP代わんないと連続では無理
0230名無しさん@お腹いっぱい。
2009/12/31(木) 23:29:480231名無しさん@お腹いっぱい。
2010/01/07(木) 11:31:140232名無しさん@お腹いっぱい。
2010/01/08(金) 04:03:400233名無しさん@お腹いっぱい。
2010/01/08(金) 16:28:13再うpお願いします。
0234名無しさん@お腹いっぱい。
2010/01/11(月) 04:18:01これが規制なのかな
0235名無しさん@お腹いっぱい。
2010/01/13(水) 23:24:43サムネまでは見れるが、そこから画像にアクセスしている気配すらない。
原因はなんなんでしょ。
0236名無しさん@お腹いっぱい。
2010/01/14(木) 15:03:580237名無しさん@お腹いっぱい。
2010/01/14(木) 15:30:19必要ないもの集めても仕方ないし、特定のものだけでも手間かかりすぎる
0238名無しさん@お腹いっぱい。
2010/01/14(木) 18:36:031. 最初のページ内の action="http://hogehoge" から "http://hogehoge" を抽出
2. 次のターゲット
% wget --post-data="dl.start=Free" http://hogehoge
3. 100秒とか待つ(カウントダウンタイマー分)
4. (2. から最終ターゲットを抽出して)wget
1.〜4. を 30分間隔(容量次第?)とかでぐるぐる
0239名無しさん@お腹いっぱい。
2010/01/14(木) 18:41:460240名無しさん@お腹いっぱい。
2010/01/16(土) 15:10:54リファラ,user-agentとクッキーを設定してやったら
スレッドは1つだけど退避時間もなしで、
509でなくなったよ。
0241名無しさん@お腹いっぱい。
2010/01/16(土) 16:19:360242名無しさん@お腹いっぱい。
2010/01/16(土) 21:45:19↑
これの作り方わかんないだけど、どうやんの?
0243名無しさん@お腹いっぱい。
2010/01/16(土) 22:25:27うpされてから半年間はそんな質問はなかったな
他と比較して自分の理解力を身をもって知るべきだ
短く言えば "アホは来るな"
0244名無しさん@お腹いっぱい。
2010/01/18(月) 09:27:43Your IP address is not allowed to access that
Your IP address has been temporarily banned for using automated mirroring/harvesting software and/or failing to heed the overload warning. The ban expires in 56 minutes 23 seconds
だって…
WIN向けだからここで聞くのも間違っている気もするんだけど、何か対策されたのかな?
0245名無しさん@お腹いっぱい。
2010/01/18(月) 14:42:55てか再うpきぼんぬ
0246名無しさん@お腹いっぱい。
2010/01/18(月) 17:25:43俺も弾かれるようになった
おそらく対策されたんだろう
いままで対策されなかったのが不思議だったし
0247名無しさん@お腹いっぱい。
2010/01/18(月) 19:17:53もともと発祥のちんこロダもなくなっちゃったし、ばーうpの方法もないし、対応難しいかなぁ
0248名無しさん@お腹いっぱい。
2010/01/19(火) 19:01:43なんとも図々しい。
頼み方も知らないのか。
0249名無しさん@お腹いっぱい。
2010/01/21(木) 03:38:16あれだけのデータをただで見れるとか怖くなっちゃうんだけど
0250名無しさん@お腹いっぱい。
2010/01/21(木) 11:43:11E-Hentaiって、有料なんですか?
freeとあるから無料なのですか?
0251名無しさん@お腹いっぱい。
2010/01/26(火) 22:07:41再うpおねがします
本当頼みます
0252名無しさん@お腹いっぱい。
2010/01/27(水) 14:39:42244 :名無しさん@お腹いっぱい。:2010/01/18(月) 09:27:43
>>189のツール使ってるんだけど、急に弾かれるようになっちゃった…
Your IP address is not allowed to access that
Your IP address has been temporarily banned for using automated mirroring/harvesting software and/or failing to heed the overload warning. The ban expires in 56 minutes 23 seconds
だって…
WIN向けだからここで聞くのも間違っている気もするんだけど、何か対策されたのかな?
246 :名無しさん@お腹いっぱい。:2010/01/18(月) 17:25:43
>>244
俺も弾かれるようになった
おそらく対策されたんだろう
いままで対策されなかったのが不思議だったし
前レス読んだ?急に真剣になってバカじゃないの??
0253名無しさん@お腹いっぱい。
2010/01/27(水) 22:39:270254名無しさん@お腹いっぱい。
2010/02/02(火) 00:50:57http://jappygal.blogspot.com/2010/01/dgcyuki-mogami-no811-201002.html
0255名無しさん@お腹いっぱい。
2010/02/02(火) 13:00:37URL=http://jappygal.blogspot.com/2010/01/dgcyuki-mogami-no811-201002.html
wget -O- "$URL" | grep -o "http://[^\"']*.jpg" | sed -ne "/s1600-h/s/s1600-h/s1600/p" >LIST
wget -i LIST
0256名無しさん@お腹いっぱい。
2010/02/02(火) 14:02:53おかないといけないんじゃないかな…
ページソースや直URL確認
wget --referer オプションやら -r -l などなど
zsh の連番技法 {001..052}.jpg とか
>255
html 解析から a href= 抽出するのは grep -o が使えたのか
0257名無しさん@お腹いっぱい。
2010/02/02(火) 14:14:57方法の改良論とかもありそうだし
0258名無しさん@お腹いっぱい。
2010/02/02(火) 14:26:460259名無しさん@お腹いっぱい。
2010/02/02(火) 17:20:47URLにはつながらず……
952 :950:2005/11/05(土) 18:30:02
>>950
テキトーにつくってみました。
http://seizen.dyndns.org:8080/matome/
ちなみにおいらはperl+sh派です。
0260名無しさん@お腹いっぱい。
2010/02/07(日) 06:27:04何だか知らないけどよろしくお願いします
とりあえずスレ見たらアク禁解けるまで待てと書いてあるので待ってみます
0261名無しさん@お腹いっぱい。
2010/02/07(日) 10:57:350262名無しさん@お腹いっぱい。
2010/02/08(月) 20:25:530263名無しさん@お腹いっぱい。
2010/02/12(金) 20:58:020264名無しさん@お腹いっぱい。
2010/02/13(土) 02:49:100265名無しさん@お腹いっぱい。
2010/02/14(日) 19:08:52千枚保存するのに20分掛かったが帯域制限には引っ掛からなかったよ。
これが >>262 の想いに届いたなら幸せだ。
http://www1.axfc.net/uploader/File/so/38900
スクリプト起動したら"URL>"のプロンプトにギャラリートップのURLを入力してくれ。
複数のURLをテキストファイルに書いてリダイレクトで食わせてもOK。
後は放っておくだけでギャラリーIDのサブディレクトリを掘って画像を保存するよ。
0266名無しさん@お腹いっぱい。
2010/02/14(日) 21:43:090267名無しさん@お腹いっぱい。
2010/02/15(月) 15:13:12phpスプリクトは対応してますか?
負荷掛けるのはいくない
0268名無しさん@お腹いっぱい。
2010/02/15(月) 16:22:00いいのだろうか
0269名無しさん@お腹いっぱい。
2010/02/15(月) 17:10:200270名無しさん@お腹いっぱい。
2010/02/15(月) 17:31:450271名無しさん@お腹いっぱい。
2010/02/15(月) 20:12:260272263
2010/02/15(月) 21:12:03wget なら --keep-session-cookies 併用して表示ページを経由する。
オリジナルをダウンロードする場合はログインスクリプト書いて
そのクッキー使う。DL数に厳しい上限あり。
ログインしておけば通常の画像も帯域が増えるよ。
0273名無しさん@お腹いっぱい。
2010/02/15(月) 21:39:22俺もサムネしか落ちないな
0274名無しさん@お腹いっぱい。
2010/02/15(月) 22:01:39あながち嘘ではない。ソースあるんだから、なんとかしたい人ならこれをベースになんとかする。
0275名無しさん@お腹いっぱい。
2010/02/15(月) 22:57:20一週間の掲載期間は長かったかしら。
まぁ洒落なんだからそんなに突っ込まないでくれ。
こんなところでそのまんま自前のソース広げて使われ
まくった挙句に変な対策でもされたら面倒だからね。
>>267 phpはgzip展開圧縮も普通に出来るよ。
0276名無しさん@お腹いっぱい。
2010/02/18(木) 13:16:01$ua->agent("Mozilla/5.0 (Windows; U; Windows NT 6.0; rv:1.9.2) Gecko/20100115 Firefox/3.6 (.NET CLR 3.5.30729)");
$ua->proxy('http', 'http://127.0.0.1:65536/');
0277名無しさん@お腹いっぱい。
2010/02/19(金) 02:08:37対策されたか?
0278名無しさん@お腹いっぱい。
2010/02/19(金) 15:36:480279名無しさん@お腹いっぱい。
2010/02/19(金) 16:21:20こっちも対策するぞ
0280名無しさん@お腹いっぱい。
2010/02/19(金) 17:21:23** make directory **
the list name is 0f9cd89d5b.list.
the directory name is 0f9cd89d5b.
0f9cd89d5b does exist.
doesn't make a directory.
** get 98 pics **
get pic's html file (1/98).
get html : success. (200 OK), [dummy.html]
get [0] ...:
HTTP::Response=HASH(0x2fd6994)->status_line, [0] : failed to download pic. try a
gain (5/5).
wait/sleep 3 sec : [***]
これを5回繰り返して止まる
0281名無しさん@お腹いっぱい。
2010/02/19(金) 18:19:24scrapeimgname() と scrapeimgurl() がファイル名と url を
抽出できなくなっただけ. これらの関数は getpics() から呼び出され,
抽出できなかった場合に return 0 するが, getpics() 側で特にエラー処理
してないので, エラーにならず get [0] ... とかなって走りつづけてる
(本当は 0 のとこに scrapeimgname() の戻り値であるファイル名が入る).
モジュールに依存しないように html の parse を自前でやってるが,
俺は面倒なので, HTML::TreeBuilder::XPath 使って書き直した.
あと HTTP::Response->status_line がメソッド呼び出しなのに
double quote で文字列展開しようとしてるので, status_line が
正しく表示できてないのもバグっぽい.
"@{[ $res->status_line ]}" とかしといた方がいい.
0282名無しさん@お腹いっぱい。
2010/02/19(金) 18:51:06QoSでperlへの帯域絞るしか無い?
0283名無しさん@お腹いっぱい。
2010/02/19(金) 22:35:10オリジナルは画像鯖のドメインでマッチングしてたんだけど、ドメインが変わったからマッチしなくなったんだね。
>>282
オリジナルだと4秒ぐらいで取りに行っちゃうから、間隔を10秒以上とるようにsleepを書き換えるとけっこう快適になるよ。
0284名無しさん@お腹いっぱい。
2010/02/19(金) 23:06:49サブルーチンを書き換えればいいのかな
0285名無しさん@お腹いっぱい。
2010/02/19(金) 23:17:33とか?
0286名無しさん@お腹いっぱい。
2010/02/19(金) 23:19:13そうそう。waitpとかいう名前だったはず。
0287名無しさん@お腹いっぱい。
2010/02/19(金) 23:21:06書出すファイル名は、altタグから引っぱればいいかな。
0288名無しさん@お腹いっぱい。
2010/02/19(金) 23:23:28便乗して悪いけど
img id.* ってのはscrape〜の
if ( m|src="http://r.e-hentai.org/.*?"| )
の部分のことでいいのかしら
0289名無しさん@お腹いっぱい。
2010/02/19(金) 23:25:00とか?
0290名無しさん@お腹いっぱい。
2010/02/19(金) 23:26:00base/1000の間違い
すまぬ
0291名無しさん@お腹いっぱい。
2010/02/20(土) 01:13:580292157
2010/02/20(土) 01:54:50waitpの時間延長を施した新ヴァージョンができました
http://www1.axfc.net/uploader/Sc/so/84683.zip&key=ehg
0293名無しさん@お腹いっぱい。
2010/02/20(土) 11:01:04ちゃんと動いてます。
0294名無しさん@お腹いっぱい。
2010/02/20(土) 17:10:24my $ua = LWP::UserAgent->new;
$ua->agent("User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0;rv:1.9.2)
");
$ua->timeout(180);
$ua->proxy('http', 'http://127.0.0.1:80/');
0296名無しさん@お腹いっぱい。
2010/02/21(日) 13:12:16むしろ '常識知らねーな' と言われそうな変更を試してる。
これで4ページ/分のペースで14冊330ページ99MBまで落としたが
一向に帯域制限がやって来ない。昨夜は引っ掛かりまくりだったし
今まで3日の間を空けたってこんなこと無かったんだがな。
サーバのプログラムが変わったばかりらしいがバグを突けたのか?
それとも今日は感謝デーなのか?
0297名無しさん@お腹いっぱい。
2010/02/21(日) 13:21:48変更前と後のスクリプトで試してみて
両方とも帯域制限が来ないなら
今日は感謝デー
後の変更済みスクリプトだけに帯域制限がこないなら
その変更は大当たり
0298名無しさん@お腹いっぱい。
2010/02/21(日) 13:35:43おぉ、そりゃそうだ。舞い上がって変化点検証の基本を忘れてた。やってみる。
0299名無しさん@お腹いっぱい。
2010/02/21(日) 14:56:32変更前のコードでも222ページ75MBまでスルスル落とせた後に 509 がやってきた。
その直後に変更後のコードを掛けてみたがやっぱり 509 だった。
多分週末メンテナンスで俺のカウンタがリセットしたとかなんだろうな。
クッキーなくなってるね。リダイレクトもなし。img id=xxx は相変わらず付いてるけど
肝心の id の値はHTML本文中に見つからない。
0300名無しさん@お腹いっぱい。
2010/02/21(日) 16:34:570301名無しさん@お腹いっぱい。
2010/02/21(日) 20:17:10オレもそういうページあるけど多分複数ページじゃなくて単独ページの場所だと
動かないっぽい。
ベースページを解析するルーチンで1ページしかないページだと構文解析できずに
終わってるっぽいな。
直すのめんどいんで手作業でやってるけどね。
ついでだけど500枚くらいのやつだとエラー途中までしかDLしないのは仕様?
0302名無しさん@お腹いっぱい。
2010/02/22(月) 07:58:48各画像ページのURL取得までは行っているんだが、<a class="noul" href=~~~>のタグを取り込まない
難しいぜ
0303名無しさん@お腹いっぱい。
2010/02/22(月) 22:40:38スクリプトの、サブルーチンgeturllistの以下を変更してみました。
変更前 if ( $a[$i] =~ /$url/ and $a[$i] =~ /[0-9]$/ )
変更後 if ( $a[$i] =~ /$url/ and $a[$i] =~ /¥/[0-9]+$/ )
単ページで、エラー400が出なくなりました。
ゴミを拾っていたようです。
0305名無しさん@お腹いっぱい。
2010/02/24(水) 01:32:34157さん、いつもありがとう。
ダウン終了時や転送制限時に、saykanaコマンドつかって、ゆっくりに喋って
お知らせしてもらう様に改造して、使ってます。
だいたい、70から160枚くらいで制限を、喰らいます。
ゆっくり待ちます制限解除をw
0306名無しさん@お腹いっぱい。
2010/02/25(木) 16:42:41どうしたらよいのだろうか
0307名無しさん@お腹いっぱい。
2010/02/25(木) 18:14:01もう一度おなじコマンドで。
get.pl -l 513894289.list
で制限くらったら、もう一回
get.pl -l 513894289.list
とかする。
get.pl -u [URL]
でやってる人はlistができてるんで
できたlistで
get.pl -l [list file]
とやる。
0308名無しさん@お腹いっぱい。
2010/02/25(木) 20:30:53http://g.e-hentai.org/g/******/**********/1-m-y/2 から
http://g.e-hentai.org/g/******/**********/1-m-y/5 までの計4ページの画像を取得とか
0309名無しさん@お腹いっぱい。
2010/02/25(木) 20:41:40.listファイルを、テキストエディタで開いて、不必要な行を削除すればいいんじゃね?
或いはスクリプトで、分割したい箇所だけのファイル作る。
0310名無しさん@お腹いっぱい。
2010/02/25(木) 22:16:42$ less hoge.list | perl -le '@a=<>;print splice(@a,1*16-1,4*16)' > hoge2-5.list
0311名無しさん@お腹いっぱい。
2010/02/26(金) 01:23:55Invalid argument at get.pl line 454
とエラーをはくのですが、対処法はありますか?
0312名無しさん@お腹いっぱい。
2010/02/26(金) 02:29:44$ get.pl -l hoge.list
0313名無しさん@お腹いっぱい。
2010/02/26(金) 21:29:27そのように宣言しているつもりなのですがうまくいきません…
0314名無しさん@お腹いっぱい。
2010/02/26(金) 21:44:03OSやperlのバージョンに因るのかな?
MacOS X 10.4.11(PPC) perl, v5.8.6
0315308
2010/02/26(金) 22:27:47ありがとうございます
ついさっき気付いたけど、1ページのみのlistファイルを取得することも可能なんですね
数ページだけの画像をDLしたい場合には、無駄なページを取得する手間が省けますね
0316名無しさん@お腹いっぱい。
2010/02/26(金) 23:18:55XP HomeEdition SP2 perl v5.10.1
で動きません…
0317名無しさん@お腹いっぱい。
2010/02/26(金) 23:42:34>304の最新バージョンで試してみた?
それでダメなら、エラーを起こす行の前に、print で変数の確認やってみて。
0318名無しさん@お腹いっぱい。
2010/02/26(金) 23:59:07やはり動きません…
0319名無しさん@お腹いっぱい。
2010/02/27(土) 00:08:240320名無しさん@お腹いっぱい。
2010/02/27(土) 00:17:02ところでE−HENの制限って80MBくらいなんでしょうか
ルータ再起動して使う分には問題ありませんが大体そのあたりでとまります
0321名無しさん@お腹いっぱい。
2010/02/27(土) 00:45:36これ以上はご迷惑なので失礼します…
0322名無しさん@お腹いっぱい。
2010/03/02(火) 21:16:24ところで、これ管理者権限で実行する必要ないですよね?
管理者権限で実行すると画像の保存先がわからない・・・
0323名無しさん@お腹いっぱい。
2010/03/02(火) 21:50:54CRC A621
CRC32 62B3FF7E
MD5 5F92B5C9A6A45640ED45EF63A545BC29
SHA1 E036679C61FEE1689E75BC780FE1F4D644A127DD
同じ症状の人いないかな
昨日までは普通に落ちてきてたんだけど
うちだけ?
0324名無しさん@お腹いっぱい。
2010/03/02(火) 21:58:17いつまでもイメージタグの "id=" に頼っていては駄目。
このサイト全般に言えることだが "[0-9a-z]{40}-" の様なハッシュ値状の
モノを持つURLをターゲットにした方がよろしいかと。
0325名無しさん@お腹いっぱい。
2010/03/02(火) 23:27:01いろいろと対策強化されてるなぁ
0326名無しさん@お腹いっぱい。
2010/03/02(火) 23:36:070327名無しさん@お腹いっぱい。
2010/03/02(火) 23:51:42@style != "" and @id
かな
0328名無しさん@お腹いっぱい。
2010/03/02(火) 23:53:300329名無しさん@お腹いっぱい。
2010/03/03(水) 00:08:26スクリプトも気を利かせてたまに広告踏んでやる位の優しさは必要だ。
0330名無しさん@お腹いっぱい。
2010/03/03(水) 02:17:26そしたらきちんと待つから
0331名無しさん@お腹いっぱい。
2010/03/03(水) 02:44:1324分待てとか、表示されるし。
もう寝る。
0332名無しさん@お腹いっぱい。
2010/03/03(水) 10:57:100333名無しさん@お腹いっぱい。
2010/03/03(水) 12:34:27それをするとどういう得が……?
0334名無しさん@お腹いっぱい。
2010/03/03(水) 15:27:54画像落とす方がだめだね
0335名無しさん@お腹いっぱい。
2010/03/03(水) 16:34:53>>304のほどフレンドリーじゃないよ
ttp://www1.axfc.net/uploader/Sc/so/88409.zip
>>333 プログラムの見通しが良くなって俺が少しニッコリする
0336名無しさん@お腹いっぱい。
2010/03/03(水) 22:29:29なるほど!
なんとか、出来そうだ。しかし、ファイル名取得が面倒だな。
img id参照して、正規表現にぶっこんでみるか。
0337名無しさん@お腹いっぱい。
2010/03/03(水) 23:43:52自分はオリジナル(?)のファイル名にこだわる必要は無いと思うのだが。
再度ZIPにしてどこかにアップし直す職人なら別だけどね。
実際1つのギャラリーに同じファイル名のものが有ったりするので
重複時の処理をするよりページ番号の連番で振りなおす方がらくだと思うよ。
0338名無しさん@お腹いっぱい。
2010/03/04(木) 00:00:18それも考えたが、なんか悔しいのでimg id参照して正規表現で、取出した。
もっとも、get.plを少改造して、四桁連番+オリジナルファイル名にしている。(重複防止用に)
今のところ、正常にダウンロード出来ているみたい。
0339名無しさん@お腹いっぱい。
2010/03/04(木) 00:06:22でもたまに変な空白が入っていたりするし、万一 alt="/etc/passwd" とか書かれた
場合には備えておきなよ。
0340名無しさん@お腹いっぱい。
2010/03/04(木) 00:21:39>万一 alt="/etc/passwd" とか書かれた
うへぇ、いやすぐる。対策しておこう。ご忠告ありがとう。
0341名無しさん@お腹いっぱい。
2010/03/04(木) 20:01:02get.pl修正のヒントを教えてくだしあ
どうか
0342名無しさん@お腹いっぱい。
2010/03/04(木) 20:08:060343名無しさん@お腹いっぱい。
2010/03/04(木) 21:57:02自分はずっとこれでしのいでいるが、その反面 "509s.gif" 等を美しく検出できずに
悩ましい日を送っているのだよ。なんか堅牢な手法ない?
0344名無しさん@お腹いっぱい。
2010/03/04(木) 22:03:25名前で検出
ステータスコード509そのものを検出
くらいしか思いつかない
0345名無しさん@お腹いっぱい。
2010/03/04(木) 22:37:12ドキュメントのソースを見てて気が付いたんだが、idを持ったイメージタグを全部
抜き出したとき、他に重複しないidを持つのがターゲットだな。それ以外は
上下に表示してるので2個ずつある。
決してスマートとはいえないが画像名やホスト名決め打ちしない分変化には強いかも。
中の人、若干策に溺れた気がしてきたよ。
0346名無しさん@お腹いっぱい。
2010/03/04(木) 23:43:04その中で一番サイズが大きいのを取ってくる……
っていうのはどうだろう。
0347名無しさん@お腹いっぱい。
2010/03/05(金) 18:27:12そんなに変わってないと思うんだけどなぁ・・・
試しに、1枚目の html と 2枚目の html を保存して、WinMerge とかで比較
してみれば、どこの html を引っこ抜いてダウンロードするかわかるんでないの?
0348名無しさん@お腹いっぱい。
2010/03/05(金) 21:04:00楽しいじゃねぇか
0349名無しさん@お腹いっぱい。
2010/03/05(金) 21:49:40暇人なのか?w
0350名無しさん@お腹いっぱい。
2010/03/05(金) 21:56:590351名無しさん@お腹いっぱい。
2010/03/05(金) 22:00:20逆にありがたいが。
0352名無しさん@お腹いっぱい。
2010/03/05(金) 22:24:450353名無しさん@お腹いっぱい。
2010/03/05(金) 22:28:00その「、」の入れ方はゴルゴ13みたいでかっこいいな。
0354名無しさん@お腹いっぱい。
2010/03/05(金) 22:39:43日替わりで変更とか来たら、ある意味面白いな。
0355名無しさん@お腹いっぱい。
2010/03/05(金) 22:45:14これナニ?
例のloli規制の名残?
0356名無しさん@お腹いっぱい。
2010/03/05(金) 22:51:040357午後は@お腹いっぱい
2010/03/06(土) 08:40:28curl -O "http://www.hoge.com/[1-5].jpg"
0358名無しさん@お腹いっぱい。
2010/03/06(土) 12:59:13修正点を教えてください。
0359名無しさん@お腹いっぱい。
2010/03/06(土) 13:00:31なぜか最近Hpricotでページの取得をしたら文字化けしたデータしか取れなくなった
誰か原因は分かりませんかね?
0360名無しさん@お腹いっぱい。
2010/03/06(土) 13:05:020361名無しさん@お腹いっぱい。
2010/03/06(土) 13:31:15取得したデータの文字コードを変換する
0362359
2010/03/06(土) 14:19:11それはもう試してあるんだけど何故か無理だった
一応取得データをそのままファイルとして保存して文字コードをUTF-8にしても文字化けするから
取得データ自体に何か問題があると考えてる
0363名無しさん@お腹いっぱい。
2010/03/06(土) 14:19:45最近加えたプログラムや環境の変更に不具合があると思う。
なければ中の人に「すぐ元に戻せや迷惑なんじゃ何様のつもりじゃ」と訴える。
判らなければ検証用コードを見せてRubyに詳しい人に尋ねる。
0364名無しさん@お腹いっぱい。
2010/03/06(土) 14:26:39get.plも、htmlファイルが落ちてこなくて生のgzipファイルが出来る。
0365名無しさん@お腹いっぱい。
2010/03/06(土) 14:38:280366359
2010/03/06(土) 14:43:52データの拡張子をgzに変更して解凍してみたらそれらしいhtmlファイルが出来たから確かにgzipファイルが原因っぽい
どうやって対策しようものか・・・
rubyでgzipって解凍できたっけ?
0367名無しさん@お腹いっぱい。
2010/03/06(土) 14:56:30良かった解決、じゃなくてどこをどう弄ったらgzipエンコードされたのか原因を知っとかないと
きっとこれからも同じ失敗を何度もするよ。
0368名無しさん@お腹いっぱい。
2010/03/06(土) 15:44:54めんどいからコマンドで対応した。
0369359
2010/03/06(土) 17:06:38今回の問題は、自分がプログラムを弄った為に発生した問題じゃなかったから迷ってたんですよ
E-Hentai側の圧縮転送への仕様変更が原因で発生したからだと思います
もし、それ以前にも圧縮転送をしていたのならば見当違いですけど・・・
ともかく忠告ありがとうございます
プログラムの方はちゃんと再び動くようになりました
0370名無しさん@お腹いっぱい。
2010/03/06(土) 18:57:30おぉぅ、本当だね。試しにリクエストヘッダの 「Content-Encoding: gzip」を消してみたが
サーバは勝手にgzipして送ってくる。以前はこういう場合は平文で送ってきてたのに。
ちなみに圧縮されているかどうかはレスポンスヘッダに書いてあるよ。
HTTP/1.0 200 OK
Server: Apache
Content-Encoding: gzip ←圧縮形式
Content-Type: text/html; charset=UTF-8
Content-Length: 1550 ←これは圧縮された状態のドキュメントサイズ
:
ちなみに自分はdeflateで圧縮されるとチト困るんだが。
0371名無しさん@お腹いっぱい。
2010/03/06(土) 18:59:400372名無しさん@お腹いっぱい。
2010/03/06(土) 20:47:09gzip を decode 出来る(HTTP::Messageを参照).
decode されて is_utf8 なので, そのまま出力すると warning が出るから,
ファイルハンドラの HTML を encoding つきで open するか, binmode で設定する.
具体的には gethtml() の以下の部分.
- open (HTML, "> $sfn") or die $! ;
+ open (HTML, '>:encoding(utf8)', $sfn) or die $! ;
- print HTML $res->content ;
+ print HTML $res->decoded_content ;
gzipped ファイルに必死で matching を試みた俺に乾杯.
でも折角圧縮してくれてるんだから, こっちで decode してやるのが人だと思う.
0373名無しさん@お腹いっぱい。
2010/03/06(土) 23:15:50知らんかったよ勉強になった
0374名無しさん@お腹いっぱい。
2010/03/07(日) 22:53:290375名無しさん@お腹いっぱい。
2010/03/08(月) 00:21:430376名無しさん@お腹いっぱい。
2010/03/08(月) 01:22:06見事わっちも、ひっかりました。以前は、動いていた気がするけど気のせい?
0377名無しさん@お腹いっぱい。
2010/03/08(月) 08:57:131日に20冊くらい良いのが上がるから串踏むようなツールに変えないと
0378名無しさん@お腹いっぱい。
2010/03/08(月) 11:30:29あの41桁のSHA-1らしき何かは逆算できるものなの?
とりあえずURLに画像の大きさと幅と高さが埋め込まれていることしかわからない
0379名無しさん@お腹いっぱい。
2010/03/08(月) 12:04:040380名無しさん@お腹いっぱい。
2010/03/08(月) 12:19:55>あの41桁のSHA-1らしき何かは逆算できるものなの?
逆算してどうするの?
正規表現で取出すだけじゃない
プロクシで、ダウンテスト中だが今のところ落とせている。
0381名無しさん@お腹いっぱい。
2010/03/08(月) 19:27:410382名無しさん@お腹いっぱい。
2010/03/08(月) 20:52:29あんたのHentai間口は俺よりかなりデカイ>>377
0383名無しさん@お腹いっぱい。
2010/03/08(月) 21:32:16まぁ今週金曜の様子を見てからにしなよ。
guestは総Flash化されるかもな。
0384名無しさん@お腹いっぱい。
2010/03/08(月) 23:13:32やりかねん
と言う事でまかせたぞ>383
0385名無しさん@お腹いっぱい。
2010/03/08(月) 23:34:32今は3次ばっかでスルー多いけど、年末年明けは見るの大変でした
0386名無しさん@お腹いっぱい。
2010/03/09(火) 09:05:400387名無しさん@お腹いっぱい。
2010/03/09(火) 09:28:01その辺の巡回取得を先に実装するのが常識?
0388名無しさん@お腹いっぱい。
2010/03/09(火) 09:49:38やっぱこれも込みで自動化せんといかんな
0389名無しさん@お腹いっぱい。
2010/03/09(火) 11:44:400390名無しさん@お腹いっぱい。
2010/03/09(火) 11:49:38aria2cだといけるんだが
0391名無しさん@お腹いっぱい。
2010/03/09(火) 13:14:25潰れてない件
0392名無しさん@お腹いっぱい。
2010/03/09(火) 13:26:59使えるプロクシは、意外と少ない。
おいらは、まったりプロクシ手動設定さ。みんなのおこぼれipでダウンするよ
0393名無しさん@お腹いっぱい。
2010/03/09(火) 17:04:010394名無しさん@お腹いっぱい。
2010/03/09(火) 17:30:03「g_e-hentai_org」を落とそうとするんだが
0395名無しさん@お腹いっぱい。
2010/03/09(火) 17:31:06「g_e-hentai_org」ってのが落ちてくるんだが
0396名無しさん@お腹いっぱい。
2010/03/09(火) 17:40:250397名無しさん@お腹いっぱい。
2010/03/09(火) 18:28:19フランスとか台湾で生きのいい串があったけどああいうのに当たると気持ちいい。
基本どこも重いか既にご使用済みだよね。
おかげでタイムアウトやコネクトがらみのデバッグできちゃったよ。
ともあれ串対応したおかげで302時代より落とせてるかも。
ただ落としたjpg見ると破損してるのあるからレジューム機能も付けんといかんです。
0398名無しさん@お腹いっぱい。
2010/03/09(火) 18:56:22画像なんてオマケです
0399名無しさん@お腹いっぱい。
2010/03/09(火) 19:03:38実際見る時間無いしね。
1枚目の画像見て、びびっと来たのを登録するだけの作業になっている。
1枚目の画像だけありゃいいじゃんみたいに思えてくる。
0400名無しさん@お腹いっぱい。
2010/03/09(火) 21:46:13俺は実際受信した画像データとContent-Length比較して違えばリトライしてるが
0401157
2010/03/09(火) 21:47:14ttp://www1.axfc.net/uploader/Sc/so/90788
DLキーワードは「連番ダウン」です。
0402名無しさん@お腹いっぱい。
2010/03/09(火) 22:03:52otukare
早速質問
getpicsサブルーチンの
if ( -e $img ) は、フォルダー指定抜けてない?
0403名無しさん@お腹いっぱい。
2010/03/09(火) 23:29:44乙豚!!
0404名無しさん@お腹いっぱい。
2010/03/09(火) 23:32:060405名無しさん@お腹いっぱい。
2010/03/10(水) 02:14:01俺もだわ
文字化け発生してびびった
0406名無しさん@お腹いっぱい。
2010/03/10(水) 07:09:15自作ツールから無事コール出来てます
ありがとー
0407名無しさん@お腹いっぱい。
2010/03/10(水) 18:15:48早速>>401のをDLしてみたんだけど、自分には何がなんだかサッパリだったぜ…。
ツールを使用してとかじゃないのかぁ。
0408名無しさん@お腹いっぱい。
2010/03/10(水) 18:30:590409名無しさん@お腹いっぱい。
2010/03/10(水) 21:57:44アイコンをダブルクリックして、ボタンを幾つかクリックしたら
ダウンロード開始みたいな「ツール」を、期待していたのだろう。
でもね、スクリプトも面白いよ。
言い機会だからちょっといじってみなよ
0410名無しさん@お腹いっぱい。
2010/03/10(水) 23:04:13ちょっとした死神博士気分だ。
アジトは古アパートだが。
おっと、ゾル大佐に呼ばれた。イーッ!
0411157
2010/03/11(木) 00:19:47確かに抜けてますね
これじゃ何やってるか分からないですね
今までエラーが出なかったのでセーフだと思ってました
エラーがでないのも当たり前です
機を見て直しておきます
0412名無しさん@お腹いっぱい。
2010/03/11(木) 11:08:48>>393
>>405
プニルでは変な文字列
IEとか火狐だと入れる
原因ワカンネ
0413名無しさん@お腹いっぱい。
2010/03/11(木) 15:15:12長いな
0414名無しさん@お腹いっぱい。
2010/03/11(木) 16:04:1950枚くらい落とせるのが、最近のパータンじゃない?
たまに、サービスデーで300枚くらいまで制限が来ない日も有るけどね。
ルーターをリセットするなり、プロクシかますとかでなんとかなる。
0415名無しさん@お腹いっぱい。
2010/03/11(木) 22:39:10e-hentaiは複雑だから、そこらのフリーソフトみたいにURL入れてフォルダ選んで保存押すだけって訳にはいかないんじゃない
0416名無しさん@お腹いっぱい。
2010/03/11(木) 22:59:00変化に追従できるようHTML解析部をDLL化したりしてね。
自分は人の褌で取る相撲にそこまでの製作意欲も沸かないが。
0417名無しさん@お腹いっぱい。
2010/03/11(木) 23:03:06もうある
exeだし怪しすぎて確認してないけど
0418名無しさん@お腹いっぱい。
2010/03/11(木) 23:47:44安全の為に仮想環境のxpで。
うん、普通に落とせる。
しかし、これはスクリプトをランチする為のだけに
4.6MBのファイルをインストールするのか。
つーか、アイコンをダブルクリックしたらコマンド画面で
ギャラリーのURLをペーストするだけ。
正直GUIもくそもねえ。
0419名無しさん@お腹いっぱい。
2010/03/11(木) 23:56:49ウイルスチェックは?
0420名無しさん@お腹いっぱい。
2010/03/12(金) 00:00:14テスト用環境だから、してない。
いざとなったらマスターからもどすだけ。
ほぼ素の状態のxpで、テストしている。
0421名無しさん@お腹いっぱい。
2010/03/12(金) 00:43:06ウイルス注意
0422名無しさん@お腹いっぱい。
2010/03/12(金) 01:21:22動作してるようで一枚も落とせなくて全俺が泣いた
0423名無しさん@お腹いっぱい。
2010/03/12(金) 02:13:290424名無しさん@お腹いっぱい。
2010/03/12(金) 06:41:56いろいろ厳しくなってるのか、
0425名無しさん@お腹いっぱい。
2010/03/12(金) 07:39:03落とし続けてるので基本は変わってないと思う。
またHTMLの記述で重箱の隅をつつかれてるんじゃないか?
0426名無しさん@お腹いっぱい。
2010/03/12(金) 12:40:39これは波があるので、いつも一定と言うわけじゃないし。
get.plに、今のところなにか問題が有るわけでも無い。
0427名無しさん@お腹いっぱい。
2010/03/12(金) 12:57:52同条件で試したいから、どのページ落としたか教えてくれまいか
0428名無しさん@お腹いっぱい。
2010/03/12(金) 13:11:430429名無しさん@お腹いっぱい。
2010/03/12(金) 14:37:06で2枚目・・500Can't Connect to うんちゃらで停止オワタ
画像はブラウザでも見れない・・つかこんなのばっかり
環境のせいなのか、運悪く弾かれてるのか
一つも完成品拝んでないわ
0430名無しさん@お腹いっぱい。
2010/03/12(金) 14:42:23そいつぁイエネェな、っていうか聞いてどうする。
ウチに来てウチのPCからウチのIPで接続するかい?
自分はプロクシなど使わずいつも素のIPで繋いでる。
最短30秒のインターバルを取ってるが帯域制限受けたら500秒待ち
から急速に時間を長くしながらリトライ。帯域制限解けたら徐々に
時間を短くしてゆく。(500秒も待てば解けてるけどね)
接続エラーの類は120秒待ちだ。
時間の調整値には特に意味はなく自分のせっかちさと我慢強さの折り合い。
今までの実績を大雑把に言えば1ページあたり87秒の
待ち時間だから素直に100秒おきに見に行へば良いっちゃ良いんだが。
0431名無しさん@お腹いっぱい。
2010/03/12(金) 15:49:07まぁ名無しのexeなんて俺だって勘弁だけど
0432名無しさん@お腹いっぱい。
2010/03/12(金) 15:55:33自分はperl読めんのだがやってることに大した違いはないと思う。
0433名無しさん@お腹いっぱい。
2010/03/12(金) 15:59:06347 だけど、自作ツールだと確かに問題なさそーだけどな。
509はでるけど・・・
そこは、Proxy つかってなんとかやりくりしてる。
0434名無しさん@お腹いっぱい。
2010/03/12(金) 17:42:18コネクトしないのは巡回リストに加えないルールにしてたけど
手動でやってみたら繋がりにくいけど繋がると速い串とかあるのな、まいった
使いたいけどconnectで落ちる串もリストに加わってしまう
0435名無しさん@お腹いっぱい。
2010/03/12(金) 18:40:250436名無しさん@お腹いっぱい。
2010/03/12(金) 20:02:43以前に普通にブラウザで画像が見れないものがある時点でおかしいのか
0437名無しさん@お腹いっぱい。
2010/03/12(金) 21:45:08ステータス500で、帰ってくるプロクシサーバーはリトライ3回内で
接続出来ればオけで、そうでなければ次のプロクシを試してみる
って感じでやってます。
プロクシの評価まではやってないな。
0438437
2010/03/12(金) 21:49:51繋がりにくいけど、おkなら結構快適。
ブルガリアかよ
0439名無しさん@お腹いっぱい。
2010/03/12(金) 23:17:11んーいやconnectできるかどうかなので
send/recvとかwebサーバーステータスがどうとか以前の話なので
でもまあconnectの3回リトライは良いかもしれない
3回やって駄目なら鯖は存在しないってことでリストに加えないような仕方にしてみます
>>438そうそことか
0440名無しさん@お腹いっぱい。
2010/03/13(土) 07:28:39ブラウザで見れないって...ページ自体がロードされないの?
画像がロードされないの?変な画像が表示されるの?
ページの下の方にある "Click here if the image fails loading"
でも駄目なの?
0441名無しさん@お腹いっぱい。
2010/03/13(土) 12:51:36まず画像がズラーっと並ぶリスト的なページから
高確率で1枚目は見れます(今のところ100%?
で、2枚目・・ページ読み込んで画像が表示されるであろう領域が出ます
しばらくすると駄目だったのか、その領域が消えて○○.jpgみたいな文字だけポツン
後はそのページの広告とかお約束のが周りにといった具合
って>"Click here if the image fails loading"
押したら見れたああああああああ
でもirvineは相変わらずorz
なんちゃらが見つかりました
なんちゃらにconnect失敗しました
ソケットエラー
0442名無しさん@お腹いっぱい。
2010/03/13(土) 13:20:51irvineってのが良くわからんけど
ttp://www.vector.co.jp/soft/win95/net/se218138.html のこと?
なら原因と対策は作者に聞くのが良いかと...てかexeの中は判らんな。
0443名無しさん@お腹いっぱい。
2010/03/13(土) 13:48:57まぁ道具ってのは得手不得手があるもんで
10徳ナイフじゃ刃が届かない所もあろう。
ここで言ってるスクリプトって言うのは
比較的手軽に専用の道具を作れる手段だよ。
学生で春休みで暇ならトライしてごらん。
この近所には初心者の質問に答えてくれる
板もあるだろうし。
最初にやることは押入れから昔使った英和辞書
を探し出すことだがな。
0444名無しさん@お腹いっぱい。
2010/03/13(土) 14:07:01> 押したら見れたああああああああ
押したらURLが(そして落ちてくるHTMLが)どう変化するかくらい観察したら?
http://pc12.2ch.net/test/read.cgi/win/1261004900/490
0445名無しさん@お腹いっぱい。
2010/03/13(土) 14:12:480446名無しさん@お腹いっぱい。
2010/03/13(土) 14:15:060447名無しさん@お腹いっぱい。
2010/03/13(土) 17:50:52今、ツンデレを目の当たりにしたこの感動!
0448名無しさん@お腹いっぱい。
2010/03/13(土) 18:34:24あ・・ごめん
結局上のperlもget.plも入れたしコマンド自体の操作
設定も正しくスクリプト自体も動いてるはずなんだが
画像それ自体は落とせない状態が続いてるんだ
どろしー2入れたirvineもアレレで
>>444
頭冷やしてくる
0449名無しさん@お腹いっぱい。
2010/03/13(土) 19:01:450450名無しさん@お腹いっぱい。
2010/03/13(土) 19:46:46エラー内容を、うんちゃらとかアレレとか書かれても
エスパーじゃあるまいし。
0451名無しさん@お腹いっぱい。
2010/03/13(土) 20:07:30まがりなりにもUNIX版だがカーネルのリビルドが趣味の人ばかりではなさそうだ。
0452名無しさん@お腹いっぱい。
2010/03/13(土) 20:44:15今日は300枚連続で落ちてきてる
サービスディかな?
0453名無しさん@お腹いっぱい。
2010/03/13(土) 21:44:440454名無しさん@お腹いっぱい。
2010/03/13(土) 21:59:36週末メンテの恩恵だと思うがいっしょに改変もやってくるから気をつけとくよ。
つかそれを期待しての週末ロングラン耐久テストしてるんだが。
0455452
2010/03/13(土) 22:27:59平均500kbくらいの画像だったんですけどね。
0456名無しさん@お腹いっぱい。
2010/03/13(土) 23:37:23俺フレッツ・ISDNでシコシコ頑張ってるけど、
400〜500KBの画像だけど
毎回10枚強落としたところで制限に入るよ…。
転送量にしたらせいぜい5〜6MBってとこだぞ?
時間はそれなりに掛かっているが…。
0457名無しさん@お腹いっぱい。
2010/03/13(土) 23:40:43ttp://www.sexydesktop.co.uk/index.htm
例えばエイミー・アダムスの場合だと、
ttp://www.sexydesktop.co.uk/amyadams.htm
をトップページとして合計3ページ分あります。
いずれの画像もstandard用とwidescreen用のものが用意されていて、
例えばトップページだと15種類30枚の画像があります。2ページ目も同じ。
どの女優の画像もそうなのですが、最後のページは残りの端数分だけ掲載されていて、
余った部分には別の女優のページへのリンクが挿入されるようになっています。
で、エイミー・アダムスの場合には、3ページ目に4種類8枚の画像があります。
合計34種類68枚の画像があるわけですが、これを一気に落としたいんです。
もちろんエイミー・アダムスは例です。本命はもっと枚数の多い女優の画像。
誰か助けて。
0458名無しさん@お腹いっぱい。
2010/03/13(土) 23:44:53動的IPで契約してると、複数のIPを使える反面
同じアドレスプールにe-henユーザーが居るとバッティングしちゃうんだよね
0459名無しさん@お腹いっぱい。
2010/03/13(土) 23:56:03酔っぱらった頭で読み解くと『余った部分に挿入されてる別の女優のページ』は
すっ飛ばしてエイミー・アダムスの画像だけ落としたいが、今使っているツール
では旨く行かない、もしくは現在手作業なので自動化したいって言う事?
その昔スーパーモデルブームの頃abpef*に釘付けになった自分には良くわかるよ。
えっ一緒にするなって?
0460名無しさん@お腹いっぱい。
2010/03/14(日) 00:10:34ピンポイントで規制してるんじゃないんだ?
アドレスの切り替え自体は切断→再接続の5秒程度で済むから
制限される度にパッパパッパと贅沢に使い捨てていってるんだけど、
とりあえず切り替えちゃえばまた10枚程度は普通に落とせるんだよね。
(最初から落とせない「ハズレ」もなければ、20枚も30枚も落とせる「アタリ」もない)
e-hentaiには、全国の悩めるツール使いのために
可及的速やかに帯域制限の発動条件をつまびらかにするよう
強く求める次第である。
0461452
2010/03/14(日) 01:11:19ざらっと見てみた。
jsつかいまくり、クッキー喰え、リファーよこせ。
めんどくせー
各ページへのリンク抽出まんどくさそう。
なによりも、俺の食指がうごかねえ。w
0462名無しさん@お腹いっぱい。
2010/03/14(日) 01:38:000463名無しさん@お腹いっぱい。
2010/03/14(日) 10:54:14どなたか、GetChinkoみたいなGUIツール作って下さい。
お願いします。
0464名無しさん@お腹いっぱい。
2010/03/14(日) 11:42:13デチューンめんどくさいけど
つか1IPで高速に画像だけ落としていくと規制(509待ち時間)強烈だぞ?
0465名無しさん@お腹いっぱい。
2010/03/14(日) 12:04:21取っ掛かりが・・・
0466名無しさん@お腹いっぱい。
2010/03/14(日) 12:13:23のどから手が出るほどの熱い気持ちがあれば使い方はきっと分かる!
0467名無しさん@お腹いっぱい。
2010/03/14(日) 13:38:36proxy list で、ググればいくらでも出てくるぞ。
使えるかどうかは運次第
オラ場合はプロキシの杜から、全部落としてきて
総当たり戦
0468名無しさん@お腹いっぱい。
2010/03/14(日) 17:00:170469名無しさん@お腹いっぱい。
2010/03/14(日) 19:10:16良い意味でも悪い意味でも
0470名無しさん@お腹いっぱい。
2010/03/14(日) 20:28:56最近の勢いは皆さん使える時間が増えたからかな
前スレは5年というから立ったのはバブル崩壊の頃か
本スレがあと5年続きますように
0471名無しさん@お腹いっぱい。
2010/03/14(日) 21:54:38が従量というより時間で終了した感じ。今>>458に納得した。
次のチャンスを逃さぬようサービスタイムを検知してブースト掛けるモードを検討するよ。
0472名無しさん@お腹いっぱい。
2010/03/14(日) 22:45:56細い串が逝っちゃうから微妙なんだよね(複数PCで分けても回線が1本ならいっしょ)。
大学みたいに大量にIP持ってればええんだけど。
一番良いのはe-henの有料ユーザー?になることだけど。串とかいらなそうだし。それ以前にzipで落とせるんだっけ?
0473名無しさん@お腹いっぱい。
2010/03/14(日) 23:12:25最初のページだけ & std だけじゃが、こんなんでどうぜよ
grep /img.php jodie.htm|egrep -o '[0-9]+@[^"]+'|sed 's/@id/_jodie/;s/$/lo.jpg/;s/@iv/.imagevenue.com/'|awk '{print "http://img"$0}'
おらの趣味で jodie を例にしちょるけんど
(最後の awk は sed の範囲でどうにかなるんだよねきっと…)
0474名無しさん@お腹いっぱい。
2010/03/14(日) 23:19:14grep /img.php jodie-4.htm|egrep -o '[0-9]+@[^"]+'|sed 's/@id/_jodie/;s/$/lo.jpg/;s/@iv/.imagevenue.com/;s_^_http://img_'
sed の @id 置換部分だけ女優名にすればええがじゃ
あとは script 化すればできるろう
0475名無しさん@お腹いっぱい。
2010/03/14(日) 23:33:42いきなり grep から始まってて、
それをどう使えばいいか解らんです。
もうちょっと解説お願いします。
0476名無しさん@お腹いっぱい。
2010/03/14(日) 23:43:52せっかく>>462 が、shスクリプト上げてくれてるのに無視かい。
0478名無しさん@お腹いっぱい。
2010/03/15(月) 00:19:06ユニックスとかリナックスって聞いたことはあるでしょう。
ここはそういった種類のOSを使ってる人が多いんですよ。
マイクロソフトのウィンドウズを使ってるなら次は"Cygwin"で検索してみると良いよ。
0479名無しさん@お腹いっぱい。
2010/03/15(月) 00:55:04その辺の事情が分かってないわけではないんじゃない?
>>462のどこを>>473-474にするのかが分かんねーよってことだろ
とエスパーしてみる
0480名無しさん@お腹いっぱい。
2010/03/15(月) 01:16:09あpする用意が、ありますがどうでしょう?
需要有りますか?
許可と需要が有れば、あpする予定です。
0481名無しさん@お腹いっぱい。
2010/03/15(月) 02:54:02>>473-474 のコードを >>462 のどこに挿入すればいいのか分からんのです。
っていうか >>462 が私の質問へのレスとは思ってなかったです。
0482名無しさん@お腹いっぱい。
2010/03/15(月) 03:09:090483名無しさん@お腹いっぱい。
2010/03/15(月) 03:15:37弾かれたの?
0484名無しさん@お腹いっぱい。
2010/03/15(月) 13:26:57なんか見てみたら結構参考になるじゃん
thx
0486480
2010/03/15(月) 14:30:17許可ありがとうございます。
http://www1.axfc.net/uploader/Sc/so/92665
キーワードは、hentaiget
ご質問などありましたらこの板で
0487名無しさん@お腹いっぱい。
2010/03/15(月) 14:52:230488名無しさん@お腹いっぱい。
2010/03/15(月) 15:47:26ソースちゃんと見てないけど、森しかアクセスしてないかも
0489名無しさん@お腹いっぱい。
2010/03/16(火) 01:39:070490名無しさん@お腹いっぱい。
2010/03/16(火) 01:53:11ttp://yamadasox.hp.infoseek.co.jp/
CCB Proxy採集&検査ツール
0491名無しさん@お腹いっぱい。
2010/03/16(火) 06:52:470492名無しさん@お腹いっぱい。
2010/03/16(火) 12:02:25って、通せたかもしれないけど落とせないなぁ
できたtxtがすっからかんになったから読み込み専用にしたが無意味か
0493480
2010/03/16(火) 12:59:54proxy.txtを読込み専用しちゃだめ。
接続出来たプロクシは、残すようにしてあるからね。
接続出来なかったプロクシは削除されるので
今後使えるかもしれないプロクシが残って行く。
proxy.txtの一行目を、1に戻すとそのプロクシを使えるよ。
サンプルスクリプトでは、プロキシの杜だけからダウンするけど
他の公開リストのサーバーからも、ダウン出来る様に拡張してみて
0494名無しさん@お腹いっぱい。
2010/03/16(火) 15:14:53拡張は知識的に無理でお察しな上に
読み込み専用がどうの以前に何がしらのエラーで画像落とせてないから
もちっとググったりして煮詰めてみるよ
0495名無しさん@お腹いっぱい。
2010/03/16(火) 18:33:23パス指定できてないだけでは?
0496名無しさん@お腹いっぱい。
2010/03/16(火) 23:04:23400が返ってくる。
0497名無しさん@お腹いっぱい。
2010/03/16(火) 23:33:18今日のは150MB,360枚だった。向こうで何が起ってるんだ?
0498名無しさん@お腹いっぱい。
2010/03/16(火) 23:52:590499名無しさん@お腹いっぱい。
2010/03/17(水) 00:28:420500480
2010/03/17(水) 00:35:48リストを作成するデレクトリィによっては、うまく動作しない場合が
ありました。
リストが空っぽの状態になるバグ。このバグを直す為に入れたコード
が、更にバグを産んでいた。わはは、すまん
キーワードは、hentaiget
画像取得で、エラーがおきたらリトライする回数を、ウザイから
3回に変更しました。
0501480
2010/03/17(水) 12:37:58オリジナルget.plと .litsファイルの互換性はありません。
hentaiget の方は、ナンバリング情報が入っていますので
.listの相互活用が出来なくなっています。
書き忘れていてごめんなさい。
0502名無しさん@お腹いっぱい。
2010/03/17(水) 15:00:390503480
2010/03/18(木) 00:02:43>>501の注意書きを追加した物を上げときます。
心配性で小心者なんで。
誤字脱字もついでに修正。
内容は、変わっていませんので以前の、物をダウンされた方は
とくにダウンは必要有りません。
ほんと、すみません
http://www1.axfc.net/uploader/Sc/so/93619
キーワードは変わっていませんのでよしなに。
0504名無しさん@お腹いっぱい。
2010/03/18(木) 01:22:390505名無しさん@お腹いっぱい。
2010/03/18(木) 01:30:35他にもpspで見れなくなった人がいたんだ・・・
0506名無しさん@お腹いっぱい。
2010/03/18(木) 02:40:41*nix系列のOSで動くプロクシコレクターないかしら
探し方が悪いのか、見付けられない
やはりみんなお手製で、やってるの? >*nixのひと
0507名無しさん@お腹いっぱい。
2010/03/18(木) 15:15:24しかしまぁ、みんな技術はあるけど、
ここまで卑屈にダウンロード特化のツールにしないとならんのが悲しいというか紳士だなw
この件でアップロードしたりサーバーソケットで共有ツールにしたらお縄だからな
IP消耗戦の問題は解決するけど
0508名無しさん@お腹いっぱい。
2010/03/18(木) 17:24:340509名無しさん@お腹いっぱい。
2010/03/18(木) 18:06:20暇ならソケット云々からやり直しだ
0510名無しさん@お腹いっぱい。
2010/03/18(木) 18:06:300511名無しさん@お腹いっぱい。
2010/03/19(金) 13:22:00斧がどの板もInternal Server Errorなんだけど、他の人は大丈夫なの?
0512名無しさん@お腹いっぱい。
2010/03/19(金) 13:24:06500が出る
終了か・メンテか
0513名無しさん@お腹いっぱい。
2010/03/20(土) 00:07:22http://www.sexydesktop.co.uk/
↑ここの何処でもいいんですが、なんとかできないでしょうか?
wallpaporz入れたら、壁紙いっぱい欲しくなりました。
0514名無しさん@お腹いっぱい。
2010/03/20(土) 00:11:400515名無しさん@お腹いっぱい。
2010/03/20(土) 00:19:39e-henがこの仕様になったら即日対応するが、パツ金のお姉さんじゃ萎えるわぁ
0516名無しさん@お腹いっぱい。
2010/03/20(土) 00:32:570517名無しさん@お腹いっぱい。
2010/03/20(土) 03:50:16すいません。既出でしたね・・・
やっぱここでも無理か。ちょっとスクリプト書いてみます。どっから手をつけようか
断念したんだけど・・・・。今時ならcurlかなぁ。
0518名無しさん@お腹いっぱい。
2010/03/20(土) 09:52:51>>462 だよ。
>>462 だよ。大事な事な(ry
0519名無しさん@お腹いっぱい。
2010/03/20(土) 21:46:54観覧してしていないのにいつのまにか貯まっていてなんでだろうと疑問に思ったのですが・・・
0520名無しさん@お腹いっぱい。
2010/03/21(日) 00:01:01あとたまに上にモンスターが出現して倒すと貯まる?のかも
倒したことないし英語苦手だからよくわからんけど
0521名無しさん@お腹いっぱい。
2010/03/21(日) 00:58:09これ回避する方法ってない?初心者な質問で申し訳ないけど
0522名無しさん@お腹いっぱい。
2010/03/21(日) 01:30:51ないから串がどうのこうの上で言ってるわけ
0523名無しさん@お腹いっぱい。
2010/03/21(日) 01:31:13登録してログインできるようになると
規制回避できるんだな
0524名無しさん@お腹いっぱい。
2010/03/21(日) 02:08:290525名無しさん@お腹いっぱい。
2010/03/21(日) 11:59:44サーバが多い場合は帯域制限に引っかかりにくいな。
そればっか続くと何処までも行ける気がする。
プロクシの良し悪し言ってる中には実はこれだったってのもあるんじゃね?
0526名無しさん@お腹いっぱい。
2010/03/21(日) 12:49:47すんません
それ以前に、画像も串使わないと落とせないと勘違いしてました
ソースページだけ串で落として画像の直リン貰えば終了なのね
へこい串でもソースくらいなら落とせるから、画像は光でガンガン落とせてます
外人ポルノも落とせそうなくらい俺のクローラーが暇してます
1ipで制限にかかりにくくなったから少ない串で大量に落とせるとはいえ
依然として串の奪い合いなのは変わらんからツールは上げれないけど
0527名無しさん@お腹いっぱい。
2010/03/21(日) 19:46:52帯域制限の対象になっていて、画像自体は制限の対象
に、なってないって事?
0528名無しさん@お腹いっぱい。
2010/03/21(日) 19:50:070529名無しさん@お腹いっぱい。
2010/03/21(日) 19:56:22画像鯖自体も時々509.gifよこすけど、ほんと時々。ウェイトで回避できる。
基本規制はソース鯖だけ。
URLリストとかを共有できたら串問題も突破できるんだけど。
アップロードや鯖ソケットはやばいからなぁ。
そもそも時限式のアドレスっぽいからリストの鮮度維持せにゃならんし。
0530名無しさん@お腹いっぱい。
2010/03/21(日) 20:00:40どちらにせよ置かれてる状況に変わりはないんだがな。
0531名無しさん@お腹いっぱい。
2010/03/21(日) 20:03:47ちなみにimage.phpに渡るのはUnix秒を3600で割った値な。
有効期限は1時間内
0532名無しさん@お腹いっぱい。
2010/03/21(日) 20:19:11こんなことしょっちゅうやっているお方なのか、すさまじい直感っすね
あのハッシュについて特に気にもとめてなかったです
なるほどソース取り直せばウェイト要らなかったんですね
ありがとうございます
0533名無しさん@お腹いっぱい。
2010/03/21(日) 20:23:17おれはそんなこと言ってない。勝手に解釈するな。
それにしてもあんた数字に対する直観力ないな。
0534名無しさん@お腹いっぱい。
2010/03/21(日) 20:41:23う〜ん、やっぱり509も返す事あるのか。
画像のアドレスだけ集めて、後でまとめてダウンと考えていたけど
時間制限もあるから無理そうだし。
できるだけ、生ipは温存したいしなあ。
めんどからやっぱプロクシ両方とも通すかな。
0535名無しさん@お腹いっぱい。
2010/03/21(日) 21:04:35ありがとうございます、モンスター出てるのに全然気が付かなかった・・・
マジックあるだけ使って、後はアタックしたら勝てました
レジェンド?とかいうのは効果は何なんだろ
0536名無しさん@お腹いっぱい。
2010/03/21(日) 21:11:030537名無しさん@お腹いっぱい。
2010/03/21(日) 22:11:000538名無しさん@お腹いっぱい。
2010/03/21(日) 22:42:05E-Hentai攻略スレッドやまとめWikiが必要なようだな
0539名無しさん@お腹いっぱい。
2010/03/21(日) 23:01:07俺まさにそれでやってるんだけど、
経験的に言って画像URLは24時間程度は有効っぽいけど?
0540名無しさん@お腹いっぱい。
2010/03/21(日) 23:01:510541539
2010/03/21(日) 23:07:01鯖の生成する画像URLは確かに結構な頻度(1時間毎?)で変わるんだけど、
変わってもすぐさま前のURLが無効とはならない、という意味。
0542名無しさん@お腹いっぱい。
2010/03/21(日) 23:11:00串通してる?画像のURLはクライアントのIPには左右されないの?
0543539
2010/03/21(日) 23:20:41画像URLをゲットする時はIPアドレス切り替えていくけど、
画像本体取得時は生IP1本です。
> 画像のURLはクライアントのIPには左右されないの?
その後IP切り替えても問題なく取得出来るので、アドレスには依存しないか、
仮にするにしてもある程度の範囲は受け入れているんだと思う。
0544名無しさん@お腹いっぱい。
2010/03/21(日) 23:23:22早い回答ありがとう。参考になったよ。
0545名無しさん@お腹いっぱい。
2010/03/21(日) 23:29:350546名無しさん@お腹いっぱい。
2010/03/21(日) 23:47:47あの手のアドレスの再処理どうしてます?
0547名無しさん@お腹いっぱい。
2010/03/22(月) 00:16:010548名無しさん@お腹いっぱい。
2010/03/22(月) 00:39:18大体何分で再び見られるようになるんだ?
0549名無しさん@お腹いっぱい。
2010/03/22(月) 00:51:03いきなり画像が矢印ばかりに
0550名無しさん@お腹いっぱい。
2010/03/22(月) 00:58:160551480
2010/03/22(月) 01:03:17get.plのうpをお待ちになっている方は、近日中にアップデートします。
今日中には、アップデートは無理かも知れません。用事が入っているので。
0552名無しさん@お腹いっぱい。
2010/03/22(月) 01:47:30autopagerizeを導入した時点で弾かれるんだが…
0553名無しさん@お腹いっぱい。
2010/03/22(月) 04:17:01俺だけじゃなかったか……
0554名無しさん@お腹いっぱい。
2010/03/22(月) 06:48:48数枚だけキチンと取れてるのもあるが
0555名無しさん@お腹いっぱい。
2010/03/22(月) 07:16:28get.plではないが >>352 の後divの階層を見るようにしている自分に影響は出ないよ。
緊急の対処療法としては b.tlcとかw.ffsとかの単語を含むURLを排除することかな。
あるいはUnix時刻の話がタイムリーだが、サーバレスポンスの Date から時間値を逆算して
それの値が含まれる画像URLを見るとかね。(これ以外と堅いな)
0556名無しさん@お腹いっぱい。
2010/03/22(月) 07:38:10で探せばいいと思う。直前が閉じDIVになっているやつが本命。
オレ製ツールはこれでずっと問題なく動いてる。
0557480
2010/03/22(月) 08:04:21http://www1.axfc.net/uploader/Sc/so/95087
キーワードは、hentaiget と変らずです。
0558名無しさん@お腹いっぱい。
2010/03/22(月) 09:12:250559名無しさん@お腹いっぱい。
2010/03/22(月) 09:28:33誰もツールアップしなくなるだけだろ。
0560名無しさん@お腹いっぱい。
2010/03/22(月) 10:21:55Searchに打ち込んでも反映されないよ
0561名無しさん@お腹いっぱい。
2010/03/22(月) 10:31:570562名無しさん@お腹いっぱい。
2010/03/22(月) 10:43:10タイトルに日本語が含まれている場合のみ、検索対象に日本語が
使えます
そして、スレ違い
0563名無しさん@お腹いっぱい。
2010/03/22(月) 12:35:37これがエロの力か……
0564名無しさん@お腹いっぱい。
2010/03/22(月) 14:34:12それだけにget.plとそのプロキシ版の方には感謝
0565名無しさん@お腹いっぱい。
2010/03/22(月) 14:40:07俺はツール自作してて弾かれなんて無縁だ、でもうpはしないぜヒャッハーが常駐してる意味がわからない
0566名無しさん@お腹いっぱい。
2010/03/22(月) 14:54:500567名無しさん@お腹いっぱい。
2010/03/22(月) 16:24:59オナニーじゃなくて誰にでも簡単に扱えるツールを作れよカスオナニー猿ども
0568名無しさん@お腹いっぱい。
2010/03/22(月) 16:55:19知ったことかカスw
0569名無しさん@お腹いっぱい。
2010/03/22(月) 16:57:47あんたならビルゲイツに勝てる
0570名無しさん@お腹いっぱい。
2010/03/22(月) 16:58:04# afk|tlc|lol|qqm を無視
sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ($ofn, $url) = @_ ;
print "url : $url\n";
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach my $img ($tree->find("img")) {
next if($img->attr('src') =~ /(afk|tlc|lol|qqm)$/);
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
$tree->delete;
return $returlimg;
}
$tree->delete;
return "";
}
>>567
get.pl程度も使えない猿が何しにココ来てるの?
0571名無しさん@お腹いっぱい。
2010/03/22(月) 16:58:46sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ($ofn, , $url) = @_ ;
print "url : $url\n";
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach $img_tag ($tree->find("img")) {
my @div_tag = $img_tag->look_up('_tag' => 'div');
if(scalar(@div_tag) == 1){
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
$tree->delete;
return $returlimg;
}
}
$tree->delete;
return "";
}
0572名無しさん@お腹いっぱい。
2010/03/22(月) 17:00:07image落とせなくね?
矢印以前に一枚も
0573名無しさん@お腹いっぱい。
2010/03/22(月) 17:02:470574名無しさん@お腹いっぱい。
2010/03/22(月) 17:11:44img要素のaltとsrcを調べて拡張子が一致する場合に画像を保存するようにしてる
var alt = img.getAttribute('alt'), src = img.getAttribute('src');
if (alt.substr(-4) == src.substr(-4)) {
// ここで保存
}
みたいな感じで
0575名無しさん@お腹いっぱい。
2010/03/22(月) 17:29:30おぉっ、それなら明日のビルゲイツ君も喜ぶんじゃないかい。
0576名無しさん@お腹いっぱい。
2010/03/22(月) 17:41:53つか拡張子に4文字決め打ちってのはどうなんだろうか。
それに alt は別に必須オプションじゃなかろうし必ずファイル名を書くもんでもない。
実際には "xxx.j pg" のように空白が入っていた時期もある。(最近見んけど)
いずれにせよ将来の改変には要注意だね。
でもアドオンは凄く素敵だよ。
0577名無しさん@お腹いっぱい。
2010/03/22(月) 18:00:030578名無しさん@お腹いっぱい。
2010/03/22(月) 18:10:59|∧
/ /
(^o^)/ てめえらがどうしても
/( ) ツール開発しないなら
(^o^) 三 / / >
\ (\\ 三
(/o^) < \ 三
( /
/ く まずはそのふざけた
E-hentaiとかいうサイトぶっ潰す
0579名無しさん@お腹いっぱい。
2010/03/22(月) 18:25:480580名無しさん@お腹いっぱい。
2010/03/22(月) 20:19:580581名無しさん@お腹いっぱい。
2010/03/22(月) 20:42:09一度zipで落としたのは何度も落とせるんだし
0582名無しさん@お腹いっぱい。
2010/03/22(月) 20:46:360583名無しさん@お腹いっぱい。
2010/03/22(月) 21:05:34これやるから向こうで遊んできなさい。
0584480
2010/03/22(月) 21:57:07>>572
えっ、なんか間違ったか?と思って確認してみたが、うちでは
落とせてる。
サーバー障害か経路障害でもあったかなあ?
他に落とせない人いますか?
>>570
ヒントありがとう。
でも、HTML::TreeBuilder は、標準モジュールじゃないんだ。
それ言ったら、LWP はどうなんだって話ですが、perl配布パッケージ
に付いてくる場合が多いからなんだけど。
0585名無しさん@お腹いっぱい。
2010/03/22(月) 22:25:40標準モジュールじゃないのは知ってるけど、
自分の入れた ActivePerl 5.10.1 Build 1007 (win)には最初からあったのでつかってみた。
入ってなかったら使ってない。
div と img に絞るなら自分でパースしてもそんなもんだと思うけど。
0587名無しさん@お腹いっぱい。
2010/03/22(月) 22:37:59450行: my ($p, $d, $i) = ($_[0], "dummy.html", 1) ;
は衝突回避を考えて
450行: my ($p, $d, $i) = ($_[0], "$p/dummy.html", 1) ;
の方がいいと思う。
というか、そもそもファイル出力しなくても…
0588480
2010/03/22(月) 22:56:59衝突回避は、考えていなかったです。
元のget.plに手を加えるのが、やっとの俺です。
ファイル出力はデバッグやりやすいって事で、これも元のままです。
次の修正案に生かしたいです。ありがとうです
0589名無しさん@お腹いっぱい。
2010/03/23(火) 00:10:45また仕様変わったのかな
0590名無しさん@お腹いっぱい。
2010/03/23(火) 00:18:450591名無しさん@お腹いっぱい。
2010/03/23(火) 00:30:42プログラマーの知識ないから使えん
俺もファイル落としたい
0592名無しさん@お腹いっぱい。
2010/03/23(火) 00:43:320593名無しさん@お腹いっぱい。
2010/03/23(火) 00:47:06ダメだあれ
意味わからん
0594名無しさん@お腹いっぱい。
2010/03/23(火) 01:01:29ブラウザでまず個別ギャラリーのページに移動
ブラウザのアドレス欄をコピー
コマンドプロンプトかターミナルで
perl -u "hentaiget "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s
を実行したら、hoge234.list なんてファイルが出来る。
もう一度コマンドプロンプトから、
perl -l "hoge234.list " を実行。
それなりに時間掛かるので覚悟してくれ。
ActivePerl 5.10.1はインストールしてるんだよな。それともLinuxか?
じゃなかったらそれを先にやっておくべし。
この説明で分からないなら、素養が無いのでおきらめてくれ。
0595名無しさん@お腹いっぱい。
2010/03/23(火) 01:10:02正 perl hentaiget -l "hoge234.list " を実行。
うっかりミスだゆるされよ
0596名無しさん@お腹いっぱい。
2010/03/23(火) 01:12:56誤 perl -u "hentaiget "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s
正 perl "hentaiget -u "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s
すまん、またポカやってた。
これでオK?
0597名無しさん@お腹いっぱい。
2010/03/23(火) 01:13:29先ほど作成したリストを元に、 -u を -s に変えてやってるけど
最初に -u -s にしておくと結果って違うのかい?
0598名無しさん@お腹いっぱい。
2010/03/23(火) 01:17:51は、リストファイルを作成したらストップする。
hentaiget -l "hogehogehoe"
で、画像の取り出し option -s をこれにつけても意味がない。
0599名無しさん@お腹いっぱい。
2010/03/23(火) 01:19:580600名無しさん@お腹いっぱい。
2010/03/23(火) 01:20:180601名無しさん@お腹いっぱい。
2010/03/23(火) 01:24:42最初からつかるか、すべての処理が終わってからフォルダー名を
リネームするかの違いだから。好きにして
0602名無しさん@お腹いっぱい。
2010/03/23(火) 01:25:460603名無しさん@お腹いっぱい。
2010/03/23(火) 03:06:21ダウンロードはじまらねーぞ
嘘つくんじゃねーよ
内部コマンドまたは外部コマンド、操作可能なプログラム
またはバッチ ファイルとして認識されていませんって
拒否されんじゃねーか
0604名無しさん@お腹いっぱい。
2010/03/23(火) 03:09:120605名無しさん@お腹いっぱい。
2010/03/23(火) 07:47:31さっさとperlインストールしやがれこの野郎
話はそれからだ
0606名無しさん@お腹いっぱい。
2010/03/23(火) 07:55:25コテハンつけてくれ。
0607名無しさん@お腹いっぱい。
2010/03/23(火) 07:55:59get.plがある場所をカレントにすることも知らねぇんじゃないか?
コマンドプロンプトの基礎知識つけてreadme嫁
プログラマーの知識(笑)なんざいらねぇよ
ttp://www5f.biglobe.ne.jp/~ayum/command/command.html
get.pl使えるようになったら、さっさと消えてくれ
0608名無しさん@お腹いっぱい。
2010/03/23(火) 09:50:26板違いってことでいいんじゃなかろうか…
0609名無しさん@お腹いっぱい。
2010/03/23(火) 10:50:30>>603の無能っぷりと釣りっぷりと来たら(ry
0610名無しさん@お腹いっぱい。
2010/03/23(火) 11:16:52一瞬ここが何板だか確認してしまったよ
0611名無しさん@お腹いっぱい。
2010/03/23(火) 11:29:07検索で飛んでくる奴が多いのかな?
0612名無しさん@お腹いっぱい。
2010/03/23(火) 11:58:22Not found image address. Check dummy.html file.
と出て止まっちまう・・・・
0613名無しさん@お腹いっぱい。
2010/03/23(火) 12:05:13情報は、具体的に出した方がいいよ
どのページの何番目の画像とか
検証出来ないからね
0614名無しさん@お腹いっぱい。
2010/03/23(火) 15:16:43なんか説明みたいなのが表示されてlistが見あたらないんだけど
0615名無しさん@お腹いっぱい。
2010/03/23(火) 15:30:40listファイルはカレントにできるよ
>>612ではないんだけど、
http://g.e-hentai.org/g/207441/ad8546db23/
の八枚目とかが
Not found image address. Check dummy.html file.
になっちゃうな…
0616名無しさん@お腹いっぱい。
2010/03/23(火) 16:48:360617名無しさん@お腹いっぱい。
2010/03/23(火) 17:01:52http://ja.wikipedia.org/wiki/%E3%82%AB%E3%83%AC%E3%83%B3%E3%83%88%E3%83%87%E3%82%A3%E3%83%AC%E3%82%AF%E3%83%88%E3%83%AA
http://www.perl.org/
0619480
2010/03/23(火) 17:47:16改定バージョンですが、直ったかどうかまだ未確認です。
一応手元では、ダウン出来ているようです。
原因は二重チェックでアドレス確認に嵌まりました。
よけいな事しなけりゃよかった
>>587さんのファイル衝突回避を取入れました。
0620480
2010/03/23(火) 17:48:140622名無しさん@お腹いっぱい。
2010/03/23(火) 18:38:16スクリプトじゃなくてツールで出せよツールで
0623480
2010/03/23(火) 18:45:04動くから、まあいいか
get.pl(hentaiget)のメッセージで
Not found image address. Check dummy.html file.
場合は、もう一つ原因があります。
プロキシサーバーが、接続先サイトを何らかの理由でブロックしている場合です。
この場合は、リストファイルを指定してプログラムを再スタートすれば、次の
プロキシが使われます。
それでもダウンしない場合は、プログラムミスかe-hentaiの仕様が変ったのどちらかです。
0624名無しさん@お腹いっぱい。
2010/03/23(火) 19:03:27[居酒屋よっちゃん] 二次の園オールスター DX1 (同人CG集)をげっt
thx
0625名無しさん@お腹いっぱい。
2010/03/23(火) 19:04:500626名無しさん@お腹いっぱい。
2010/03/23(火) 19:25:120627名無しさん@お腹いっぱい。
2010/03/23(火) 19:29:170628名無しさん@お腹いっぱい。
2010/03/23(火) 19:38:470629名無しさん@お腹いっぱい。
2010/03/23(火) 19:48:20さすがお客さんは違うな
0630名無しさん@お腹いっぱい。
2010/03/23(火) 20:27:150631名無しさん@お腹いっぱい。
2010/03/23(火) 23:09:08開発者どものオナニーで盛り上がってんじゃなくて
一般にも普及させろ
じゃないと放流も増えない
0632名無しさん@お腹いっぱい。
2010/03/24(水) 00:04:310633名無しさん@お腹いっぱい。
2010/03/24(水) 00:13:40E-hentaiというサイトなんて簡単に潰せるということを
知っておいてほしい
0634名無しさん@お腹いっぱい。
2010/03/24(水) 00:25:570635名無しさん@お腹いっぱい。
2010/03/24(水) 00:32:12そうすりゃ馬鹿は会話に参加することすらできなくなる。
↓じゃまず一人目
0636名無しさん@お腹いっぱい。
2010/03/24(水) 00:32:290637名無しさん@お腹いっぱい。
2010/03/24(水) 00:39:090638名無しさん@お腹いっぱい。
2010/03/24(水) 00:48:142-chというサイトなんて簡単に潰せるということを
知っておいてほしい
0639名無しさん@お腹いっぱい。
2010/03/24(水) 01:23:14取りあえず、アンジェリーナ・ジョリーを連続ダウンロード
1122ダウンロードできた。
あれ、インデックスに書いて有る1139より少ない。
エラー処理さぼってるので、サーバーにうまく繋がらなかった場合は
スキップさせてるからだろう。
でも、ダウン出来た者に破損は見当たらない。まずまずである。
0640名無しさん@お腹いっぱい。
2010/03/24(水) 01:29:49同名のファイルを上書きしていて泣いたことならちらほら
0641名無しさん@お腹いっぱい。
2010/03/24(水) 01:37:150642639
2010/03/24(水) 13:31:49取りあえず貼付けてみた
間違いあったら指摘よろしく
0643名無しさん@お腹いっぱい。
2010/03/24(水) 15:33:20完全他力本願な100%サルのオイラでも
ナタリーポートマンの画像386枚一気に落とせた。
ファイル名の桁数も自動で揃えてくれると完璧だけど、
これ以上の贅沢は言いません。感謝感激雨霰。
0644名無しさん@お腹いっぱい。
2010/03/24(水) 17:30:10GUIが無理なら、ド級初心者でもできるような解説ページでもorz
0645名無しさん@お腹いっぱい。
2010/03/24(水) 17:45:410646名無しさん@お腹いっぱい。
2010/03/24(水) 17:50:440647名無しさん@お腹いっぱい。
2010/03/24(水) 22:18:100648名無しさん@お腹いっぱい。
2010/03/24(水) 23:00:35何が問題なんだ?
0649名無しさん@お腹いっぱい。
2010/03/24(水) 23:39:12最近e-henがgzipになったけどそれかな?
↓のページから サンプルプログラムを実行する っていうリンク踏んで
http://www.kawa.net/works/perl/contenc/gzip-test.html
CGI実行させてYESって出なければ駄目っぽいね
設定いじくって駄目ならソニーにgzip-1.4入れてくださいってメールするしか
0650名無しさん@お腹いっぱい。
2010/03/25(木) 00:09:31sub saveimageサブルーチンの以下に変更すれば名前の桁は揃う。
if ( $add =~ m|/¥d+_([a-zA-Z]+?)¥d+_.*(¥.[a-zA-Z]{3,})$| ) {
$name = ( sprintf "%04d_", $number++ ) . $1 . $2;
んが、わざわざサーバーと一緒の名前にしてるって事は、ダウンミスを
発見しやすくするためじゃね?
0651名無しさん@お腹いっぱい。
2010/03/25(木) 04:39:100652名無しさん@お腹いっぱい。
2010/03/25(木) 07:32:49Can't open perl script "hentaiget -u "http://g.e-hentai.org/g/420624/2c12345d24dc/" -s": Invalid argument
って出るorz
どなたかご教授お願いします。
0653名無しさん@お腹いっぱい。
2010/03/25(木) 07:47:43それとエラーメッセージくらい理解出来るようにしたら?
0654名無しさん@お腹いっぱい。
2010/03/25(木) 08:05:50get.pl -u http://g.e-hentai.org/g/139479/439ab3d366/を入れても
何も出てこないしlistもできません
get.pl -u http://g.e-hentai.org/g/139479/439ab3d366/や
http://g.e-hentai.org/g/420624/2c12345d24dc/が仮定のurlかと思って
適当なの試してみたけど駄目だったorz
0655名無しさん@お腹いっぱい。
2010/03/25(木) 09:22:160656名無しさん@お腹いっぱい。
2010/03/25(木) 09:41:590657名無しさん@お腹いっぱい。
2010/03/25(木) 11:18:18凄いねget.pl
0658名無しさん@お腹いっぱい。
2010/03/25(木) 13:04:29なにその「冷やし中華 始めました」感
0659名無しさん@お腹いっぱい。
2010/03/25(木) 14:36:35ダウソ板にでも立てればどうよ?ここも静かになりそうだし
0660名無しさん@お腹いっぱい。
2010/03/25(木) 14:47:25【Berry】画像掲示板巡回ソフトその3【moeBBS他】
http://pc12.2ch.net/test/read.cgi/software/1258700085/
0661名無しさん@お腹いっぱい。
2010/03/25(木) 18:11:54なんとかreadmeを読み解いて
使えるようになったよ。・・・・・相当時間かかちゃったけど・・。
0662名無しさん@お腹いっぱい。
2010/03/25(木) 21:21:21俺も検索から来てプロンプトもperlも知らなくて一時は投げてたんだけど
最近ググってやってみたら使えるようになってすごく重宝してる
チラ裏スマソ
0663名無しさん@お腹いっぱい。
2010/03/25(木) 22:26:250664名無しさん@お腹いっぱい。
2010/03/25(木) 22:30:04狭いコミュニティー作りが好きなのか知らんけどさ
0665名無しさん@お腹いっぱい。
2010/03/25(木) 23:15:38自作のスクリプトにわざわざreadmeつけてる時点でかなりわかりやすいだろ
というかちゃんと使い方書いてあるだろ。お前がUNIXを知らないだけ
0666名無しさん@お腹いっぱい。
2010/03/25(木) 23:30:400667名無しさん@お腹いっぱい。
2010/03/25(木) 23:49:52どこで迷うんだ
0668名無しさん@お腹いっぱい。
2010/03/25(木) 23:51:140669名無しさん@お腹いっぱい。
2010/03/25(木) 23:57:13この辺では言いだしっぺの法則ってのがあるんだよ。
0670名無しさん@お腹いっぱい。
2010/03/26(金) 15:37:51実行されるけど何も取得できないんだけど
0671名無しさん@お腹いっぱい。
2010/03/26(金) 15:47:32get.pl → winhentaiget
つかreadme2.txtに書いてあるだろ
0672名無しさん@お腹いっぱい。
2010/03/26(金) 15:48:00ただのテキストだし、自作でおk
なにが「いいの?」とかイミフだけど
リドミでも読んでくれ
0673名無しさん@お腹いっぱい。
2010/03/26(金) 20:02:32そうなんだけれども、
たぶんそういう輩は、リドミなんて読むのメンドクサとか、
何も見なくても GUI でおkみたいなのがほしいだと思う。
0674名無しさん@お腹いっぱい。
2010/03/26(金) 22:46:510675名無しさん@お腹いっぱい。
2010/03/27(土) 01:48:27今のままで十分、変なのが押し寄せて今以上に仕様変更とか頻繁に来られても困る
0676480
2010/03/27(土) 02:14:06と言う技術情報の交換場所みたいな所だったわけで。
俺が、安易にプロクシバージョンを出した為に、厨房を呼び寄せた
のだと思う。
反省しております。><
これからは、安易にバージョンアップしない事にするよ。
修正個所の情報のみでもよさそうだし。
自分で気ままに修正すればいいしね。
それに、出来てる人には要らない物だし。
0677名無しさん@お腹いっぱい。
2010/03/27(土) 02:21:56そういうのはよその板で。
0678名無しさん@お腹いっぱい。
2010/03/27(土) 03:28:41最近、e-hentaiを見ると画像が表示されなくて509と出るんだけど
どうしたらいいんでしょうか?
0679名無しさん@お腹いっぱい。
2010/03/27(土) 05:19:24>>260
スレ内検索ぐらいしようぜ
0680名無しさん@お腹いっぱい。
2010/03/27(土) 06:59:27アク禁になる覚えないんだけどなぁ
もう二週間くらい509がでてる
対策とかないの?
0681名無しさん@お腹いっぱい。
2010/03/27(土) 13:31:55lofiから入ると画像は見れないこともない。
いつもながらHentaiには詰めの甘い所がある。
0682480
2010/03/27(土) 20:12:25http://www1.axfc.net/uploader/Sc/so/97171.zip
タイポ修正,readme2.txtをもうちょっと親切に改定
getproxylist.plの改行コードを、winな方向けに変換した
wingetproxylist.plを同梱しました。
前回アップした物と基本的に変りは、ありませんので
すでにダウンされた方には、必要有りません。
一週間の期間限定公開バージョンです。
キーワードは、もう言わないw
不具合が有ったら改良して下さい。
それでわノシ
0683名無しさん@お腹いっぱい。
2010/03/28(日) 00:07:51いつ解除されるのかな
何か対策とかないの?
教えてくれ
0684名無しさん@お腹いっぱい。
2010/03/28(日) 00:10:28おめーらさっさとやめれや
気持ちわりー
0685名無しさん@お腹いっぱい。
2010/03/28(日) 01:32:30そう言われるあなた様は何しに来たのでしょうか?
0686名無しさん@お腹いっぱい。
2010/03/28(日) 03:12:02思ったんだけど、日本人の利用者多いよね
漫画など翻訳されてないし
509とかよくわからないけど、今は使いにくくなってるの?
それって…このスレのせいなんじゃ…
というか509の対策教えて!
見れなくて嫌!
0687名無しさん@お腹いっぱい。
2010/03/28(日) 07:36:38凹みすぎて被害妄想気味だな。
日本語が多いのは漫画の類のネタが日本に圧倒的に多いものの
翻訳する人間が少ないからだと思うが。人より早く上げなきゃという
心理もあるだろうからとりあえずスキャンするだけなんだろうね。
日本人は、2chは特別だなんて思わないことだ。ニュースとフォーラムが
あるから覗いてごらん。自分で頑張った量だけ情報が得られる。
0688名無しさん@お腹いっぱい。
2010/03/28(日) 09:24:330689名無しさん@お腹いっぱい。
2010/03/28(日) 09:52:520690名無しさん@お腹いっぱい。
2010/03/28(日) 15:42:470691名無しさん@お腹いっぱい。
2010/03/28(日) 15:50:330692名無しさん@お腹いっぱい。
2010/03/28(日) 15:51:01落とせました、ありがとうございます
0693名無しさん@お腹いっぱい。
2010/03/28(日) 17:28:39>>687って外人?
登録してフォーラムで発言するとポイント…だっけ
面倒だなぁ
じゃあ、サムネイルのページは実質サンプルみたいなものじゃん
0694名無しさん@お腹いっぱい。
2010/03/28(日) 18:11:20このスレに来るといる事は、エロい人
そして少々説教臭い事を言うのが、若者でない証拠
それから導かれる答は
たぶん日本人で若くないエロい人
0695名無しさん@お腹いっぱい。
2010/03/28(日) 18:51:09お前フォーラムのページ開いたこともないだろ。
せめてニュース位は斜めにでも読んどけな。
特に今のは読んどいて損はない。てか皆も読め。
言ってる意味がわかるから。
0696名無しさん@お腹いっぱい。
2010/03/28(日) 19:02:32ありがとうございます
ありがとうございます
0697名無しさん@お腹いっぱい。
2010/03/28(日) 20:18:550698名無しさん@お腹いっぱい。
2010/03/28(日) 20:41:07E-Hentai Downloader
ttp://booru.hepmuzik.net/
0699名無しさん@お腹いっぱい。
2010/03/28(日) 21:50:10アグネスみたいな連中がE-hentaiの広告主に掛け合ったせいで
ロリショタケモを規制しないといけなくなったって話だね
0700名無しさん@お腹いっぱい。
2010/03/28(日) 21:55:24確かに読み直してみるとかなり説教臭いな。
ログも採らない、採っても読まない、読んでも読み取れない若い連中を
普段から相手にしてるんでこんな風になっちまったんだ。勘弁してくれ。
俺も英語は苦手だが欧州の自動車屋を相手にしてるもんで読み方位は
覚えた。
今日のニュースの要点をかいつまむと、
・ロリショタとか獣姦のタグやギャラリーをフィルタリングしましたよ。
・Lofiバージョンを用意しましたよ。
・トレントって素敵,etc,...
ってところだ。
このうちLofiは(今時点で)横幅が最大980ピクセルにリサイズされるそうな。
#フロントページに"Lo-fi Version"ってリンクが出てるけど君ら気が付きも
#しないんだろうな。
0701名無しさん@お腹いっぱい。
2010/03/28(日) 21:57:09これを見ると検索でタグのフィルタリングはされているもののメインページでは
見えないギャラリーも見える。これは>>674に書いたが、今になって思うに運営サイドが
忘れたわけじゃなく、スポンサーからの圧力でメインにはフィルタリングを施したが
ユーザーの反感を恐れてワザと開けたままにした穴の気がする。
それは置いといて肝心なのは画像サーバが>>525で書いた(君らが『数字のサーバ』と
呼んでる奴)のもので、これってメインページでも帯域制限の制御がされていないもの
ばかりなんだ。これもログを横に並べたり縦に並べて眺めるとわかるんだけどさ。
#ついでにおじさんは"?nl1"はかなり勿体無い対処だと思うんだがどうだろう。
つまりサイズによって振り分ければ、あるいはサイズを気にしなきゃ509を気にせず
lofiから画像を参照し続けられるって状態が『今』ってこと。プロクシなんざ関係ない。
実際にエロいおじさんちでは分速5.5ページで18時間落とせたよ。もう落とすネタも
無くなってやめちゃったけどさ。
そして長々書いてすまなんだ。そしてこれに気が付いて敢えて黙ってた人には申し訳ない。
もう書かないよ。
0702名無しさん@お腹いっぱい。
2010/03/28(日) 21:59:37言ってるはじから書いちゃったがアンカーミス。
>>674じゃなくて>>681。
0703名無しさん@お腹いっぱい。
2010/03/28(日) 22:35:190704名無しさん@お腹いっぱい。
2010/03/28(日) 23:46:490705名無しさん@お腹いっぱい。
2010/03/29(月) 01:20:59スポンサー、パトロン、おっかないね
まぁ、ビジネスだからしょうがないか…
ロリショタケモ規制の活動して飯食ってる連中いるのかな
0706名無しさん@お腹いっぱい。
2010/03/29(月) 02:35:43別にそんなこと無いのね…残念
0707名無しさん@お腹いっぱい。
2010/03/29(月) 04:21:470708名無しさん@お腹いっぱい。
2010/03/29(月) 07:10:390709名無しさん@お腹いっぱい。
2010/03/29(月) 13:58:54あーこいつはやられたかなと思ってたがやっぱりか…
まぁそのうちサイトが潰れるか日本からのアクセスの制限がかかるだろうとは予想してたけど
圧力で特定タグだけ潰されるとは
全部見れなくなったわけじゃないけどそれが逆にスッキリしなくて歯がゆいな
0710名無しさん@お腹いっぱい。
2010/03/29(月) 15:51:390711名無しさん@お腹いっぱい。
2010/03/29(月) 18:23:480712名無しさん@お腹いっぱい。
2010/03/29(月) 18:48:520713名無しさん@お腹いっぱい。
2010/03/29(月) 19:08:020714名無しさん@お腹いっぱい。
2010/03/29(月) 21:42:18すべてのページが飛ばされるページになってるわけじゃないのね
大ページはクッキー食わせてれば大のまま?かな
0715名無しさん@お腹いっぱい。
2010/03/30(火) 06:07:040716名無しさん@お腹いっぱい。
2010/03/30(火) 06:54:580717名無しさん@お腹いっぱい。
2010/03/30(火) 08:33:10って出て止まっちまう画像があるな・・・・
0718名無しさん@お腹いっぱい。
2010/03/30(火) 13:23:55>>613
0719名無しさん@お腹いっぱい。
2010/03/30(火) 22:22:150720名無しさん@お腹いっぱい。
2010/03/31(水) 05:54:36プロキシはどのくらいの間隔で変わるようになってるんでしょうか?
プロキシファイルは読み込めてるっぽいですが先頭のプロキシから次に行かない?です
0721名無しさん@お腹いっぱい。
2010/03/31(水) 05:59:520722名無しさん@お腹いっぱい。
2010/03/31(水) 11:10:53帯域制限か接続エラー三回で、次のプロクシを使うよ
プロクシファイルを編集すれば、お好きなプロクシを
順番に試してくれるよ
0723名無しさん@お腹いっぱい。
2010/03/31(水) 12:44:590724名無しさん@お腹いっぱい。
2010/03/31(水) 13:02:390725名無しさん@お腹いっぱい。
2010/03/31(水) 14:47:33>>722
サンクス、確かに後で変わってた
0726名無しさん@お腹いっぱい。
2010/03/31(水) 15:09:09でもgの方で強制転送ページが来たら、lofiの/3/を調べて取るしかない。
0727名無しさん@お腹いっぱい。
2010/03/31(水) 15:19:06紹介されていたよ
http://s-io.dyndns.tv/up/1/_/jump/1269758101.txt/attatch
PASS:game
0728名無しさん@お腹いっぱい。
2010/03/31(水) 15:47:090729名無しさん@お腹いっぱい。
2010/03/31(水) 16:18:17なんか懐かしすぎて泣ける
0730名無しさん@お腹いっぱい。
2010/03/31(水) 16:23:370731名無しさん@お腹いっぱい。
2010/03/31(水) 16:45:090732名無しさん@お腹いっぱい。
2010/03/31(水) 16:49:320733名無しさん@お腹いっぱい。
2010/04/01(木) 03:39:010734名無しさん@お腹いっぱい。
2010/04/01(木) 03:52:53>>732
対応したって?
0735名無しさん@お腹いっぱい。
2010/04/01(木) 06:39:150736名無しさん@お腹いっぱい。
2010/04/01(木) 07:22:22>>701の言うところの「穴」を e-hentai が塞いだ、って意味だと思う。
ツールを改良して新仕様に対応させた、って意味ではないと思うよ。
0737736
2010/04/01(木) 07:26:43やっぱり後者の意味に読めてきた。まぁどうでもいいや。
0738名無しさん@お腹いっぱい。
2010/04/01(木) 07:43:09検索クエリに "loli" があると弾いているみたいだから
"lol" や "con" だとhitするみたいね。
当然検索精度は幾分落ちる(余計なものまでhitする)けど。
0739名無しさん@お腹いっぱい。
2010/04/01(木) 07:47:130740名無しさん@お腹いっぱい。
2010/04/01(木) 10:15:490741名無しさん@お腹いっぱい。
2010/04/01(木) 11:00:07ページ規制はかかってるぽい
gの画像鯖のurlが短く&http//IP:ポートになった
規制とかはシラネ
0742名無しさん@お腹いっぱい。
2010/04/01(木) 12:35:53これ暗号化解けた香具師どれくらいいるの?
復号出来ずに釣られたとかいう香具師って情弱なわけ?w
0743名無しさん@お腹いっぱい。
2010/04/01(木) 12:36:59死すプリとか懐かしいな
0744名無しさん@お腹いっぱい。
2010/04/01(木) 17:50:17エロシーンが200ページあるなかで6〜7ページあるだけじゃねーか
うっあぜぇえええ
0745名無しさん@お腹いっぱい。
2010/04/02(金) 04:05:10Not found image address. Check dummy.html file
ってなっちまう。
サイトの仕様変わった?
0746名無しさん@お腹いっぱい。
2010/04/02(金) 05:32:120747名無しさん@お腹いっぱい。
2010/04/02(金) 17:43:180748名無しさん@お腹いっぱい。
2010/04/02(金) 22:53:080%から進まないな
対策済みって事かね?
0749名無しさん@お腹いっぱい。
2010/04/02(金) 23:46:16ずっと残ってるわけじゃないんだな
0750名無しさん@お腹いっぱい。
2010/04/03(土) 00:05:100751名無しさん@お腹いっぱい。
2010/04/03(土) 00:23:310752名無しさん@お腹いっぱい。
2010/04/03(土) 01:07:100753名無しさん@お腹いっぱい。
2010/04/03(土) 02:01:42ここが一番E-hentaiというサイトについて
2ちゃんで一番熱くレス交換されてるスレだからしゃーない
0754名無しさん@お腹いっぱい。
2010/04/03(土) 03:19:100755名無しさん@お腹いっぱい。
2010/04/03(土) 09:44:310756名無しさん@お腹いっぱい。
2010/04/03(土) 11:05:55sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ( $ofn ) = @_;
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach my $img_tag ($tree->find("img")) {
my @div_tag = $img_tag->look_up('_tag' => 'div');
if(scalar(@div_tag) == 1){
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
my $returlimgname = $img_tag->attr('alt');
$tree->delete;
return($returlimg, $returlimgname);
}
}
$tree->delete;
return "";
}
HTML::TreeBuilderがない?そんなの知らん。
0757名無しさん@お腹いっぱい。
2010/04/03(土) 14:03:550758名無しさん@お腹いっぱい。
2010/04/03(土) 20:43:480759名無しさん@お腹いっぱい。
2010/04/03(土) 21:47:070760名無しさん@お腹いっぱい。
2010/04/03(土) 22:14:380761名無しさん@お腹いっぱい。
2010/04/04(日) 03:52:27無論俺は後者。
0762名無しさん@お腹いっぱい。
2010/04/04(日) 04:26:44これつかいかたおしえろ!>>761
0763名無しさん@お腹いっぱい。
2010/04/04(日) 04:27:26>>762
w
0764名無しさん@お腹いっぱい。
2010/04/04(日) 17:10:130765名無しさん@お腹いっぱい。
2010/04/04(日) 18:28:380766名無しさん@お腹いっぱい。
2010/04/04(日) 19:21:08つまんね
0767名無しさん@お腹いっぱい。
2010/04/04(日) 20:25:57http://maniax.dlsite.com/work/=/product_id/RJ052315.html
0768名無しさん@お腹いっぱい。
2010/04/04(日) 21:59:260769名無しさん@お腹いっぱい。
2010/04/04(日) 23:01:030770名無しさん@お腹いっぱい。
2010/04/04(日) 23:37:270771名無しさん@お腹いっぱい。
2010/04/04(日) 23:54:270772名無しさん@お腹いっぱい。
2010/04/07(水) 03:28:48スレの勢いのなさ
ロリばっかだったのかこのスレ
0773名無しさん@お腹いっぱい。
2010/04/07(水) 05:08:490774名無しさん@お腹いっぱい。
2010/04/07(水) 14:05:260775名無しさん@お腹いっぱい。
2010/04/07(水) 18:35:00また仕様変えやがったよE変態
ちんロダよりタチ悪いわ
まぁ著作ゴロ対策にはいいかもしれんがな
0776名無しさん@お腹いっぱい。
2010/04/07(水) 21:09:450777名無しさん@お腹いっぱい。
2010/04/07(水) 21:16:360778756
2010/04/07(水) 23:16:04試したら、普通に落とせたが?
せめて何が落とせなかったとか、エラーとかがあれば、
誰かが何かしてくれるかもしれない。
ソースしか書く気がないので、
説明とかファイル修正とかは他人に任せる。
0779名無しさん@お腹いっぱい。
2010/04/07(水) 23:33:26改良しちゃいなよ。
0780名無しさん@お腹いっぱい。
2010/04/08(木) 00:11:370781775
2010/04/08(木) 09:19:43改めて落とし直したら今度はうまくいったわ。
どうやら刺してた串が原因だったみたい。
あと上で「これつかいかたおしえろ!」と嘆いてる
かわいそうな人に教えてやる
get.plのsub scrapeimgurl(@) { 以降を書き換えればおk
0782名無しさん@お腹いっぱい。
2010/04/08(木) 14:36:110783名無しさん@お腹いっぱい。
2010/04/08(木) 18:17:350784名無しさん@お腹いっぱい。
2010/04/08(木) 20:41:15HTML::TreeBuildermのインスト?モジュールの更新?がわからん
http://search.cpan.org/~petek/HTML-Tree-3.23/lib/HTML/TreeBuilder.pm
ここまでは来れた誰か教えてエロイ人
0785名無しさん@お腹いっぱい。
2010/04/08(木) 20:57:08板違い。
Perlについての質問箱 43箱目
http://pc12.2ch.net/test/read.cgi/tech/1266565626/
0786名無しさん@お腹いっぱい。
2010/04/08(木) 23:44:19sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ( $ofn ) = @_;
my $size = ( -s $ofn );
my $content = "";
open( DM, "<", $ofn ) || die $!;
read( DM, $content, $size );
close ( DM );
$content =~ s/<img/¥n<img/g;
my @html = split /¥n/, $content;
my ( $retLink, $retName ) = ( "", "" );
my %tmp = ();
for ( @html ) {
$tmp{$1}++ if ( m|(<img src=".*?[a-f0-9]{40}-.*?" class=)| );
}
my $url = "";
while ( my ( $key, $val ) = ( each %tmp ) ) {
$url = $key, last if ( $val == 1 );
}
if ( $url =~ /src="(.*?)"/ ) {
( $retLink = $1 ) =~ s/&/&/g;
if ( $url =~ m{alt="(.+?)"} ) {
( $retName = $1 ) =~ tr/¥/ /_/d;
} else {
$retName = "unknown.jpg";
}
}
return ( $retLink, $retName );
}
0787名無しさん@お腹いっぱい。
2010/04/09(金) 00:04:43『サーバの運用費が掛かるわりに寄付してくれる人が少ないんだよ。
だから比率的に広告主の発言力が増して今回みたいに言うこと聞かなきゃならないんだ。
自由にやるにはもっと金がいるんだ。ちゃんとユーザー登録してくれよ。メール送るからさ。
お前らタダ読みなんてモラル低いぞ』だってさ。
やっぱモラルは大切だよねぇ。
0788名無しさん@お腹いっぱい。
2010/04/09(金) 00:15:03誰でも思いつく変化はOKなの?
0789名無しさん@お腹いっぱい。
2010/04/09(金) 00:42:36そこまで正規表現にこってもしょうがない気がする。
変更が、あったらサックと直せばいいし。
<( |)img(¥t|)=....やってられん。可能性を探せば無数に有る。
0790名無しさん@お腹いっぱい。
2010/04/09(金) 01:05:06政権交代じゃなく、利権交代なんだし
0791名無しさん@お腹いっぱい。
2010/04/09(金) 01:16:170792名無しさん@お腹いっぱい。
2010/04/09(金) 01:17:14ごめん
0793756
2010/04/09(金) 04:33:19ちなみこれはhtmlの大文字小文字とかスペースとか軽微な変更なら無問題。
sub scrapeimgurl(@) {
# make each image's url from a thumbnail page.
my ( $ofn ) = @_;
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new_from_file($ofn);
$tree->eof();
foreach my $img_tag ($tree->find("img")) {
my @div_tag = $img_tag->look_up('_tag' => 'div');
if(scalar(@div_tag) == 1) {
(my $returlimg = $img_tag->attr('src')) =~ s/&/&/g;
my $returlimgname = 'unk' . time . '.jpg';
if(defined($img_tag->attr('alt'))) {
$returlimgname = $img_tag->attr('alt');
$returlimgname =~ s/\s/_/g;
$returlimgname =~ tr/\\\/:*?"<>|/_/;
}
$tree->delete;
return($returlimg, $returlimgname);
}
}
$tree->delete;
return "";
}
0794名無しさん@お腹いっぱい。
2010/04/09(金) 23:29:440795名無しさん@お腹いっぱい。
2010/04/09(金) 23:42:340796名無しさん@お腹いっぱい。
2010/04/10(土) 08:57:37頑張ってください。
0797名無しさん@お腹いっぱい。
2010/04/10(土) 22:34:02403の画像が時々落ちてきて煩わしい。。 何か対策不足なのだろうか?
教えてエロイ人><
0798名無しさん@お腹いっぱい。
2010/04/10(土) 22:57:10誰かちゃんと動く最新版まとめておくれよぅ。
0799名無しさん@お腹いっぱい。
2010/04/10(土) 22:57:49400が出るってことね。
0800名無しさん@お腹いっぱい。
2010/04/10(土) 23:42:15それ多分、サーバーに存在しないファイルにアクセスしようとしてる。
文字参照あたりかも?
>>798
400エラー出てないな。少々改造したget.plだけど。改造する前も見た事ないな。
0801名無しさん@お腹いっぱい。
2010/04/11(日) 00:27:16で、上で書かれてる関数に入れ替えたら400エラーが出るようになったんだよ。
つまり、修正された関数を使うための何かが足りてないような気がするんだ。
0802名無しさん@お腹いっぱい。
2010/04/11(日) 00:37:31試しに、get.plv10.95に、>>786のパッチ当ててみた。
これと言ったエラーも出ずにダウン出来てます。
0803名無しさん@お腹いっぱい。
2010/04/11(日) 01:12:280804名無しさん@お腹いっぱい。
2010/04/11(日) 01:27:40ご理解とご協力お願いを致します。
アルゴリズムの意見交換や、一部コード晒しによる意見交換は、大いにやりましょう。
0805名無しさん@お腹いっぱい。
2010/04/11(日) 01:29:32それはそうと、最新版の再うpを誰かおながいします。
今調べたらボクのversion 1.1.1でした。テヘ。
0806名無しさん@お腹いっぱい。
2010/04/11(日) 01:32:00死ね消えろ
0807名無しさん@お腹いっぱい。
2010/04/11(日) 01:32:39わからない奴はシラネならいいけど(勉強すれば追いつける)、
最新版が既にDLできない状態でそういう置いてきぼりはないんでない?
0808名無しさん@お腹いっぱい。
2010/04/11(日) 01:34:02壁にぶち当たったり飽きたりして開発・または意見できる奴が減ったらそれまでじゃないか。
0809名無しさん@お腹いっぱい。
2010/04/11(日) 01:40:43以前、パイソン・ルビー・PHPで作ってる人が居たんだから。
みんな気軽にトライしろよ。スクリプトの作成くらい。
ここ何板と思ってんだ。くれくれなら帰れ。
0810名無しさん@お腹いっぱい。
2010/04/11(日) 01:42:39ってのもありじゃないか。ここは先導者として後に続くものの道を
作ってやるもの一つなんじゃないかな。
0811名無しさん@お腹いっぱい。
2010/04/11(日) 01:54:36あなたの持っているバージョンが、オリジナルget.pl最新版だと思われます。
0812名無しさん@お腹いっぱい。
2010/04/11(日) 02:22:20よし君が先導者だまかせたぜ
0813名無しさん@お腹いっぱい。
2010/04/11(日) 02:36:28いやいや派生版最新をよこせってことですよー
0814名無しさん@お腹いっぱい。
2010/04/11(日) 03:09:540815名無しさん@お腹いっぱい。
2010/04/11(日) 08:23:06正しいリンクの中に時々amp;って含まれてるから削ってアクセスしてみるといいよ
自作ツールでなく一般のブラウザでテストして自作ツールに反映してみるといい
0816名無しさん@お腹いっぱい。
2010/04/11(日) 09:18:29オレ様ルールふりかざしてんじゃねーよボケクズ
史ねやゴミ
自治厨は巣窟にとっととカエレ
0817名無しさん@お腹いっぱい。
2010/04/11(日) 09:46:07ただしくは'&'の記号はアンパサント(Ampersand)と読んでHMLの文法上は
意味のある特殊文字なので、だたの&は"&"と記述する。
他にも ">" とか """ とかあるからさ。
ちなみに '&' は "&" じゃなく "?" とも書けることをお忘れなく。
php なら htmlspecialchars_decode() が手っ取り早い。
0818名無しさん@お腹いっぱい。
2010/04/11(日) 09:49:11>>815
ただしくは'&'の記号はアンパサント(Ampersand)と読んでHMLの文法上は
意味のある特殊文字なので、だたの&は"&apm;amp;"と記述する。
他にも "&apm;gt;" とか """ とかあるからさ。
ちなみに '&' は "&" じゃなく "&" とも書けることをお忘れなく。
php なら htmlspecialchars_decode() が手っ取り早い。
0819名無しさん@お腹いっぱい。
2010/04/11(日) 09:51:170820名無しさん@お腹いっぱい。
2010/04/11(日) 09:53:010821名無しさん@お腹いっぱい。
2010/04/11(日) 09:55:54仮想OSでロケットマウス使って保存の自動化して
アナログ的な方法でやってる俺ガイル
0822名無しさん@お腹いっぱい。
2010/04/11(日) 11:30:30オリジナル get.pl ver. 1.1.1
派生版 get.pl ver. 1.0.95 (プロクシ対応版)
上記のどちらでも現在の e-hentai はダウンロード出来ない。
プロクシ版へのパッチ投稿 >>756,786,793
オリジナルおよび派生版の投稿者による最新バージョンは、今のところ出てない。
アップすんな派とくれくれ派が対立 傍観者は呆れてる アナログ派は我関せず。
0823名無しさん@お腹いっぱい。
2010/04/11(日) 12:41:00作り上げて悦に入ると次は人にも見て貰いたくなる。
初めは「ウムウム,コレヲサズケテシンゼヨウ」で良いんだけれどそのうち
「ワカンネオシエロ!シヨーヘンコー!ツギハマダ?ハヤク!!」と何度も言われて面倒に
なるんだよね。
バトンを受けとるルーキーがいそうなもんだけど今人材不足。
育てる気のあるヤツもいないだろうけどさ。
0824名無しさん@お腹いっぱい。
2010/04/11(日) 12:50:15本家に遠慮したんだろうか?
オリジナル版は、まだダウンロード出来るよ。
0825名無しさん@お腹いっぱい。
2010/04/11(日) 14:08:390826名無しさん@お腹いっぱい。
2010/04/11(日) 14:29:170827名無しさん@お腹いっぱい。
2010/04/11(日) 16:28:270828名無しさん@お腹いっぱい。
2010/04/11(日) 16:47:30Escキー飛ばしちゃったのが>>825か。
0829名無しさん@お腹いっぱい。
2010/04/11(日) 17:39:05ダウンロードできても動かない上にモジュールの
更新も適用できないんだから全く意味ないだろ
0830名無しさん@お腹いっぱい。
2010/04/11(日) 18:01:40ダウンロード出来ると書いて有るだけだぞ
動くとかパッチ適用出来るとか、書かれてないだろ おk?
0831名無しさん@お腹いっぱい。
2010/04/11(日) 18:05:39おおおほんとだ。まったく気付かなかった・・・。
同じページでも時間によって画像サーバが変わるんだな。
URLが変わってることにすら気づいてなかったよ。
>>818
C#だからHttpUtility使って対処しました。
thx!
0832名無しさん@お腹いっぱい。
2010/04/11(日) 18:13:360833名無しさん@お腹いっぱい。
2010/04/11(日) 19:26:40死ねよ
0834名無しさん@お腹いっぱい。
2010/04/11(日) 19:34:25lofiでもあえてgでアクセスした方がええぞ。消えてないのもあるし。
lofiの/3/でとっても画像大きいけど画質粗いから。
目次なしでfile not found来たらおしまいだけど。
0835名無しさん@お腹いっぱい。
2010/04/11(日) 20:02:24そして今人間として非常に大事なものを失ってるぞ。
自分を見つめ直せ。心の底からそう感じるから言うんだ。
0836名無しさん@お腹いっぱい。
2010/04/11(日) 20:58:230837名無しさん@お腹いっぱい。
2010/04/11(日) 21:12:45こうやってスレは荒れるのか
DIYの精神なんかはどっかに吹っ飛んだみたいだな
スクリプトも書けない情弱乞食は乞食らしくすっこんでろ
一生表に出てくんな
プゲラwww
0838名無しさん@お腹いっぱい。
2010/04/11(日) 21:20:32派生最新版をくれたら黙るから勘弁してくだしあ。
0839名無しさん@お腹いっぱい。
2010/04/11(日) 21:21:45ここに書き込むにはファイルが足りない。
とここで絶望の淵に颯爽と現れたイケメンが
↓
0840名無しさん@お腹いっぱい。
2010/04/11(日) 21:26:04以前もまともな口調で書き込んだかと思うと間髪いれずに別の人格になってるだろう。
ネットで掲示板で2chだからとはいえ理解し難いんだ。大事にならなきゃ良いが。
ちなみにプゲラとWもちょっとな...
0841名無しさん@お腹いっぱい。
2010/04/11(日) 21:55:39あ?てめ何様だこら
さっさと死ねよ
0842名無しさん@お腹いっぱい。
2010/04/11(日) 21:57:042chに来るな
嫌なら見るな
0843名無しさん@お腹いっぱい。
2010/04/11(日) 21:59:060844名無しさん@お腹いっぱい。
2010/04/11(日) 22:14:370845756
2010/04/11(日) 22:32:17GPLなんだし誰か配布したらいいのに。
しかし、まあ、世の中、平和だ。
0846名無しさん@お腹いっぱい。
2010/04/11(日) 22:47:58ここは、アホのサポートをする為のスレじゃないので
0847名無しさん@お腹いっぱい。
2010/04/11(日) 22:57:45おおっぴらに配ると営業妨害かなんかで向こうから訴えられるんじゃね?
0848名無しさん@お腹いっぱい。
2010/04/11(日) 23:27:14てめえがしろくず
そして↑死ね
0849名無しさん@お腹いっぱい。
2010/04/11(日) 23:34:31もしくは本家から変更した差分を列挙してくれるだけでもいいよぉ
0850名無しさん@お腹いっぱい。
2010/04/11(日) 23:34:500851名無しさん@お腹いっぱい。
2010/04/11(日) 23:37:550852名無しさん@お腹いっぱい。
2010/04/11(日) 23:39:06体中を光の速さで駆け巡って回収する、絶対にだ
0853名無しさん@お腹いっぱい。
2010/04/11(日) 23:59:020854名無しさん@お腹いっぱい。
2010/04/12(月) 00:12:51タンカも切れねぇ座敷犬じゃねえか。使えねぇな全く。
0855名無しさん@お腹いっぱい。
2010/04/12(月) 00:18:57キミは一体誰と戦ってるの?ん?
誰か派生版最新うpしてくれよー純粋に研究がしたいんだよーオロローン
0856名無しさん@お腹いっぱい。
2010/04/12(月) 00:26:12見えない敵と戦ってるのか?
0857名無しさん@お腹いっぱい。
2010/04/12(月) 00:27:230858名無しさん@お腹いっぱい。
2010/04/12(月) 00:30:14見やすく丁寧書かれてる、理解もしやすい。
派生バージョンは、お世辞にも見やすいとも奇麗とも言えん。
変数の使い回しがあるし、なによりコードがぐちゃぐちゃだ。
こんな糞コード満載は、研究する価値無し。断言する、すてちゃっておk
本家バージョンで理解出来るよう勉強してくれ。
それが君の為にもスレの為にも有意義である。
0859名無しさん@お腹いっぱい。
2010/04/12(月) 00:31:32こぎつけるわ。んーでもヒントくれよヒント!
どこをどう直したらいい?
具体的にコピペしてくれると助かるんだけど。
0860名無しさん@お腹いっぱい。
2010/04/12(月) 00:32:15必死だな
0861756
2010/04/12(月) 09:16:07ehg1.1.1_20100309.zipがまだ落とせたからソース見たら
確かに何であのソースがああなっちゃったのかはわからない。
とりあえず現状ではehg1.1.1_20100309.zipは落とせるし、
そのソースに>>571とかで対応できるしスルーで。
0862名無しさん@お腹いっぱい。
2010/04/12(月) 11:19:210863名無しさん@お腹いっぱい。
2010/04/12(月) 11:42:38正直、「統失」の方?マジで思っちゃったよ
0864名無しさん@お腹いっぱい。
2010/04/12(月) 13:37:56スレ名がまずおかしかったんだ
「コードの海でニヨニヨしよう」
これならよかった
0865名無しさん@お腹いっぱい。
2010/04/12(月) 14:15:180866名無しさん@お腹いっぱい。
2010/04/13(火) 00:10:04派生版を落とし損ねたかパッチ適用が分からない素人
がスレを、自作自演で荒らす。
スレ住人ドン引き。何人かが相手するが当然のごとく
逆ギレで汚い発言をして更に住人ドン引き。
GPLだから配布してやれよと言う意見もあるが、そんな
キティガイに危ないおもちゃを渡すような馬鹿は現れず。
オリジナル版および派生版投稿者の書込みは見られず。
そりゃまあそうだ。俺が投稿者なら書込みしたくない。
一つだけ有意義な意見があった。
スレ名は、「コードの海でニヨニヨしよう」にしよう
と言う提案だ。すばらしい、賛成の一票を投じたい。
0867名無しさん@お腹いっぱい。
2010/04/13(火) 00:20:510868名無しさん@お腹いっぱい。
2010/04/13(火) 09:09:58そりゃもう大いに書き込みするな。
チンポどころか手首まで万個に突っ込んでるとか
犬とブロンド美女がヤってるとか
ウンコまみれ下炉まみれでレズしてる豚女とか、
そういう画像動画を集めているクズ中のクズだ、
そういう基地外にはそれ相応のおもちゃを与えとかないと
発狂して秋葉原で加藤しかねない
ttp://www1.axfc.net/uploader/Sc/so/102910.zip
0869名無しさん@お腹いっぱい。
2010/04/13(火) 14:08:450870名無しさん@お腹いっぱい。
2010/04/13(火) 15:03:330871名無しさん@お腹いっぱい。
2010/04/13(火) 15:22:050872名無しさん@お腹いっぱい。
2010/04/13(火) 15:23:030873名無しさん@お腹いっぱい。
2010/04/13(火) 19:20:410874名無しさん@お腹いっぱい。
2010/04/13(火) 20:04:070875名無しさん@お腹いっぱい。
2010/04/13(火) 22:29:22今から決めとけよ。次スレ必要なのか?
0876名無しさん@お腹いっぱい。
2010/04/13(火) 22:38:550877名無しさん@お腹いっぱい。
2010/04/13(火) 23:01:210878名無しさん@お腹いっぱい。
2010/04/14(水) 00:14:480879名無しさん@お腹いっぱい。
2010/04/14(水) 00:58:51さっさとhentaiに代わるサイト探してこいよ
0880名無しさん@お腹いっぱい。
2010/04/14(水) 03:23:290881名無しさん@お腹いっぱい。
2010/04/14(水) 10:45:060882名無しさん@お腹いっぱい。
2010/04/14(水) 19:11:050883名無しさん@お腹いっぱい。
2010/04/14(水) 19:28:060884名無しさん@お腹いっぱい。
2010/04/14(水) 21:20:51連想力っていうか柔軟性が高い。いいもの作れるよ。
0885名無しさん@お腹いっぱい。
2010/04/14(水) 21:22:54なんていうか、失礼だが、もう昭和に帰れ。
0886名無しさん@お腹いっぱい。
2010/04/14(水) 21:25:420887名無しさん@お腹いっぱい。
2010/04/14(水) 21:29:160888名無しさん@お腹いっぱい。
2010/04/14(水) 21:38:54初夏、ブラウザの表示上は繋がって見えるものの1ページが
複数の画像に分割されてロードされる。落とした方はlibgd
なり使って結合せにゃならんはめになる。とてもウンザリ。
0889名無しさん@お腹いっぱい。
2010/04/14(水) 21:40:320890名無しさん@お腹いっぱい。
2010/04/14(水) 21:45:28非常にゲンナリする。せめて丘の上ヒナゲシの頃の画像にしてくれと。
0891名無しさん@お腹いっぱい。
2010/04/14(水) 22:10:540892名無しさん@お腹いっぱい。
2010/04/14(水) 22:24:04たまに入る萌え挿絵に引かれて必死で落とすがページ数多すぎ。
0893名無しさん@お腹いっぱい。
2010/04/14(水) 22:43:31スレも残すところ百あまり。
一人のクズ紙様がうpして下さるも一部の人には
効果が無かったようだ。
どうやら、梅作業に入ったらしい。
まあ、e-hentaiに張付きたい人は、PINKかダウソ
にでもスレ立てしろと言う事か?
もともとこのスレは、>>1さんの欲望の為に立てら
れた物ゆえ、もう寿命は尽きているのかも知れない。
それでは、またどこかでノシ
0894名無しさん@お腹いっぱい。
2010/04/14(水) 22:47:09補完し合う→お零れをあわよくば貰えるかも→利用者の声もある→対応も迅速
の駄サイクルがあったが
このスレ潰して別スレ立てるなり、一人でシコシコするぐらいが丁度いい結果になったな
0895名無しさん@お腹いっぱい。
2010/04/14(水) 22:54:580896名無しさん@お腹いっぱい。
2010/04/14(水) 22:59:050897名無しさん@お腹いっぱい。
2010/04/14(水) 23:03:090898名無しさん@お腹いっぱい。
2010/04/14(水) 23:04:350899名無しさん@お腹いっぱい。
2010/04/14(水) 23:04:430900名無しさん@お腹いっぱい。
2010/04/14(水) 23:16:24黙って誰かが次スレを立ててくれるのをじっと待つ。
0901名無しさん@お腹いっぱい。
2010/04/14(水) 23:27:21春のバン祭りから無いわけだ。そう丁度e-hentaiに仕様変更
があった時期とほぼ同じだ。
もう規制が解除されているか、あるいは長期の規制をくらったか?
このグダグダ具合を見て呆れてるかもしれない。
だからってどうしたと言われれば別に何をどうするって分けじゃない。
ただそう思っただけなんだ。
0902名無しさん@お腹いっぱい。
2010/04/14(水) 23:30:420903名無しさん@お腹いっぱい。
2010/04/14(水) 23:46:320904名無しさん@お腹いっぱい。
2010/04/15(木) 00:02:230905名無しさん@お腹いっぱい。
2010/04/15(木) 14:48:14なるほど、そういう事だったのか
このスレ勉強になるわ
0906名無しさん@お腹いっぱい。
2010/04/16(金) 12:18:27http://set.bbspink.com/test/read.cgi/adultsite/1262831581/
なんだピンクにもあるじゃないか。
ロリショタケモ野郎は、こっちいって漁ってくれ。
0907名無しさん@お腹いっぱい。
2010/04/17(土) 01:11:55画像ダウンロードツールを作りたい。
プログラミング経験は、C/Pascal/perl/pythonで、ハノイの塔を作った事が
ある程度の技量です。
幸い、get.pl1.1.1が落とせるのでperlで勉強しようと思いますが、これGPLですよね。
このコードを使わずに、BSDライセンスなどで配布したいのですが、構いませんよね。
実は、半分ほど出来ているのですが、ライセンスどうしようって困ってます。
アルゴリズなどはget.plから拝借していますが、コードは一から書き直している最中です。
GPLには抵触しませんよね?
0908名無しさん@お腹いっぱい。
2010/04/17(土) 06:47:14それじゃ熟女野郎しか残らんだろ。
0909名無しさん@お腹いっぱい。
2010/04/17(土) 10:00:59BSDってソース出さなくてもいいヤツじゃん
ウィルスありでwinnyとか今頃の違法DLしたエロゲみたいに
デスクトップとか個人情報とか晒されるじゃん
0910名無しさん@お腹いっぱい。
2010/04/17(土) 13:48:15配布しないから気にしてないけど
0911名無しさん@お腹いっぱい。
2010/04/17(土) 14:07:01でオチは下に
↓
0912907
2010/04/17(土) 14:29:41ソースを非公開に出来るのですが、私が作ろうとしてるのはperlスクリプトなので
配布=ソース公開です。バイナリ配布しようとしてる分けじゃありません。
>>910
gzipデコード処理の事でしょうか?
モジュール依存の為、GPLライセンスには抵触しないと思います。
私何か勘違いしてますか。落ちは有りません。
0913名無しさん@お腹いっぱい。
2010/04/17(土) 18:09:57if ( ${$temparry}[$i] =~ /$url/ and ${$temparry}[$i] =~ /\/\?p=[0-9]+$/ ) {
0914名無しさん@お腹いっぱい。
2010/04/17(土) 18:29:12たとえ出されても詳細設計書も無い他人のソースコードは300行以上読む気にならないんだけどね。
0915名無しさん@お腹いっぱい。
2010/04/17(土) 19:17:23アルゴリズムの場合は、既知か、未知か、で判断されることが多い。
アルゴリズムがそのGPLのソースで初めて出現した(作者オリジナル)の場合は、
アルゴリズムだけ利用してもそのソースは元ソースの「翻訳」とみなされて
GPLで配布しなければならない、となることが多い。
でも、この辺は微妙なラインだと思う。
get.pl1.1.1のソースを読まなければ、
自分のソースの完成はなかったと思うなら
原作者に続くのがオープンソースっぽい考え方ではないだろうか。
0916名無しさん@お腹いっぱい。
2010/04/17(土) 19:37:30GPLに拘る必要は無いと個人的には、思うが>>915の考えには
賛成だ。
画像ダウンロードスクリプトは、だいたい似たり寄ったりな部分
が多いと思うし、違いはインターフェース部分が占める感じがする。
どのみちLWP使うのだろうから、似てきても仕方ないと思う。
どうしてBSDライセンスにしたいって思ったんだ?
0917名無しさん@お腹いっぱい。
2010/04/17(土) 20:38:40たしかに、原本をなぞればそれは原本と同一ですね。
うっかりGPLを破るところでした。現在のコードを破棄してゼロから
作成します。
>>916
極端は例ですが、バイトコンパイルされたスクリプトを適当なGUIラッパ
で包んで、お手軽アプリ配布って事に煩わしさが供なわない。
改変したって公開する必要ないし、義務もない。配布者の自由ってのが
気に入ってます。
0918名無しさん@お腹いっぱい。
2010/04/18(日) 11:28:210919名無しさん@お腹いっぱい。
2010/04/18(日) 11:28:23ありがとうございます!
0920名無しさん@お腹いっぱい。
2010/04/18(日) 14:12:13こんなところに巣があったのか
0921名無しさん@お腹いっぱい。
2010/04/18(日) 14:26:560922907
2010/04/18(日) 14:47:48ここは、インデックスのリファラだけ送ればいいのか。
おねいちゃん系が、好きな人は家鴨窯はお奨めだ。
帯域制限ないし、ラクチンだな。e-hentaiどーでもよくなってきた。
0923名無しさん@お腹いっぱい。
2010/04/18(日) 15:21:430924名無しさん@お腹いっぱい。
2010/04/18(日) 15:50:21病んでるなw
0925名無しさん@お腹いっぱい。
2010/04/18(日) 15:51:220926名無しさん@お腹いっぱい。
2010/04/18(日) 15:56:54精神的ブラクラ対策用に、たまにはエグイのも見とけ
0927名無しさん@お腹いっぱい。
2010/04/18(日) 17:30:53後がないけど。
0928名無しさん@お腹いっぱい。
2010/04/19(月) 01:09:30本家版もよろ
0929名無しさん@お腹いっぱい。
2010/04/19(月) 01:27:160930名無しさん@お腹いっぱい。
2010/04/19(月) 01:27:37しばらく見てなかったらインデックスが、ちょっと変更になってたのか。
0931名無しさん@お腹いっぱい。
2010/04/19(月) 01:45:21と思ったらあれか。最後のページの1枚目からDLしようとしてるみたいだよ。
0932名無しさん@お腹いっぱい。
2010/04/19(月) 01:46:351ページ20枚のサムネがあるので2ページでしょ。
そうすると、2ページ目にある先頭の21ページからDLしてる。
0933907
2010/04/20(火) 02:32:53作成途中のスクリプトのSSです。
コピペの楽なmlterm使ってます。
かなりごちゃごちゃ表示しています。
あと、プロキシの切替え方式を考えています。
一回目にtimeoutで帰ってきても二回目に繋がる事も有るし
どうもこのへんが、すっきりコーディング出来ません。
エラーの出るプロキシは全て除外するべきかな。
0934名無しさん@お腹いっぱい。
2010/04/21(水) 09:51:063回くらいの失敗で、単純なローテートでいいと思う。
除外とかしてると、ネットが死んでるとプロキシ全部消えたりするし。
プロキシはエラーのステータスコード返さないのがたまにいるのが一番面倒。
0935907
2010/04/21(水) 22:08:30今は最初のアクセスで500番台のエラーが発生したらリトライして
それ以外だったら除外する様にしています。
ステータスが返ってこないと、time outの時間だけ待ってしまう為
何度も、リトライするのが無駄に思えています。
やはり三回くらいリトライが妥当かな。
ご助言ありがとうでした。
0936907
2010/04/22(木) 02:34:56私のブログで晒します。
質問などもブログでどうぞ。
ttp://d.hatena.ne.jp/zintanman/
0937名無しさん@お腹いっぱい。
2010/04/22(木) 06:07:490938名無しさん@お腹いっぱい。
2010/04/22(木) 08:46:29(・ω・`)乙 これは乙じゃなくてポニーテールなんだからね!
0939名無しさん@お腹いっぱい。
2010/04/22(木) 11:21:21480氏のときも思ったがプロキシをICMP(ping)で調べるのはそっちのが早いから?
タイムアウト短くしてHTTP(LWP)で調べた方がいいと思うが…
0940名無しさん@お腹いっぱい。
2010/04/22(木) 11:26:08質問や厨房のカキコが、はてなのブログに行くのは一向に構わん。
むしろ歓迎w 斯くしてスレに平和が訪れた。
0941名無しさん@お腹いっぱい。
2010/04/22(木) 11:37:24サーバーが生きているかどうかだけ調べてるみたいだから、Net::Pingで十分じゃね?
折角プログがあんだから、そっちで聞いてやれや。
0942名無しさん@お腹いっぱい。
2010/04/22(木) 11:58:18つまようじで必要かつ十分だって事じゃん。
0943名無しさん@お腹いっぱい。
2010/04/22(木) 19:26:15逆にプロキシとしては生きてても、ping返さないのもいるからと思っただけだが、
ま、ブログあるし他にも細かいツッコミ所あるしそっちで聞くか
…となると、ココの存在意義は…何だっけ?
もうすぐ終わるしいいか
0944名無しさん@お腹いっぱい。
2010/04/22(木) 20:09:15自分がそうしたきゃ、そうすればいいだけなのに。
さっさっと、その思いブログ主にぶつけてこいよ。
お気の毒様>>936
0945名無しさん@お腹いっぱい。
2010/04/22(木) 22:10:34作ってる側としては順風満帆すぎてもつまらないから
たまに一荒れ吹いて貰いたいって気持ちもあるよ。
ここひと月はただのコレクターに成り下がってるし。
0946名無しさん@お腹いっぱい。
2010/04/23(金) 08:28:270947名無しさん@お腹いっぱい。
2010/04/23(金) 11:41:48ツールとかじゃなしに、このサイトが熱い・・みたいな
0948名無しさん@お腹いっぱい。
2010/04/23(金) 14:24:06元々、ダウンロードのノウハウを語る板だし。
0949名無しさん@お腹いっぱい。
2010/04/23(金) 20:05:200950名無しさん@お腹いっぱい。
2010/04/23(金) 21:49:29変態宣言乙
0951名無しさん@お腹いっぱい。
2010/04/23(金) 23:13:490952名無しさん@お腹いっぱい。
2010/04/23(金) 23:20:450953名無しさん@お腹いっぱい。
2010/04/24(土) 01:27:212回もくらったので間違いない
0954名無しさん@お腹いっぱい。
2010/04/24(土) 03:29:41引いたわ
っていう話なんだけど
0955名無しさん@お腹いっぱい。
2010/04/24(土) 14:12:210956名無しさん@お腹いっぱい。
2010/04/24(土) 14:12:50HDDの時と比べてそんなに読み込み速度とか変わります?
プラシーボ効果的な、「(SSDにしたから速くなってるはず!)あ、ちょっとは早くなったかなぁ・・・?」みたいな微妙な変化なら
導入するのをやめようと思ってます。
0957名無しさん@お腹いっぱい。
2010/04/24(土) 14:16:570958名無しさん@お腹いっぱい。
2010/04/24(土) 14:18:170959名無しさん@お腹いっぱい。
2010/04/24(土) 15:07:30今日あんたは好きなものを好きなだけ喰ってよし。俺は許す。
0960名無しさん@お腹いっぱい。
2010/04/25(日) 21:05:260961名無しさん@お腹いっぱい。
2010/04/26(月) 00:30:01Googleからサイト内検索でロリワード入れると公式検索では出ないものが引っかかるんだけど
ものによってはGellery Not availableが出る
0962名無しさん@お腹いっぱい。
2010/04/26(月) 08:34:09それっぽい単語が入ってるやつはとりあえず検索結果から消して、
削除が後回し(抜け?)になってるページがあるだけだと思うけど。
しかし…、そんなことに気がついたということは…
0963名無しさん@お腹いっぱい。
2010/04/26(月) 12:41:150964名無しさん@お腹いっぱい。
2010/04/26(月) 13:35:06実ファイル削除は面倒だったりするから放置してあるんでしょ。
もしくはロリ関連はトレースしてレポートするって書いてあるから、
それ用のハニーポットかも。
0965名無しさん@お腹いっぱい。
2010/04/27(火) 02:09:49ロリが理由の削除措置は一応存在すると思う
小学生向けの時間帯のアニメでGoogle検索すると
Gellery Not Availableになってるページを頻繁に見かけるんだが
(ただ単に無視してるからだが >>953)ここは著作権侵害が問題になるケースは皆無だし、
そういうリスクが存在しない以上、アップロード者が
何らかの脅威を感じて同時多発的に自主削除するという状況も考えにくい
0966名無しさん@お腹いっぱい。
2010/04/27(火) 08:28:42今回のはlolicon/shotacon/bestialityタグが付いたギャラリーを見えにくくしてるだけ
状況が良くわからんが、pining for the fjords以外は今回のとは関係ないんじゃね
0967名無しさん@お腹いっぱい。
2010/04/27(火) 13:41:49キャッシュを見るとサムネが消えてないからファイルは残っているらしい
ご丁寧に画像1枚ごとの個別ページも潰されている模様
一網打尽やね
http://www.google.co.jp/search?q=site%3Ag.e-hentai.org%2F+lolicon
0968名無しさん@お腹いっぱい。
2010/04/27(火) 23:24:460969名無しさん@お腹いっぱい。
2010/04/27(火) 23:57:090970名無しさん@お腹いっぱい。
2010/04/29(木) 02:11:23EFのSGシリーズとか好きなのに
0971名無しさん@お腹いっぱい。
2010/04/29(木) 03:28:220972名無しさん@お腹いっぱい。
2010/04/29(木) 07:48:11こんなところにいる奴らは完全匿名でP2Pとかやってそうで怖いけどなw
0973名無しさん@お腹いっぱい。
2010/04/29(木) 23:54:450974名無しさん@お腹いっぱい。
2010/04/30(金) 00:01:070975名無しさん@お腹いっぱい。
2010/04/30(金) 00:53:09素晴らしい!!
0976名無しさん@お腹いっぱい。
2010/04/30(金) 01:43:59リモホ強制表示でもかまわん。
て言うか次スレいらねーんだけど。
0977名無しさん@お腹いっぱい。
2010/04/30(金) 02:14:35連番のH画像/動画を一気にダウンロードする3
http://pc12.2ch.net/test/read.cgi/unix/1272561192/
0978名無しさん@お腹いっぱい。
2010/04/30(金) 06:25:06** going to get 1 thumbnail pages **
get html : error. (400 URL missing)
って帰ってきて動かないなあ、皆さんはどうですか?
0979名無しさん@お腹いっぱい。
2010/04/30(金) 12:14:45e-hentaiの仕様が変ったので、そのままじゃ動かないよ
自分で修正するか、他のダウンツール探すかしてよ
0980名無しさん@お腹いっぱい。
2010/04/30(金) 14:01:06死ね
0981名無しさん@お腹いっぱい。
2010/04/30(金) 14:13:17GWだからか?
0982名無しさん@お腹いっぱい。
2010/04/30(金) 15:34:080983名無しさん@お腹いっぱい。
2010/04/30(金) 20:54:47しねしね
0984名無しさん@お腹いっぱい。
2010/04/30(金) 21:27:210985名無しさん@お腹いっぱい。
2010/04/30(金) 21:34:08>>979
シネシネ
0986名無しさん@お腹いっぱい。
2010/04/30(金) 21:40:10さすが神国日本www
0987名無しさん@お腹いっぱい。
2010/05/01(土) 07:55:38親にネット解約されてぶちきれたんじゃないかと心配してたんだ。
0988名無しさん@お腹いっぱい。
2010/05/01(土) 13:43:42みんなしねしねいってるんだな
では俺も>>979
しねしね
0989名無しさん@お腹いっぱい。
2010/05/01(土) 21:26:110990名無しさん@お腹いっぱい。
2010/05/02(日) 03:35:444年前からのルール。
0991名無しさん@お腹いっぱい。
2010/05/02(日) 10:16:250992名無しさん@お腹いっぱい。
2010/05/02(日) 10:18:020993名無しさん@お腹いっぱい。
2010/05/02(日) 10:18:180994名無しさん@お腹いっぱい。
2010/05/02(日) 10:18:240995名無しさん@お腹いっぱい。
2010/05/02(日) 10:18:340996名無しさん@お腹いっぱい。
2010/05/02(日) 10:18:56フツーは目的地に向かってる時間帯じゃねw
0997名無しさん@お腹いっぱい。
2010/05/02(日) 10:19:21おまえが言うな
0998名無しさん@お腹いっぱい。
2010/05/02(日) 10:19:320999名無しさん@お腹いっぱい。
2010/05/02(日) 10:20:271000名無しさん@お腹いっぱい。
2010/05/02(日) 10:21:06連番のH画像/動画を一気にダウンロードする3
http://pc12.2ch.net/test/read.cgi/unix/1272561192/
10011001
Over 1000Threadもう書けないので、新しいスレッドを立ててくださいです。。。
レス数が1000を超えています。これ以上書き込みはできません。