専用ブラウザを助けるプロクシ作らね? [転載禁止]©5ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
2015/02/17(火) 13:35:14.21ID:D7asMS8F00202名無しさん@お腹いっぱい。
2015/02/27(金) 02:14:51.79ID:qRKvXgSE00203名無しさん@お腹いっぱい。
2015/02/27(金) 02:16:56.71ID:CkhMnjzt0一度ログ消して再取得しなけりゃならん、という程度
0204名無しさん@お腹いっぱい。
2015/02/27(金) 02:20:14.27ID:JqEh1bTS0それだけ
であればいいけどね
read.cgiのhtml出力仕様がコロコロ変わると大変な事に
0205名無しさん@お腹いっぱい。
2015/02/27(金) 02:29:19.06ID:72X9Hzyb00206名無しさん@お腹いっぱい。
2015/02/27(金) 02:30:24.34ID:Kp8WjHqy0参考にさせてもらいます
0207名無しさん@お腹いっぱい。
2015/02/27(金) 02:50:10.62ID:5OJ3SYiJ0V2Cの場合ログが勝手に再構成されるから問題なかった。再取得操作は不要
ここまで一切弄ってこなくて、SCのCGI経由クロール判明以降も全く弄ってなかったんだし、変わる可能性は薄いと思うけど
API流用型の改造も出てきてる今、現状使用者は相当少なくなるであろうこの手の串対策に変えてくるかなあ
0208名無しさん@お腹いっぱい。
2015/02/27(金) 03:30:37.58ID:BnR2ZpVg00209名無しさん@お腹いっぱい。
2015/02/27(金) 03:42:52.44ID:p3P4xXWJ0>差分リクエストに1からのDAT送りつけたら
クラウド鯖使うようになった初期の頃を知らんのか・・・
今年の1月後半ぐらいなんだがな
差分取得する毎に「あぼーん検出→再取得」のコンボだったよ
あぼーん検出不可なブラウザはどうなるか知らん
少なくともギコナビは取得済みから -8 Byteでリクエストしてこの 8 Byteが違っていたらあぼーん検出
かちゅ〜しゃ+kageの方は -1 Byteでリクエストして受信した最初が \x0A じゃなければあぼーん扱い
0210名無しさん@お腹いっぱい。
2015/02/27(金) 03:46:27.31ID:pkVVdIZI00211名無しさん@お腹いっぱい。
2015/02/27(金) 04:05:24.38ID:dKp87VDM00212名無しさん@お腹いっぱい。
2015/02/27(金) 04:48:57.48ID:5OJ3SYiJ0いや検出からの再取得じゃなく、串が動いたのは最初の1回のみで、何くわぬ顔でDAT再構築したんだよV2C
0213名無しさん@お腹いっぱい。
2015/02/27(金) 04:52:59.54ID:5OJ3SYiJ00214名無しさん@お腹いっぱい。
2015/02/27(金) 09:09:21.05ID:e3oaOS3L0新APIの仕様についての話題は、このスレでいいのか?
0215名無しさん@お腹いっぱい。
2015/02/27(金) 10:07:18.29ID:fd7kMbQz00216名無しさん@お腹いっぱい。
2015/02/27(金) 10:38:19.06ID:e3oaOS3L0http://pastebin.com/VGTR7Sf0
セッションIDを起動時に取得したまま、ずっと使い続けるテキトー実装だけど
セッションの有効期限って、どれくらいやろ
あと、if-modified-since、rangeリクエストをそのまま通過させてAPIに投げると
更新なし時にステータスコードが200で、bodyが404の返答があるのは何でや
0217名無しさん@お腹いっぱい。
2015/02/27(金) 11:20:05.06ID:PzY0nG8D0778 :名無しさん@お腹いっぱい。 [] :2015/02/27(金) 10:27:03.28 ID:+kID8sEa0 (7/7) [PC]
>>771
これはAPIの仕様かバグですね
ステータスコード 206 で返るべきところ、ステータスコード 200で返って来るので再取得が走ってしまう
一応対処は可能だけど、これは他の専ブラも困ってるはずで、API側で直してくれるかも
山下、これ直しとけよ
0218名無しさん@お腹いっぱい。
2015/02/27(金) 11:22:38.01ID:uGN5EnM20ソースどこよ
0219名無しさん@お腹いっぱい。
2015/02/27(金) 11:25:31.26ID:dMhmA4e+0http://anago.2ch.net/test/read.cgi/software/1424315959/778
0220名無しさん@お腹いっぱい。
2015/02/27(金) 11:26:19.12ID:PzY0nG8D00221名無しさん@お腹いっぱい。
2015/02/27(金) 11:29:38.83ID:67qHA7oQ0windowsで動いてる
サンクス
0222名無しさん@お腹いっぱい。
2015/02/27(金) 11:41:01.10ID:+kID8sEa0仕様とか言い出すかもなw
0223名無しさん@お腹いっぱい。
2015/02/27(金) 11:44:10.68ID:HO0ehFM20http://anago.2ch.net/test/read.cgi/software/1424327586/
>>835
0224名無しさん@お腹いっぱい。
2015/02/27(金) 12:49:39.53ID:zn/JeIfB0これとNode.jsとPython 2.7があれば良いのかな?
後でやってみよう
Node.js
http://nodejs.org/download/
Python 2.7
https://www.python.org/downloads/
0225名無しさん@お腹いっぱい。
2015/02/27(金) 13:10:51.81ID:e3oaOS3L0206は返ってきているようだが、304 Not Modifiedが返ってこないな
というより、20xのときは直にdatアクセスしたときの同じようなレスポンスが返ってくるから
サーバーが内部的にリクエストを転送してる気がする
if-modified-sinceヘッダーを取り除けば、問題は無くなりそう
>>224
ソースからインストールする場合と書いてあるから、Pythonは要らないかも
0226名無しさん@お腹いっぱい。
2015/02/27(金) 19:47:06.05ID:F+4QaO2U0email-protectionが無い場合はそのままmail返すように変えて使ってみたよー
htmltodatByFiddlerの場合はemail-protectionを>>19のように'X'までにするように直す必要があるね
本文のemail-protection処理はどっちも必要
ってかJSとか弄った事ないからよく分からねー
0227名無しさん@お腹いっぱい。
2015/02/27(金) 19:59:58.01ID:his4tOUj0結構なログをローカルに溜め込んでいるのよね
0228名無しさん@お腹いっぱい。
2015/02/27(金) 20:09:26.60ID:G6wuAdBj0API使ってることになるのかな?API使用してる確認法がわからん・・・
0229名無しさん@お腹いっぱい。
2015/02/27(金) 20:37:55.59ID:e3oaOS3L0ローカルであればプロキシ設定にlocalhost:8088と指定すれば使えているはず
一応、サンプルコードなので実用には注意
78行目あたりに
console.log(response.headers);
とか追記しておけば、APIにアクセスする度に返ってきたヘッダーを出力してくれる
0230名無しさん@お腹いっぱい。
2015/02/27(金) 20:44:48.19ID:Hii81umz0セッションの期限は2chmateだと55分でセッションID取り直しているみたいだから1時間くらいじゃね?
0231名無しさん@お腹いっぱい。
2015/02/27(金) 21:11:11.80ID:e3oaOS3L0実装いいかげんやな
0232名無しさん@お腹いっぱい。
2015/02/27(金) 22:34:08.15ID:CkhMnjzt00233名無しさん@お腹いっぱい。
2015/02/27(金) 23:31:38.98ID:CWhmdBOJ0仕様だ諦めろ
0234名無しさん@お腹いっぱい。
2015/02/28(土) 02:18:07.46ID:xxxBU7UG0どれが最新なんだろうか
0235名無しさん@お腹いっぱい。
2015/02/28(土) 02:39:26.18ID:lKCuzRBJ0山下SpyleはAPIのバグで近日中直すって言ってたけどな
0236名無しさん@お腹いっぱい。
2015/02/28(土) 04:23:39.36ID:lvAKUUCw00237名無しさん@お腹いっぱい。
2015/02/28(土) 04:28:06.57ID:25W0vuuW00238名無しさん@お腹いっぱい。
2015/02/28(土) 04:35:01.01ID:19zlKYBH0「API側の不具合で近日修正予定とのことです」とか言ってるし鯖のAPIなんて弄れないでしょ
0239名無しさん@お腹いっぱい。
2015/02/28(土) 04:45:52.63ID:MP7KfPZR0> なお、新しい“2ちゃんねる”のAPIはまだテスト中で、差分取得リクエストに失敗して「Jane Style」の
> タイトルバーが赤色になることがあるという。これはAPI側の不具合で、近日修正される予定。
http://www.forest.impress.co.jp/docs/news/20150223_689599.html
0240名無しさん@お腹いっぱい。
2015/02/28(土) 04:53:25.87ID:045xG2Cl0山下が開発してんのか?
0241名無しさん@お腹いっぱい。
2015/02/28(土) 05:02:32.96ID:eq4duOfG0CMでしょ
広告部分は分からんけど
0242名無しさん@お腹いっぱい。
2015/02/28(土) 05:18:21.95ID:0wP+XlhP00243名無しさん@お腹いっぱい。
2015/02/28(土) 05:25:11.89ID:FizJnEAg00244名無しさん@お腹いっぱい。
2015/02/28(土) 05:37:26.24ID:25W0vuuW00245名無しさん@お腹いっぱい。
2015/02/28(土) 06:32:12.65ID:5a21MezF0最近全然プロクシとか縁のなさそうな別スレで気になってた
0246名無しさん@お腹いっぱい。
2015/02/28(土) 07:21:49.36ID:bG6QwhyB00247名無しさん@お腹いっぱい。
2015/02/28(土) 08:17:44.68ID:QuJsHNUk0XPでも動作しました、ありがとうございます。
というかNode.jsが動く環境なら2000でもいけそうだね。
0248名無しさん@お腹いっぱい。
2015/02/28(土) 09:00:57.92ID:H+TQKx4C020年前くらいのVC++で作ったようなダサい画面構成をみて
そっとアンインストールした
0249名無しさん@お腹いっぱい。
2015/02/28(土) 09:13:09.45ID:H+TQKx4C00250名無しさん@お腹いっぱい。
2015/02/28(土) 10:36:41.13ID:H/0OS4UL0でギコナビでも行けた。環境は32bit版windows7
しばらく様子を見てみようと思う。
ありがとう!
0251anonymous@ne.jp
2015/02/28(土) 21:35:46.91ID:HNZCqnK300252anonymous@ne.jp
2015/02/28(土) 21:47:58.21ID:I6kPaz/J00253名無しさん@お腹いっぱい。
2015/02/28(土) 22:21:39.86ID:bG6QwhyB00254名無しさん@お腹いっぱい。
2015/02/28(土) 22:23:34.03ID:I6kPaz/J0普通のwebブラウザでこのスレ見てみな?
0255名無しさん@お腹いっぱい。
2015/02/28(土) 22:29:02.66ID:1LwgnSdw0htmlソースを見ればわかるがemail-protectionのデコード処理が
名前欄やら投稿日やらを全部食ってしまってる感じ。
html2datキラーでなくread.cgiキラーだ
0256ノtasukeruyo
2015/02/28(土) 22:31:25.47ID:bG6QwhyB0よく分からん。
0257名無しさん@お腹いっぱい。
2015/02/28(土) 22:36:39.00ID:om+vp5CG00258名無しさん@お腹いっぱい。
2015/02/28(土) 22:38:40.39ID:bG6QwhyB0一般のブラウザで開いて見たが、>>255のようにはならなかった。
やり方が悪いのか環境が悪いのか……
0259名無しさん@お腹いっぱい。
2015/02/28(土) 22:44:29.32ID:1LwgnSdw0> 一般のブラウザで開いて見たが、>>255のようにはならなかった。
「全部表示」で見ただろ。「最新50」とかで見てみ
email-protection処理はなんか数に制限あるみたいだから
レス数が多いと途中から利かなくなる
0260名無しさん@お腹いっぱい。
2015/02/28(土) 22:53:39.86ID:cSrw7ycP0email protection してくれてんだな。
してくれない時もあるってのがアレだけど
0261名無しさん@お腹いっぱい。
2015/02/28(土) 23:02:19.46ID:1fgyu5Zo00262名無しさん@お腹いっぱい。
2015/02/28(土) 23:16:24.40ID:bG6QwhyB0おお、確かに欠けた。面白い。
0263名無しさん@お腹いっぱい。
2015/02/28(土) 23:18:12.68ID:EEZAJ1z50IE11とGoogle Chromeでは>>251-252ともメール欄を含めて正常に読めてるが、他のブラウザでは変になるのかな?
↓
251 :anonymous@ne.jp:2015/02/28(土) 21:35:46.91 ID:HNZCqnK30
html2datキラー
252 :anonymous@ne.jp:2015/02/28(土) 21:47:58.21 ID:I6kPaz/J0
html2datキラー はこっちだった模様
0264名無しさん@お腹いっぱい。
2015/02/28(土) 23:20:35.29ID:tcO2M++f0char変換だけだと曜日とか一部化けるから、言語のエンコード系機能かなんか使う必要あるけど
単なるWebブラウザ殺しだわ
0265263
2015/02/28(土) 23:22:16.76ID:EEZAJ1z50なるほど、やっと理解した。IE,Chromeとも「最新50」で>>257と同じ現象が起きてる。なんてこった…
CFがぶっ壊れて名前欄とID欄が消えるから無理
0267名無しさん@お腹いっぱい。
2015/02/28(土) 23:31:28.32ID:eO/kN29Y0Email Protectionをオフにする要望も出てるけどスルーされてる
修理場 Carpenter Part.4
http://carpenter.2ch.net/test/read.cgi/operatex/1421829594/
0268名無しさん@お腹いっぱい。
2015/02/28(土) 23:32:37.10ID:1fgyu5Zo0いや、無理じゃないよ
閉じタグが誤ってエンコードされてるだけであってデコードすればちゃんと全部出てくる
0269名無しさん@お腹いっぱい。
2015/02/28(土) 23:33:15.89ID:tcO2M++f0いや余裕余裕
#からXの間を変換して/cdnからXまでと置き換えるといつも通りのhtml
あとは他と同じようにパースして整形
0270名無しさん@お腹いっぱい。
2015/02/28(土) 23:36:16.11ID:1fgyu5Zo00271名無しさん@お腹いっぱい。
2015/02/28(土) 23:38:56.52ID:tcO2M++f00272名無しさん@お腹いっぱい。
2015/02/28(土) 23:38:59.46ID:99NGaug400273名無しさん@お腹いっぱい。
2015/02/28(土) 23:40:40.77ID:1fgyu5Zo00274名無しさん@お腹いっぱい。
2015/03/01(日) 00:01:44.94ID:1iMp4NQ30>>234
http://anago.2ch.net/test/read.cgi/software/1424702481/384
これは?
0275名無しさん@お腹いっぱい。
2015/03/01(日) 00:14:50.13ID:M+I7sCK50意味が無え…。
0276名無しさん@お腹いっぱい。
2015/03/01(日) 00:16:03.09ID:CihT7Rxt0あーなるほど、そっちか
0277名無しさん@お腹いっぱい。
2015/03/01(日) 00:27:32.24ID:vDLohOSO0それはダメというか書いた本人がどこかのスレで言ってたような
けどここに書き込みしてる人たちのスキルは高そうなので
そのうちいいものができそうな気はする
0278名無しさん@お腹いっぱい。
2015/03/01(日) 00:27:46.34ID:LK0pL3R/0連中なかなかやるね
0279名無しさん@お腹いっぱい。
2015/03/01(日) 00:32:16.01ID:wtoICth60そりゃ専門にやってるんだからすぐ気付くだろう
こっちでも何日もかからず気付いたわけだし
0280名無しさん@お腹いっぱい。
2015/03/01(日) 01:29:13.11ID:LK0pL3R/0そうなんだけど、なんと言うかイタチごっこが無意味なくらい、何をやっても涼しい顔で付いてくるだけの技術があるって感じがね
当たり前っちゃ当たり前なんだけど、今の2chの運営って技術力からっきしな連中しかいないから
0281名無しさん@お腹いっぱい。
2015/03/01(日) 01:33:54.42ID:7sauQt5P0直す気がないんだか直せないんだか知らんけど
0282名無しさん@お腹いっぱい。
2015/03/01(日) 01:38:31.45ID:xkMkx3f300283名無しさん@お腹いっぱい。
2015/03/01(日) 01:58:25.78ID:vDLohOSO0設定でオフにできるわけだから
運営系のスレで訴え続ければ改善されるかもね
すでに実害は出ているわけだし
0284名無しさん@お腹いっぱい。
2015/03/01(日) 02:07:46.76ID:7sauQt5P0CF側的には、例外処理は自分のとこでやれってことだろ。メールアドレスじゃないデータ送られてきたって知らんと言う話
2chの使い方だとemail protection自体全く意味ないんだからやめりゃいいのに
0285名無しさん@お腹いっぱい。
2015/03/01(日) 02:44:31.28ID:3QqiROpW0むしろログ速で問題発生の模様
0286250
2015/03/01(日) 11:20:58.99ID:G46BQ5/z02ch側の実装が単純だというのもあるんだろうが、
わずか100行足らずのコードで対応できてるのがすげえな
0287名無しさん@お腹いっぱい。
2015/03/01(日) 13:41:56.42ID:/NdUtVu50よかったねw
0288名無しさん@お腹いっぱい。
2015/03/01(日) 14:11:15.19ID:EsGZDn+f024時間以内でもコード:401、本文:ng (not authorized) が返ってくるのを確認したので
リクエスト毎に期限が延長されてるのかもしれない
ちなみに、切れたときは前のリクエストから10時間ぐらい間隔が空いていた
あと、本文:404がちゃんとコード:404で返ってくるように修正されたっぽいけど
304は返してくれないし、上の401も使いどころとして微妙だし、本当に残念なAPIだな
0289名無しさん@お腹いっぱい。
2015/03/01(日) 15:35:19.26ID:G46BQ5/z0なるほど
寝てる間7-8時間は間があいてたと思うがそれ以上になると切られるのかな
ま、こういうのは今後変更される可能性があるんだろうけど
0290名無しさん@お腹いっぱい。
2015/03/01(日) 17:51:11.46ID:rWN9wuMw0htmltodatByFiddlerを使っても大丈夫なの?
0291名無しさん@お腹いっぱい。
2015/03/01(日) 17:53:34.90ID:7/3vY20Z0治った
0292名無しさん@お腹いっぱい。
2015/03/01(日) 18:29:18.24ID:pzFcOye600293名無しさん@お腹いっぱい。
2015/03/01(日) 23:01:03.06ID:FPc8sEWZ00294名無しさん@お腹いっぱい。
2015/03/01(日) 23:01:22.59ID:/IYk9Wqf0仕様変更とかあると見れない書き込まれないってなりそうだから
0295名無しさん@お腹いっぱい。
2015/03/01(日) 23:03:56.58ID:/IYk9Wqf0をコピペして丸ごと
CustomRules.js
に貼りつければいいの?
追記でなくて全て置き換え?
0296名無しさん@お腹いっぱい。
2015/03/01(日) 23:16:24.77ID:CECYr+XD00297名無しさん@お腹いっぱい。
2015/03/01(日) 23:20:11.40ID:JkbOCcAH00298名無しさん@お腹いっぱい。
2015/03/01(日) 23:24:51.55ID:ngzSgNCJ02ch以外でProxomitron使うために自動構成スクリプト指定してるからそれが外れないように出来ればFiddler使うんだけど
ググってもやり方がわからん
0299名無しさん@お腹いっぱい。
2015/03/01(日) 23:27:47.45ID:/vm/VSen00300名無しさん@お腹いっぱい。
2015/03/01(日) 23:30:37.70ID:FPc8sEWZ0検索力がない
0301名無しさん@お腹いっぱい。
2015/03/01(日) 23:31:15.67ID:vDLohOSO0起動オプションで /noattach 付ければいいはず
■ このスレッドは過去ログ倉庫に格納されています