トップページsoftware
1001コメント301KB

専用ブラウザを助けるプロクシ作らね? [転載禁止]©5ch.net

■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。2015/02/17(火) 13:35:14.21ID:D7asMS8F0
専用ブラウザを作る訳じゃないから問題なし
0154名無しさん@お腹いっぱい。2015/02/26(木) 01:35:23.82ID:ti1tqJlX0
navi2chのスレ辺りみとけよ
0155名無しさん@お腹いっぱい。2015/02/26(木) 07:47:13.24ID:OKYJIUxJ0
>>153
pythonのが散々出てるだろ
0156名無しさん@お腹いっぱい。2015/02/26(木) 08:24:24.73ID:0kMje+Ze0
これは・・Win32APIのみで串作れば
需要あるってことか
0157名無しさん@お腹いっぱい。2015/02/26(木) 12:48:15.75ID:ti1tqJlX0
簡単軽量なのなら需要あるけど、仕様変更に素早く対応出来るように
ユーザーがその辺イジれるようにあいておかないと、更新大変じゃないかな
0158名無しさん@お腹いっぱい。2015/02/26(木) 13:17:54.07ID:Zoq+oCDO0
StyleからAPI情報を抽出するツールと
API情報を入力・保存する串ツールか
0159名無しさん@お腹いっぱい。2015/02/26(木) 13:22:06.83ID:ZgK4+/k00
そんなあなたにfiddler
0160名無しさん@お腹いっぱい。2015/02/26(木) 13:27:29.22ID:Zoq+oCDO0
>>159
今使ってるw
0161名無しさん@お腹いっぱい。2015/02/26(木) 13:34:58.02ID:G77uJ5cC0
>>158
で、それを簡単に実現する方法がStyleを自動操作だよ
毎回、API情報抜くより簡単でしょ
Styleの実装なんてそうそう変わらないんだし
非表示にしときゃStyleなんて存在しないのと一緒だからね
0162名無しさん@お腹いっぱい。2015/02/26(木) 14:13:42.03ID:lb2N1B+/0
161がプログラムを書いたことがないのは分かった
0163名無しさん@お腹いっぱい。2015/02/26(木) 14:19:16.95ID:ZgK4+/k00
出来ないことはないが抜く方が簡単だと思う

>>160
>>19は流行らなかったのになんか今流行ってるな
0164名無しさん@お腹いっぱい。2015/02/26(木) 14:36:06.70ID:gLFMOisk0
自動操作できるなら、自動でキーを抜けるけど
自動更新チェック、自動起動、自動操作でキーを抜いて、キーをウェブのどこかにアップロード/書き込み

まぁ頻繁にキーを変えることはどうせできないから手動でキー更新でいいでしょ
Spyleダウンロード後5分もあればキーを抜けるんで、山下も変えるだけ無駄だと気付くでしょう
もしキーを外だししてキーだけ自動更新できるように作り込んで来たら、その仕組みをまんま使わせてもらうだけ
何をやっても無駄だから
0165名無しさん@お腹いっぱい。2015/02/26(木) 14:41:31.89ID:G77uJ5cC0
>>162
Delphi7ベースだろ?spy++使うまでもないよ
0166名無しさん@お腹いっぱい。2015/02/26(木) 15:36:35.26ID:B2M6fLop0
perlならこうか
use Digest::SHA qw(hmac_sha256_hex);

$HMKey = 'Dg略';
$AppKey = 'xx略';
$ct = '1234567890';

$mess = $AppKey . $ct;
$HB = hmac_sha256_hex($mess,$HMKey);

#$digest = hmac_sha256_hex($data, $key);


perlならWin98でも使用可能になるか。
0167名無しさん@お腹いっぱい。2015/02/26(木) 16:07:24.54ID:3IOq0WWJ0
串に組み込むのが手間。
httpはいいけどhttpsのCONNECTとかもやらにゃならん。

あとdatアクセスの場合だけ迂回。

これくらいか。
0168名無しさん@お腹いっぱい。2015/02/26(木) 16:21:54.12ID:gLFMOisk0
>>167
既存ブラウザ向けならhttpだけで良いでしょ
httpsはDirectで
0169名無しさん@お腹いっぱい。2015/02/26(木) 17:02:08.32ID:6E/2BYyl0
あとはこれを告知していかに山下に金が落ちないようにするかだな
0170名無しさん@お腹いっぱい。2015/02/26(木) 17:03:18.54ID:bhXAQIJW0
html-datの串はtor板にある奴がよくできていた
0171名無しさん@お腹いっぱい。2015/02/26(木) 17:04:53.34ID:flwfbvdW0
>>170
htmltodatByFiddlerだとログが壊れる
tor板だと問題なし?
0172名無しさん@お腹いっぱい。2015/02/26(木) 17:08:26.12ID:j5qud9Fg0
なんぞそれ
0173名無しさん@お腹いっぱい。2015/02/26(木) 17:09:30.56ID:hvBFEkXO0
>>172
http://mukiyu.g.ribbon.to/
http://mukiyu.g.ribbon.to/htmltodatByFiddler/readme.txt

これ
0174名無しさん@お腹いっぱい。2015/02/26(木) 17:10:36.64ID:bhXAQIJW0
新規取得したスレではログが壊れることはなかった
差分取得もちゃんとできて、毎回read.cgiにスレ全体を取りに行かないから軽い
0175名無しさん@お腹いっぱい。2015/02/26(木) 17:15:37.79ID:ZgK4+/k00
>>174
見てないけど取得したレス数とサイズとラスト16byteぐらいを保存しといて
次アクセス時に使えば軽くなりそうだな
0176名無しさん@お腹いっぱい。2015/02/26(木) 17:17:05.61ID:bhXAQIJW0
>>175
readmeを読む限りそんな感じで動いてるみたい
0177名無しさん@お腹いっぱい。2015/02/26(木) 17:44:59.45ID:j5qud9Fg0
かもめで使ってみようとしたらやたらとエラー吐いてデータが壊れた
0178名無しさん@お腹いっぱい。2015/02/26(木) 18:52:09.11ID:ZgK4+/k00
>>176
ただあぼーん時とかの処理考えたらめんどっちいな・・
0179名無しさん@お腹いっぱい。2015/02/26(木) 18:58:14.22ID:TZ+oHmvz0
Torバージョンをまとめてあげて欲しい
0180名無しさん@お腹いっぱい。2015/02/26(木) 19:56:59.68ID:1OcTSnsc0
あぼーん時は416を返してクライアントに再取得させるだけだから別に面倒ではないと思うが
0181名無しさん@お腹いっぱい。2015/02/27(金) 00:09:18.47ID:2darJ9Q20
メール欄が壊れまくるな
htmltodatByFiddlerは
0182名無しさん@お腹いっぱい。2015/02/27(金) 00:18:48.61ID:pkVVdIZI0
>>19のFiddlerScriptがメール欄デコードしてるから
移植してみれば
0183名無しさん@お腹いっぱい。2015/02/27(金) 00:22:50.77ID:ZI82dLoW0
>>181
about@ne.jp はどうよ?
0184名無しさん@お腹いっぱい。2015/02/27(金) 00:25:21.20ID:ZI82dLoW0
ためしにもう一個
info@co.jp 👀
0185名無しさん@お腹いっぱい。2015/02/27(金) 00:26:06.88ID:ulCopddq0
.
0186名無しさん@お腹いっぱい。2015/02/27(金) 00:29:26.79ID:PaQA3RxW0
かちゅおねがい
0187名無しさん@お腹いっぱい。2015/02/27(金) 00:34:12.34ID:9/H5Odc40
>>19
JaneXeno/150114で使ったらログが壊れるので、
スクリプト130行以降を全部削ったら使える様になりました。
ありがとうございます。
0188名無しさん@お腹いっぱい。2015/02/27(金) 01:17:01.74ID:jO2BHuQV0
read.cgiの半角スペース処理の関係上
オリジナルdatと完全互換なhtml2datを作るのは不可能な模様
0189名無しさん@お腹いっぱい。2015/02/27(金) 01:18:20.01ID:Kp8WjHqy0
具体的には?
0190名無しさん@お腹いっぱい。2015/02/27(金) 01:25:48.03ID:CkhMnjzt0
行末の半角スペースの有無がhtmlでは分からない
↑の行は最後に半角スペースがある、datだと分かるがhtmlでは分からない
0191名無しさん@お腹いっぱい。2015/02/27(金) 01:27:18.75ID:+JE0ec2M0
>>190
それのせいでscがスクレイピング使ってるのが確定したからね
0192名無しさん@お腹いっぱい。2015/02/27(金) 01:34:13.96ID:qOQoZo540
>>189
特徴的なのはコピペした投稿

書き込み完了前の時点で各行の最後に半角スペース(\x20)が入る
書き込み後のdat上では\x20\x20<br>となってるけど
read.cgi通すと\x20<br>に変換される

改行の処理が \n → \x20<br>\x20 なんで各行の前後に半角スペースが必ず挿入される仕様
0193名無しさん@お腹いっぱい。2015/02/27(金) 01:50:13.11ID:ulCopddq0
>>187
それ単にdatにアクセスしてるだけじゃね?
0194名無しさん@お腹いっぱい。2015/02/27(金) 01:51:13.61ID:pkVVdIZI0
>>189
>>192ぐらいなら置換で戻せるし、行頭半角はbbs.cgi?の段階で削除されるから
文字と文字の間に複数個の半角スペース入れたりしない限りまぁ大丈夫
ただAA初心者とか整形しようとすると結構やっちゃうけどな

"無意味な空白は1つだけにする"でググるとそこらへんの処理が出てくるな
1byteでも転送量を減らそうという当時の努力が窺い知れる・・
0195名無しさん@お腹いっぱい。2015/02/27(金) 01:51:20.14ID:5OJ3SYiJ0
そもそもWebで見た時にはそう表示されるんだから、
Whitespaceのプログラムでも書き込まない限り問題ないんだけどね
どのみち差分取得するならどっかにレス番かログ保存しとく必要あるし
0196名無しさん@お腹いっぱい。2015/02/27(金) 02:01:27.50ID:p3P4xXWJ0
メール欄が壊れまくるな
htmltodatByFiddlerは
0197名無しさん@お腹いっぱい。2015/02/27(金) 02:03:48.48ID:72X9Hzyb0
行末のスペースならAAも崩れたりはしないよね?
実用上は問題なさそうだけど
0198名無しさん@お腹いっぱい。2015/02/27(金) 02:06:09.60ID:ch/QUMXQ0
行末のスペースを見て何らかの処理をする専ブラってあるのかな?
0199名無しさん@お腹いっぱい。2015/02/27(金) 02:06:14.60ID:DRLw6QtK0
>181
2015/02/27(金) 00:09:18.47 ID:2darJ9Q20<>\x20メール欄が壊れまくるな\x20<br>\x20htmltodatByFiddlerは\x20<>
2015/02/27(金) 00:09:18.47 ID:2darJ9Q20<dd>\x20メール欄が壊れまくるな\x20<br>\x20htmltodatByFiddlerは\x20<br><br>

>196 (>181のコピペ)
2015/02/27(金) 02:01:27.50 ID:p3P4xXWJ0<>\x20メール欄が壊れまくるな\x20\x20<br>\x20htmltodatByFiddlerは\x20<>
2015/02/27(金) 02:01:27.50 ID:p3P4xXWJ0<dd>\x20メール欄が壊れまくるな\x20<br>\x20htmltodatByFiddlerは\x20<br><br>

上DAT
下html
本文の半角スペースを\x20で表記

>196の書き込み内容 (ギコナビの送信記録)
Body=%83%81%81%5B%83%8B%97%93%82%AA%89%F3%82%EA%82%DC%82%AD%82%E9%82%C8%20%0D%0AhtmltodatByFiddler%82%CD%20
0200名無しさん@お腹いっぱい。2015/02/27(金) 02:08:14.01ID:qaMrVnKn0
空白1つなんて圧縮されて誤差にもならないんじゃね
0201名無しさん@お腹いっぱい。2015/02/27(金) 02:11:22.58ID:qOQoZo540
>>197-198
datのファイルサイズが変わる

DAT廃止後にあぼーん検出で再取得必須
0202名無しさん@お腹いっぱい。2015/02/27(金) 02:14:51.79ID:qRKvXgSE0
datにアクセス出来ないんだからdatのサイズはどうでも良い気が
0203名無しさん@お腹いっぱい。2015/02/27(金) 02:16:56.71ID:CkhMnjzt0
datアクセス廃止以降、既にdat取得済みのスレッドに対してhtml2datなプロクシ経由で差分取得することになると
一度ログ消して再取得しなけりゃならん、という程度
0204名無しさん@お腹いっぱい。2015/02/27(金) 02:20:14.27ID:JqEh1bTS0
>>203
それだけ


であればいいけどね
read.cgiのhtml出力仕様がコロコロ変わると大変な事に
0205名無しさん@お腹いっぱい。2015/02/27(金) 02:29:19.06ID:72X9Hzyb0
あーなるほど過去ログが問題になるのか
0206名無しさん@お腹いっぱい。2015/02/27(金) 02:30:24.34ID:Kp8WjHqy0
みなさん詳しくどうもありがとう
参考にさせてもらいます
0207名無しさん@お腹いっぱい。2015/02/27(金) 02:50:10.62ID:5OJ3SYiJ0
差分リクエストに1からのDAT送りつけたら…どうなるかはブラウザ次第か
V2Cの場合ログが勝手に再構成されるから問題なかった。再取得操作は不要

ここまで一切弄ってこなくて、SCのCGI経由クロール判明以降も全く弄ってなかったんだし、変わる可能性は薄いと思うけど
API流用型の改造も出てきてる今、現状使用者は相当少なくなるであろうこの手の串対策に変えてくるかなあ
0208名無しさん@お腹いっぱい。2015/02/27(金) 03:30:37.58ID:BnR2ZpVg0
PC用は回避方法は分かったが、スマホは回避方法あるの?
0209名無しさん@お腹いっぱい。2015/02/27(金) 03:42:52.44ID:p3P4xXWJ0
>>207
>差分リクエストに1からのDAT送りつけたら
クラウド鯖使うようになった初期の頃を知らんのか・・・
今年の1月後半ぐらいなんだがな

差分取得する毎に「あぼーん検出→再取得」のコンボだったよ
あぼーん検出不可なブラウザはどうなるか知らん
少なくともギコナビは取得済みから -8 Byteでリクエストしてこの 8 Byteが違っていたらあぼーん検出
かちゅ〜しゃ+kageの方は -1 Byteでリクエストして受信した最初が \x0A じゃなければあぼーん扱い
0210名無しさん@お腹いっぱい。2015/02/27(金) 03:46:27.31ID:pkVVdIZI0
ギコナビは16byteじゃなかったっけか
0211名無しさん@お腹いっぱい。2015/02/27(金) 04:05:24.38ID:dKp87VDM0
ごめん 16 Byteだった
0212名無しさん@お腹いっぱい。2015/02/27(金) 04:48:57.48ID:5OJ3SYiJ0
>>209
いや検出からの再取得じゃなく、串が動いたのは最初の1回のみで、何くわぬ顔でDAT再構築したんだよV2C
0213名無しさん@お腹いっぱい。2015/02/27(金) 04:52:59.54ID:5OJ3SYiJ0
あ、いや見間違いだ普通に2回動いてたわすまん
0214名無しさん@お腹いっぱい。2015/02/27(金) 09:09:21.05ID:e3oaOS3L0
node.jsで新APIを利用する簡易串のコードサンプルを書いてみたんだが
新APIの仕様についての話題は、このスレでいいのか?
0215名無しさん@お腹いっぱい。2015/02/27(金) 10:07:18.29ID:fd7kMbQz0
どうぞどうぞ
0216名無しさん@お腹いっぱい。2015/02/27(金) 10:38:19.06ID:e3oaOS3L0
node.js用 新API串 サンプル
http://pastebin.com/VGTR7Sf0

セッションIDを起動時に取得したまま、ずっと使い続けるテキトー実装だけど
セッションの有効期限って、どれくらいやろ
あと、if-modified-since、rangeリクエストをそのまま通過させてAPIに投げると
更新なし時にステータスコードが200で、bodyが404の返答があるのは何でや
0217名無しさん@お腹いっぱい。2015/02/27(金) 11:20:05.06ID:PzY0nG8D0
これ↓のことかな?ならバグみたい

778 :名無しさん@お腹いっぱい。 [] :2015/02/27(金) 10:27:03.28 ID:+kID8sEa0 (7/7) [PC]
>>771
これはAPIの仕様かバグですね
ステータスコード 206 で返るべきところ、ステータスコード 200で返って来るので再取得が走ってしまう
一応対処は可能だけど、これは他の専ブラも困ってるはずで、API側で直してくれるかも
山下、これ直しとけよ
0218名無しさん@お腹いっぱい。2015/02/27(金) 11:22:38.01ID:uGN5EnM20
>>217
ソースどこよ
0219名無しさん@お腹いっぱい。2015/02/27(金) 11:25:31.26ID:dMhmA4e+0
>>218
http://anago.2ch.net/test/read.cgi/software/1424315959/778
0220名無しさん@お腹いっぱい。2015/02/27(金) 11:26:19.12ID:PzY0nG8D0
V2C_R78スレ見てよ 
0221名無しさん@お腹いっぱい。2015/02/27(金) 11:29:38.83ID:67qHA7oQ0
>>216
windowsで動いてる
サンクス
0222名無しさん@お腹いっぱい。2015/02/27(金) 11:41:01.10ID:+kID8sEa0
>>217
仕様とか言い出すかもなw
0223名無しさん@お腹いっぱい。2015/02/27(金) 11:44:10.68ID:HO0ehFM20
俺用メモ
http://anago.2ch.net/test/read.cgi/software/1424327586/
>>835
0224名無しさん@お腹いっぱい。2015/02/27(金) 12:49:39.53ID:zn/JeIfB0
>>216
これとNode.jsとPython 2.7があれば良いのかな?
後でやってみよう

Node.js
http://nodejs.org/download/
Python 2.7
https://www.python.org/downloads/
0225名無しさん@お腹いっぱい。2015/02/27(金) 13:10:51.81ID:e3oaOS3L0
>>217
206は返ってきているようだが、304 Not Modifiedが返ってこないな
というより、20xのときは直にdatアクセスしたときの同じようなレスポンスが返ってくるから
サーバーが内部的にリクエストを転送してる気がする
if-modified-sinceヘッダーを取り除けば、問題は無くなりそう

>>224
ソースからインストールする場合と書いてあるから、Pythonは要らないかも
0226名無しさん@お腹いっぱい。2015/02/27(金) 19:47:06.05ID:F+4QaO2U0
>>19にhtmltodatByFiddlerからBeとhrefの処理コピペして
email-protectionが無い場合はそのままmail返すように変えて使ってみたよー
htmltodatByFiddlerの場合はemail-protectionを>>19のように'X'までにするように直す必要があるね
本文のemail-protection処理はどっちも必要

ってかJSとか弄った事ないからよく分からねー
0227名無しさん@お腹いっぱい。2015/02/27(金) 19:59:58.01ID:his4tOUj0
今までのローカルにある過去ログとの共存は可能?
結構なログをローカルに溜め込んでいるのよね
0228名無しさん@お腹いっぱい。2015/02/27(金) 20:09:26.60ID:G6wuAdBj0
216走らせると「proxy server is listening on port 8088」って出るけど、この状態でポート8088経由すれば
API使ってることになるのかな?API使用してる確認法がわからん・・・
0229名無しさん@お腹いっぱい。2015/02/27(金) 20:37:55.59ID:e3oaOS3L0
>>228
ローカルであればプロキシ設定にlocalhost:8088と指定すれば使えているはず
一応、サンプルコードなので実用には注意

78行目あたりに
console.log(response.headers);
とか追記しておけば、APIにアクセスする度に返ってきたヘッダーを出力してくれる
0230名無しさん@お腹いっぱい。2015/02/27(金) 20:44:48.19ID:Hii81umz0
>>216
セッションの期限は2chmateだと55分でセッションID取り直しているみたいだから1時間くらいじゃね?
0231名無しさん@お腹いっぱい。2015/02/27(金) 21:11:11.80ID:e3oaOS3L0
しばらく放置してるけど、未だに期限切れないので数時間は有効
実装いいかげんやな
0232名無しさん@お腹いっぱい。2015/02/27(金) 22:34:08.15ID:CkhMnjzt0
rokkaと同じなら24h有効だな
0233名無しさん@お腹いっぱい。2015/02/27(金) 23:31:38.98ID:CWhmdBOJ0
>>216
仕様だ諦めろ
0234名無しさん@お腹いっぱい。2015/02/28(土) 02:18:07.46ID:xxxBU7UG0
htmltodatByFiddlerは派生が、たくさん出来ていてどれがいいのか分からない・・・・
どれが最新なんだろうか
0235名無しさん@お腹いっぱい。2015/02/28(土) 02:39:26.18ID:lKCuzRBJ0
>>233
山下SpyleはAPIのバグで近日中直すって言ってたけどな
0236名無しさん@お腹いっぱい。2015/02/28(土) 04:23:39.36ID:lvAKUUCw0
技術ない山下がAPI書いてんのかそりゃクソになるわ
0237名無しさん@お腹いっぱい。2015/02/28(土) 04:28:06.57ID:25W0vuuW0
ソフト404わろす
0238名無しさん@お腹いっぱい。2015/02/28(土) 04:35:01.01ID:19zlKYBH0
Styleスレ見てきたけど検証してみるとか言ってるだけでAPI直すなんて書いてなかったぞw
「API側の不具合で近日修正予定とのことです」とか言ってるし鯖のAPIなんて弄れないでしょ
0239名無しさん@お腹いっぱい。2015/02/28(土) 04:45:52.63ID:MP7KfPZR0
“2ちゃんねる”専用ブラウザー「Jane Style」のテスト版v3.80β、新APIをサポート - 窓の杜
>  なお、新しい“2ちゃんねる”のAPIはまだテスト中で、差分取得リクエストに失敗して「Jane Style」の
> タイトルバーが赤色になることがあるという。これはAPI側の不具合で、近日修正される予定。
http://www.forest.impress.co.jp/docs/news/20150223_689599.html
0240名無しさん@お腹いっぱい。2015/02/28(土) 04:53:25.87ID:045xG2Cl0
APIはCMって聞いたぞ
山下が開発してんのか?
0241名無しさん@お腹いっぱい。2015/02/28(土) 05:02:32.96ID:eq4duOfG0
>>240
CMでしょ
広告部分は分からんけど
0242名無しさん@お腹いっぱい。2015/02/28(土) 05:18:21.95ID:0wP+XlhP0
山下がCMあたりに鯖を直してくれと頼みこんでいるんだろ
0243名無しさん@お腹いっぱい。2015/02/28(土) 05:25:11.89ID:FizJnEAg0
豆腐付きでレスしてる奴がちょいちょい目につくようになってきたぞ
0244名無しさん@お腹いっぱい。2015/02/28(土) 05:37:26.24ID:25W0vuuW0
豆腐?
0245名無しさん@お腹いっぱい。2015/02/28(土) 06:32:12.65ID:5a21MezF0
あー、もしかして最後に□が付いてるやつはそういうやつか
最近全然プロクシとか縁のなさそうな別スレで気になってた
0246名無しさん@お腹いっぱい。2015/02/28(土) 07:21:49.36ID:bG6QwhyB0
��
0247名無しさん@お腹いっぱい。2015/02/28(土) 08:17:44.68ID:QuJsHNUk0
>>216
XPでも動作しました、ありがとうございます。
というかNode.jsが動く環境なら2000でもいけそうだね。
0248名無しさん@お腹いっぱい。2015/02/28(土) 09:00:57.92ID:H+TQKx4C0
JaneStyle入れてみたけど、デフォルトで起動した後の
20年前くらいのVC++で作ったようなダサい画面構成をみて
そっとアンインストールした
0249名無しさん@お腹いっぱい。2015/02/28(土) 09:13:09.45ID:H+TQKx4C0
誤爆すまん
0250名無しさん@お腹いっぱい。2015/02/28(土) 10:36:41.13ID:H/0OS4UL0
>>216 のスクリプトと >>224 の node.exe (Windows Binary)
でギコナビでも行けた。環境は32bit版windows7
しばらく様子を見てみようと思う。
ありがとう!
0251anonymous@ne.jp2015/02/28(土) 21:35:46.91ID:HNZCqnK30
html2datキラー
0252anonymous@ne.jp2015/02/28(土) 21:47:58.21ID:I6kPaz/J0
html2datキラー はこっちだった模様
0253名無しさん@お腹いっぱい。2015/02/28(土) 22:21:39.86ID:bG6QwhyB0
何これ?
■ このスレッドは過去ログ倉庫に格納されています