ファイルのハッシュ値が同じであれば同一とみなしても問題無いから
ひとりから100%取り出す必要は無いと思うが・・・

そのノードが完全キャッシュを持っている状態だと把握する事
そのノードが何をリクエストしてたか

それをクローラーが立証できるかどうか
トレの場合は、違法ファイルを流す事前提で設計されてる訳ではないので
クローラーじゃなくてもPC1台で把握は可能てところか