[GTER] Cache de BitTorrent

Fabrício Cabral fabriciofx at gmail.com
Sun Jul 12 18:19:33 -03 2009


Olá,

2009/7/10 Provedor Bogus <provedorbogus at gmail.com>:

> Fica mais rápido porque conseguimos identificar o tráfego e cacheá-lo. :-D
> Normalmente os clients de Torrent permitem selecionar se exigirão
> criptografia ou se
> tolerarão conexões sem ela. Por padrão, o client mais popular (uTorrent) vem
> com ela
> desabilitada e poucos usuários se tocam em tentar habilitá-la.

Heheheheh :)


> Aí é que mora o perigo. O infohash é do Torrent e não por arquivo.
> Se você pegar um filme e criar um .torrent ele já terá outro infohash
> diferente, mesmo tendo
> sido gerado com o mesmo conteúdo do Torrent de origem.
> Assim, o infohash de um Torrent do Demonoid será diferente de outro do
> PirateBay,
> prejudicando o hit ratio. Mas os arquivos lá dentro são iguais.

Agora eu entendi o problema. Confesso que era por preguiça de minha parte
de dar uma olhada no protocolo do BitTorrent (eu só conheço o protocolo
do eMule). Lá no eMule ele envia um hash (SHA256) do arquivo que está sendo
trocado, assim fica fácil saber qual é o arquivo; diferentemente do que ocorre
no BitTorrent, que aquele hash (info_hash) que vai é do metadados (.torrent)
já que os hashes são os próprios nome e path dos arquivos.

Assim, realmente fica difícil de mapear dentro do cache, e agora entendo
o seu problema de popular o cache, já que você tem hashes diferentes
(nomes dos arquivos) para o mesmo conteúdo.

No entanto, veja a seguinte possibilidade: segundo eu olhei no specs
do protocolo
BT, quando é transmitido um piece do arquivo, ele envia junto um hash SHA1
deste piece. Assim, ao invés de tentar dar o match pelo info_hash, será que
dando um match pelo piece não seria mais eficiente? Só teríamos que rezar
para que o tamanho dos piecies dos arquivos de mesmo conteúdo (mas
info_hashes diferentes) fossem do mesmo tamanho, para dar o match com o
SHA1.

> Concordo. O problema é que observando o tráfego e o comportamento da rede,
> nota-se que o
> cache está funcionando perfeitamente, mas, o conteúdo é que é mesmo bem
> diverso.
> Um erro de código nesse caso seria muito fácil de ser encontrado.
> Fora que esse problema foi exaustivamente acompanhado.

Olha a minha ideia acima. Não sei se vai funcionar, mas...


> Eu também acho que pre-fetching é ilegal, porque você também está baixando
> conteúdo protegido
> por lei.
> Porém, nesse caso, eu não baixei nada de ninguém. É uma consulta simples ao
> tracker para
> saber de estatísticas.

Como eu disse, a linha que separar o legal do ilegal é muito tênue. Se hospedar
o .torrent já é visto como ilegal (até hospedar legenda eles acham que
é) pra chegar
na consulta de um site desses é um pulo. :/

[]'s

-- 
--fx



More information about the gter mailing list