[GTER] Cache de BitTorrent

Fabrício Cabral fabriciofx at gmail.com
Fri Jul 10 00:11:28 -03 2009


2009/7/9 Provedor Bogus <provedorbogus at gmail.com>:

> É possível descriptografá-lo, mas, haja CPU pra fazer isso em cada pacote.
> Por isso a necessidade de um ASIC dedicado pra isso.
> E sim, só através de MITM, que é a forma com que o cache funciona
> atualmente. :-)

É, imaginei que haveria o overhead por conta de criptografia e um ASIC com
certeza ajudaria muito. :)


> Os usuários desse tipo de protocolo não são os mesmos que usam a Internet só
> pra acessar e-mails e vídeos do Youtube. Esse pessoal é despachado e eles
> percebem que se desligarem a criptografia a coisa anda mais rápido.
> Deu pra ver isso aqui claramente.

Interessante. Fica mais rápido porque diminui o overhead, ou porque uma vez
que a criptografia está ligada, só é permitido fazer a conexão com outros peers
que também tenham a criptografia ligada?


> Seu raciocínio está correto. Muita gente estará baixando, mas, de Torrents
> diferentes:
> um do XVID-PUKKA, outro do XVID-ZUKKA e assim por diante. É o mesmo arquivo,
> só que com Torrents diferentes.  Estamos trabalhando numa forma de fazer um
> hash
> MD5 nos arquivos para saber quais deles são coincidentes. Mesma operação que
> o
> Emule faz, por exemplo. Isso causará um incremento no hit ratio ainda não
> estimado.

Desculpe a ignorância, mas não entendi o que você quer dizer com "mesmo arquivo,
mas como torrents diferentes". A priori, se os arquivos são iguais,
isto é, apresentam
o mesmo hash MD5/SHA1/SHA256 eles seriam coincidentes e assim você poderia
passar o segmento requisitado por um ou pelo outro a partir do mesmo arquivo
armazenado no cache. Mas note que os arquivos tem que ser *idênticos*. Se mudar
UM bit, já não são mais idênticos.


> Poxa, bem que eu queria que não fosse. :-)
> Nosso tráfego, só de Torrent e fora Emule, é de 300 mbps em média. Pico de
> 500 mbps
> as vezes.

Heheheheheh :D


> Pela diversidade de Torrents. :-(

Conforme dito anteriormente, se os arquivos forem idênticos, dá
pra dar um jeito. Caso não sejam, não consigo ver uma solução.


> Foi a primeira coisa que pensei e torci pra que isso fosse verdade porque aí
> seria
> só corrigí-lo.

Às vezes o defeito não é tão óbvio assim. Ou tão simples... ;)


> Cada torrent possui um infohash e esse é o índice usado.

Este infohash, seria um hash do arquivo, como MD5/SHA1/SHA256? Se sim,
então os arquivos são diferentes e querer buscar o segmento de um a partir
do outro é um problema. :/


> É como dizem: a teoria, na prática é diferente. :-)
> Durante o processo de estudo de viabilidade do projeto do Cache e mesmo do
> desenvolvimento
> percebemos que está havendo, gradualmente, um incremento no tamanho dos
> arquivos baixados.
> Hoje em dia é comum os usuários baixarem filmes em HTDV 720p em arquivos de
> 4 Gb.
> Isso se deve muito a popularização das TVs de LCD e Plasma num preço
> acessível.

Interessante saber como o perfil do consumidor e novas tecnologias
acabam mudando
o tráfego internet. :)


> Esta situação só aumenta a necessidade de mais tráfego P2P para popular o
> cache.

Verdade.


> Certamente que não. Mas o hit ratio sofre incrementos se você tiver uma boa
> quantidade
> de disco, então, mais HD entra na planilha de investimentos.
> Imaginemos que num mundo perfeito do cache todos os arquivos estivessem
> guardados
> na máquina de conteúdo. O hit ratio seria de 100%.
> Como isso não é possível, o melhor é armazenar a maior quantidade de
> conteúdo possível
> dentro de um custo razoável.

Concordo.


> Do meu ponto de vista, não ajuda, porque ele não fornece nenhum subsídio
> para que o
> usuário saiba o que está ou o que não está em cache.
> Isso é um mecanismo interno do programa que não precisa ser revelado numa
> demanda
> jurídica em que o foco é outro.

Desculpe, mas este seu argumento é falho. É a mesma coisa de fazer pré-fetching
do arquivo a ser cacheado: você faz o pré-fetching com o intuito de acelerar o
download do arquivo, e o usuário também não sabe que seu cache está fazendo isso
ou o quê está ou não no cache. Infelizmente pré-fetching do arquivo, do ponto de
vista jurídico de cache P2P é ilegal, pois com isso você está
ajudando, mesmo que
indiretamente, o usuário a baixar conteúdo da Internet. Como eu disse,
a linha que
separa o que é legal do que é ilegal é muito tênue. :)


> É verdade. Somos um país de gente de tecnologia da mais alta capacidade.
> Isso pode ser
> atestado pelo nível desta lista.

Concordo plenamente. :)


> Certamente vou querer ouvir sua opinião sobre o funcionamento do software.

E com certeza eu o farei, se me for permitido. :)

[]'s

-- 
--fx



More information about the gter mailing list