[GTER] Cache de BitTorrent

Provedor Bogus provedorbogus at gmail.com
Thu Jul 9 18:52:05 -03 2009


>
> Não acho que dê pra descriptografá-lo. Talvez um Man-In-The-Middle seja a
> solução.


É possível descriptografá-lo, mas, haja CPU pra fazer isso em cada pacote.
Por isso a necessidade de um ASIC dedicado pra isso.
E sim, só através de MITM, que é a forma com que o cache funciona
atualmente. :-)



> A abordagem de alguns, pelo que eu pude ver, é fazer com que o usuário
> ache bom usar o cache. Para isso, alguns disponibilizaram plugins para
> que os aplicativos P2P procurasse o cache e o utilizassem. Acredito que
> dessa maneira, eles optem por não usar criptografia.


Os usuários desse tipo de protocolo não são os mesmos que usam a Internet só
pra acessar e-mails e vídeos do Youtube. Esse pessoal é despachado e eles
percebem que se desligarem a criptografia a coisa anda mais rápido.
Deu pra ver isso aqui claramente.


> Sinceramente, eu ainda acho que tem alguma coisa errada. Não é possível.
> Quer dizer que aquele filme quentíssimo, que está pipocando no PirateBay
> e no Mininova (altos seeders e leechers) tem pouca gente baixando? Só
> consigo
> imaginar quatro hipóteses:


Seu raciocínio está correto. Muita gente estará baixando, mas, de Torrents
diferentes:
um do XVID-PUKKA, outro do XVID-ZUKKA e assim por diante. É o mesmo arquivo,
só que com Torrents diferentes.  Estamos trabalhando numa forma de fazer um
hash
MD5 nos arquivos para saber quais deles são coincidentes. Mesma operação que
o
Emule faz, por exemplo. Isso causará um incremento no hit ratio ainda não
estimado.


1. O perfil dos seus usuários não é de baixar arquivos via P2P;


Poxa, bem que eu queria que não fosse. :-)
Nosso tráfego, só de Torrent e fora Emule, é de 300 mbps em média. Pico de
500 mbps
as vezes.


> 2. Alta variabilidade dos requests dos seus usuários. E aí a pergunta
> é por que isso ocorre;


Pela diversidade de Torrents. :-(


> 3. Tem alguma coisa errada com o seu cache;


Foi a primeira coisa que pensei e torci pra que isso fosse verdade porque aí
seria
só corrigí-lo.

4. Eu estou completamente perdido. :D


Seu raciocínio é coerente.



> Como você faz para dar o "matching" entre o arquivo que está no caching e o
> que o usuário procura?


Cada torrent possui um infohash e esse é o índice usado.



> > Fizemos alguns "trials" com outros caches e esse número só se estabilizou
> em
> > 13 TB.
>
> Bom, o paper que eu vi isso é um pouco antigo. Não sei se mudou muita
> coisa.
> Além do mais, uma coisa é um paper, outra é o mundo real. Normalmente, as
> coisas não casam bem entre esses 2 mundos... :D


É como dizem: a teoria, na prática é diferente. :-)
Durante o processo de estudo de viabilidade do projeto do Cache e mesmo do
desenvolvimento
percebemos que está havendo, gradualmente, um incremento no tamanho dos
arquivos baixados.
Hoje em dia é comum os usuários baixarem filmes em HTDV 720p em arquivos de
4 Gb.
Isso se deve muito a popularização das TVs de LCD e Plasma num preço
acessível.

Esta situação só aumenta a necessidade de mais tráfego P2P para popular o
cache.



> Bom, pra mim disco é custo. Se você vai partir para uma solução comercial,
> diminuir os seus custos não seria nada mal, não é? ;)


Certamente que não. Mas o hit ratio sofre incrementos se você tiver uma boa
quantidade
de disco, então, mais HD entra na planilha de investimentos.
Imaginemos que num mundo perfeito do cache todos os arquivos estivessem
guardados
na máquina de conteúdo. O hit ratio seria de 100%.
Como isso não é possível, o melhor é armazenar a maior quantidade de
conteúdo possível
dentro de um custo razoável.


> A questão é: o fato do cache fazer uma consulta externa da
> popularidade do arquivo
> ajuda em algum sentido o usuário a baixar conteúdo? Você pode achar que
> não,
> e uns 200 advogados podem argumentar que sim. Quem está certo? Eu prefiro
> não arriscar. Veja que utilizar um algoritmo de replacement não cai
> nessa questão,
> pois ele atuaria sobre os dados em si.


Do meu ponto de vista, não ajuda, porque ele não fornece nenhum subsídio
para que o
usuário saiba o que está ou o que não está em cache.
Isso é um mecanismo interno do programa que não precisa ser revelado numa
demanda
jurídica em que o foco é outro.


> Não vejo nada de impossível nisso. E acredito piamente que muitos
> brasileiros
> duvidam da sua própria capacidade. :)


É verdade. Somos um país de gente de tecnologia da mais alta capacidade.
Isso pode ser
atestado pelo nível desta lista.
Como eu disse numa outra mensagem, a palavra "duvidam" foi mal colocada.
As pessoas estão ávidas para ver o software rodando, até porque, é uma
solução para
o maior problema de qualquer provedor: banda de internet x qualidade de
serviço.

No mais, você e sua empresa estão de parabéns. E quando o VNC estiver
> liberado,
> avise aqui na lista do GTER. Eu mesmo estou doido pra ver isso
> funcionando... :)


Obrigado !
Certamente vou querer ouvir sua opinião sobre o funcionamento do software.



More information about the gter mailing list