[GTER] newbie - lista com todos os dominios .BR
Marco Modesto
marcoabmod at yahoo.com.br
Mon Nov 22 11:36:23 -02 2004
--- Alexandre Hautequest <hquest at onda.com.br>
escreveu:
> Marco Modesto wrote:
> > Ola!
> >
> > Preciso percorrer todas as paginas (ou parte) da
> Web
> > brasileira. Para facilitar, considero que fazem
> parte
> > da Web BR todas as paginas com dominio .BR.
>
> Globo.com ja esta fora da tua consideracao.
Realmente esta exigencia exclui muitas paginas
brasileiras, porem o problema eh facilitado
substancialmente. Acho que se nao excluisse eu teria
que avaliar se o idioma da pagina eh portugues
brasileiro e, alem disso percorreria muito lixo
aumentando muito o trafego.
>
> > Se eu tentasse todos os IPs brasileiros, cairia no
> > problema que muitos dominios .BR estao hospedados
> em
> > IPs estrangeiros, correto?
>
> Alem de visualizar apenas o dominio principal, no
> caso de empresas de
> hosting baseadas em dominios virtuais.
>
> > Existe uma forma de se obter a lista de todos os
> > dominios brasileiros? Sei que o Registro.BR a
> possui.
>
> Acredito que a informacao deste modo seja
> considerada confidencial pelo
> Registro.BR.
O Registro.BR divulgou a lista dos dominios
autorizados em novembro:
http://registro.br/info/proclib-l.html
Se eu conseguisse essa lista nos periodos
anteriores...
>
> <macabro>Tenta comprar a base de dominios da BrT ou
> outras teles... eles
> devem vender, ja que vendem ate a mae...</macabro>
>
> > Nao posso sair percorrendo todas as referencias
> > (links) de um conjunto inicial de paginas pois
> existem
> > ilhas que nao sao apontadas por ninguem.
>
> Talvez as ilhas sejam menores que a dificuldade em
> obter tal informacao
> de modo "legal".
Voce pode estar certo, porem para o projeto, seria
importante mensurar as ilhas.
Alguns estudos, como o do Lawrence estimam que os as
maquinas de busca indexem apenas 30% das paginas
existentes na Web publica indexavel.
>
> >
> > Obrigado,
> >
> >
> > Marco Aurelio Barreto Modesto
> > Ciencia da Computacao/UFMG
>
> Eh um projeto, ao meu ver, um tanto quanto
> complicado.
>
Porem dependendo da estrategia abordada ele pode ser
facilitado, como o uso da lista do Registro.br.
> --
> Alexandre
> --
> GTER list
> https://eng.registro.br/mailman/listinfo/gter
>
[]s
Marco.
__________________________________________________
Do You Yahoo!?
Tired of spam? Yahoo! Mail has the best spam protection around
http://mail.yahoo.com
More information about the gter
mailing list