[MASOCH-L] dominio super fraudulento

Leandro leandro at spfbl.net
Fri Jul 28 17:12:45 BRT 2017


Em 28 de julho de 2017 14:12, Danton Nunes <danton.nunes at inexo.com.br>
escreveu:

> On Fri, 28 Jul 2017, Leandro wrote:
>
> Em 28 de julho de 2017 13:12, Danton Nunes <danton.nunes at inexo.com.br>
>> escreveu:
>>
>> On Fri, 28 Jul 2017, Leandro Carlos Rodrigues wrote:
>>>
>>> E de uma originalidade incrível:
>>>
>>>>
>>>>> domain:      co-conficuracao2001.com.br
>>>>> domain:      co-conficuracao2002.com.br
>>>>> domain:      co-conficuracao2003.com.br
>>>>> domain:      co-conficuracao2004.com.br
>>>>> domain:      co-conficuracao2005.com.br
>>>>> domain:      co-conficuracao2006.com.br
>>>>> domain:      co-conficuracao2007.com.br
>>>>>
>>>>>
>>>> Eita. Vou aproveitar para listar esses também, já que não temos mais
>>>> como
>>>> ver a lista completa. Valeu!
>>>>
>>>>
>>> a lista poderia conter expressões regulares ou wildcards em vez de nomes
>>> simples. facilitaria em casos como este.
>>>
>>
>>
>> Pode crer Danton. A gente tem isso implementado sim. Mas a dificuldade
>> seria em descobrir que se trata de uma sequencia tendo como amostra apenas
>> um domínio.
>>
>
> um wildcard assim resolveria neste caso: co-conficuracao*.com.br


Pode crer. Eu prefiro não usar um wildcard toda hora porque a busca dele é
O(n) para n wildcards registrados. A busca do domínio puro é O(1). Mas
quando há certeza que o sujeito está realmente gerando sequencias, ai vale
muito a pena usar o wildcard e eu tenho muito prazer em fazer isso.

Então quando aparece três casos da mesma sequencia, ai dá para ter muita
certeza que se trata de sequência para valer o esforço computacional a
mais. Mas se a gente registrar todos os casos de apenas uma amostra, sem
ter certeza que é sequencia mesmo, isso pode impactar levemente o tempo de
reposta da consulta porque são realmente muitos casos que poderiam ser
considerados uma sequencia mas poucos se confirmam como sequencia real.
Essa lista que o Rubens deixou muito evidente que se trata de sequencia,
mas olhando somente a amostra que dei, não tinha como ter certeza que era
sequencia naquele momento. Por isso que não registrei.

Além disso, como a gente tem cerca de 5 milhões de consultas, o consumo de
CPU a mais seria bem considerável no total. Tô tentando poupar esses
recursos para não precisar ficar escalando as máquinas o tempo todo no
futuro manja?


>
> __
> masoch-l list
> https://eng.registro.br/mailman/listinfo/masoch-l
>


More information about the masoch-l mailing list