[MASOCH-L] Spam Archives

Jeronimo Zucco jczucco at ucs.br
Thu May 12 19:54:35 BRT 2005


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

	No caso dos filtros baeysianos, concordo que seria um teste "viciado".
Para evitar isso, eu faria uma amostragem dos e-mails spam e nao-spam
(ham) para treinamento.
	Com certeza a utilizacao de todas traz resultado melhor. Mas voce
consegue saber hoje quantos e-mails que são rejeitados pela técnica  X
ou Y? E qual falso-positivo e falso-negativo foi gerado por qual técnica
? Qual deles gerou atraso de e-mail não necessário?
	Inclusive a ordem da aplicação das técnicas em conjunto influi em
muitos fatores, como uso do link, processamento, espaço em disco, etc.
	Algumas vantagens poderiam ser facilmente comprovadas como o uso do
greylist somente em mensagens que não passem pela verificação do SPF ou
na verificação do cabeçalho do e-mail, por exemplo. Mas será que isso
seria suficiente a ponto de eu dizer que não preciso mais de filtros
como o spamassassin ou o bogofilter que demandam horrores de cpu e tem
alto índice de falso positivos se mal configurados?
	É justamente isso que eu quero fazer: colocar isso na prática, e em
números. Por isso precisos das amostras de mensagens.

Abraço !
	
- --
Jeronimo Zucco
LPIC-1 Linux Professional Institute Certified
Certificado Conectiva Linux
Núcleo de Processamento de Dados
Universidade de Caxias do Sul

"Use the Source, Luke!"


Marcos Tadeu wrote:
> O interessante sobre anti-spam, principalmente nos que usam técnica com filtro
> "baysiano", é justamente ser "viciado" nos emails daquele provedor (pouca acuidade),
> daquela empresa (melhor acuidade) ou daquele setor (muito boa acuidade) ou daquele 
> email destino (a melhor acuidade). É assim pois ele "aprende" exatamente quais 
> são os emails (tipos, servidores origem, assuntos, etc) legítimos.
> O bom filtro baysiano deve ter uma base de tokens para cada usuário...
> 
> Na prática, todas estas "armas" listadas devem ser utilizadas em conjunto.
> 
> Além disso, os que tem filtro baysianos tem aprendizado vivo. Alimenta-los com
> um banco de mensagens da CVV ou da redes-l (do fundo do baú) será tão produtivo quanto
> testar um IDS com os ataques de 1997...
> 
> Acredito que o único teste é o uso real, na linha de produção. com ajustes diários, o tempo todo.
> o []s,
> 
> Marcos Tadeu
> 
> On Thu, May 12, 2005 at 06:20:38PM -0300, jczucco at ucs.br wrote:
> 
>>Corrigindo: São técnicas ANTI-SPAM
>>Estou olhando várias:
>>- Spamassassin;
>>- Bogofilter;
>>- CRM114;
>>- ORDB;
>>- Spamcop;
>>- RFC-Ignorant;
>>- SPF;
>>- Domain Keys;
>>- Verificações diversas no cabeçalho;
>>- Verificações na transação SMTP;
>>- Tarpit Delay;
>>- Greylisting
>>
>>Citando jczucco at ucs.br:
>>
>>
>>>Olá a todos da lista.
>>>
>>>Minha situação é a seguinte: estou realizando um trabalho de conclusão, onde
>>>estarei analisando várias técnicas de spam para medir seu grau de acerto e
>>>erros (falso positivos e falso negativos).
>>>
>>>Base de e-mails spam eu tenho milhares, alguns pessoais e outros que peguei
>>>na
>>>internet (uma base de mais de 100 mil spams), porém estou com problema para
>>>conseguir uma base grande de e-mails que NÃO sejam spam. Já pensei em pegar
>>>alguns históricos de diversas listas, porém os e-mails vêm sem o cabeçalho, o
>>>que é crucial pra mim, já que vários testes utilizam o cabeçalho. A minha
>>>caixa
>>>postal somente não é um bom teste, além de um volume baixo de mensagens, o
>>>teste seria "viciado".
>>>
>>>Por isso, venho pedir na lista, de quem tiver interesse em colaborar enviando
>>>seu mailbox pra mim, para fins da análise, por favor entre em contato comigo.
>>>Acho esse estudo muito importante para todos nós que somos administradores de
>>>rede, e não temos nem idéia do grau de eficiência e erro que essas
>>>ferramentas
>>>possuem, nem isoladamente nem as técnicas combinadas entre si.
>>>
>>>Após o término desse trabalho, pretendo divulgá-lo na internet para que todos
>>>os
>>>interessados conheçam essas técnicas, e aprendam como ajustar cada uma e
>>>analisar qual e que trará melhores resultados para cada caso. Percebi que
>>>existem muitas documentações nesse sentido na internet, porém são informações
>>>que se encontram muito espalhadas. Uma outra coisa que quero fazer após a
>>>conclusão desse trabalho é criar um wiki web com toda a informação sobre
>>>prevenção de spam para administradores de correio.
>>>
>>>Conto com a colaboração da lista.
>>>
>>>Atenciosamente,
>>>
>>>Jeronimo Zucco
>>>
>>>----------------------------------------------------------------
>>>This message was sent using IMP, the Internet Messaging Program.
>>>
>>>__
>>>masoch-l list
>>>https://eng.registro.br/mailman/listinfo/masoch-l
>>>
>>
>>
>>
>>
>>----------------------------------------------------------------
>>This message was sent using IMP, the Internet Messaging Program.
>>
>>
>>__
>>masoch-l list
>>https://eng.registro.br/mailman/listinfo/masoch-l
> 
> __
> masoch-l list
> https://eng.registro.br/mailman/listinfo/masoch-l



-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.1 (GNU/Linux)

iD8DBQFCg96rTCq0VJ4DIPwRAlXrAKCOXZBKy77yYZAR+1EEDc3mClic2ACfSq7U
jtf/YDmF0VQp6X0T/hXO5T8=
=kjZ2
-----END PGP SIGNATURE-----


More information about the masoch-l mailing list