bsf-devel
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: hola


From: Alvaro Herrera
Subject: Re: hola
Date: Fri, 4 Apr 2003 00:04:30 -0400
User-agent: Mutt/1.4i

On Thu, Apr 03, 2003 at 11:39:48PM -0400, Mañungo wrote:
> At 22:45 03-04-2003, you wrote:

> Ademas, sigo con la idea que para resolver el ultimo 20% del spam hay que 
> usar nuevas tecnicas (ideas?)

Al principio eran tokens fijos (listas negras).  Despues, expresiones
regulares basadas en los tokens.  Despues, reglas cualitativas.  Cada
vez los spammers inventaban formas de esquivar el anti-spam, y cada vez
la nueva metodologia captaba mas spam que la anterior hasta que los
spammers descubrian como saltarsela.

Bayes es el siguiente paso.  El porcentaje de captura hoy en dia es
mucho mas que 80% diria yo.  Pero tienes razon, probablemente para
capturar el pequeño porcentaje restante va a ser necesario otro
mecanismo.  Pero nunca vas a eliminar completamente la necesidad de
feedback del usuario.


> Si. Yo mire la tabla y los strings de +40 caracteres era:
> -> 10% urls interminables, con cgi y parametros
> -> 90% mime mal skipeado

Si, creo que es razonable.


> Por lo pronto, voy a mirar los btrees que usa Aldrin, pero me da lata a 
> priori incluir librerias en el Perl. De hecho, para saltarme los mime uso 
> una rudimentaria rutina.

Bueno, lamentablemente levantar el modulo DBM yo creo que es lo mas
lento de todo :-(  Sigue siendo O(1), pero las constantes son demasiado
grandes...  Si quieres que esto sea realmente eficiente tendrias que
escribir esa parte en C, lo cual no deberia ser dificil.  Incluso podria
haber un daemon que escuche peticiones en un puerto!!  (ahi tienes una
nueva idea: un recolector de estadisticas para spam en red -- el
problema es que tienes que confiar en la gente que puede enviarle
datos...)

-- 
Alvaro Herrera (<alvherre[a]dcc.uchile.cl>)
"El sentido de las cosas no viene de las cosas, sino de
las inteligencias que las aplican a sus problemas diarios
en busca del progreso." (Ernesto Hernández-Novich)




reply via email to

[Prev in Thread] Current Thread [Next in Thread]