fsfe-france
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[Fsfe-france] Microsoft a breveté les filtres anti-spam...


From: Antoine
Subject: [Fsfe-france] Microsoft a breveté les filtres anti-spam...
Date: Mon, 17 Nov 2003 15:05:48 +0100

Ou, plus précisément, ceux utilisant un mécanisme d'apprentissage
probabiliste supervisé par les indications de l'utilisateur. (*) Il
reste à vérifier si l'algorithme utilisé est le même que pour les
filtres dits « bayésiens » qui commencent à se développer (ainsi Mozilla
permet désormais d'indiquer quels mails sont légitimes et lesquels sont
du spam, suite à quoi le logiciel apprend les caractéristiques
statistiques des deux groupes pour réussir progressivement à éliminer
lui-même les spams).

((*) Cela ne concerne donc pas les programmes type Spamassassin.)

La « technologie » exploitant ce brevet, appelée SmartScan, a été
dévoilée hier par Billou lors d'une allocution abondamment répercutée
par les médias on-line.

Amicalement

Antoine.

*********

Numéro de brevet US : 6,161,130
URL : heu, trop longue (voir uspto.gov)
Date de soumission : juin 98
Date de délivrance : décembre 2000


« Technique which utilizes a probabilistic classifier to detect "junk"
e-mail by automatically updating a training and re-training the
classifier based on the updated training set

                                Abstract

A technique, specifically a method and apparatus that implements the
method, which through a probabilistic classifier (370) and, for a given
recipient, detects electronic mail (e-mail) messages, in an incoming
message stream, which that recipient is likely to consider "junk".
Specifically, the invention discriminates message content for that
recipient, through a probabilistic classifier (e.g., a support vector
machine) trained on prior content classifications. Through a resulting
quantitative probability measure, i.e., an output confidence level,
produced by the classifier for each message and subsequently compared
against a predefined threshold, that message is classified as either,
e.g., spam or legitimate mail, and, e.g., then stored in a corresponding
folder (223, 227) for subsequent retrieval by and display to the
recipient. Based on the probability measure, the message can
alternatively be classified into one of a number of different folders,
depicted in a pre-defined visually distinctive manner or simply
discarded in its entirety. »






reply via email to

[Prev in Thread] Current Thread [Next in Thread]