[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[Fsfe-france] Microsoft a breveté les filtres anti-spam...
From: |
Antoine |
Subject: |
[Fsfe-france] Microsoft a breveté les filtres anti-spam... |
Date: |
Mon, 17 Nov 2003 15:05:48 +0100 |
Ou, plus précisément, ceux utilisant un mécanisme d'apprentissage
probabiliste supervisé par les indications de l'utilisateur. (*) Il
reste à vérifier si l'algorithme utilisé est le même que pour les
filtres dits « bayésiens » qui commencent à se développer (ainsi Mozilla
permet désormais d'indiquer quels mails sont légitimes et lesquels sont
du spam, suite à quoi le logiciel apprend les caractéristiques
statistiques des deux groupes pour réussir progressivement à éliminer
lui-même les spams).
((*) Cela ne concerne donc pas les programmes type Spamassassin.)
La « technologie » exploitant ce brevet, appelée SmartScan, a été
dévoilée hier par Billou lors d'une allocution abondamment répercutée
par les médias on-line.
Amicalement
Antoine.
*********
Numéro de brevet US : 6,161,130
URL : heu, trop longue (voir uspto.gov)
Date de soumission : juin 98
Date de délivrance : décembre 2000
« Technique which utilizes a probabilistic classifier to detect "junk"
e-mail by automatically updating a training and re-training the
classifier based on the updated training set
Abstract
A technique, specifically a method and apparatus that implements the
method, which through a probabilistic classifier (370) and, for a given
recipient, detects electronic mail (e-mail) messages, in an incoming
message stream, which that recipient is likely to consider "junk".
Specifically, the invention discriminates message content for that
recipient, through a probabilistic classifier (e.g., a support vector
machine) trained on prior content classifications. Through a resulting
quantitative probability measure, i.e., an output confidence level,
produced by the classifier for each message and subsequently compared
against a predefined threshold, that message is classified as either,
e.g., spam or legitimate mail, and, e.g., then stored in a corresponding
folder (223, 227) for subsequent retrieval by and display to the
recipient. Based on the probability measure, the message can
alternatively be classified into one of a number of different folders,
depicted in a pre-defined visually distinctive manner or simply
discarded in its entirety. »
[Prev in Thread] |
Current Thread |
[Next in Thread] |
- [Fsfe-france] Microsoft a breveté les filtres anti-spam...,
Antoine <=