Now Criteo AI Lab (leave from LIS, IUF, AMU)
Version pdf du sujet.
Un des gros problèmes des messageries électroniques est la quantité de mails non désirés (spam) que chacun reçoit chaque jour. Il est donc intéressant de disposer d’outils informatiques capables d’identifier automatiquement la nature spam/non spams d’emails.
L’objectif de ce projet est de programmer un algorithme d’apprentissage automatique pour le filtrage d’emails. L’algorithme d’apprentissage qui sera implémenté est un algorithme d’apprentissage en ligne, c’est-à-dire qui s’adapte avec le temps aux informations qui lui sont fournies, proposé dans [1] (http://citeseer.ist.psu.edu/629949.html). Après avoir implémenté cet algorithme et mesuré son efficacité, des extensions en seront éventuellement proposées et programmées.
Mots-clés : filtrage d’emails, programmation, apprentissage en ligne.
Le projet se découpera selon les phases suivantes :
[1] K. Crammer, O. Dekel, S. Shalev-Shwartz, and Yoram Singer. Online Passive-Aggressive Algorithms. In Adv. in Neural Information Processing Systems, volume 16, 2004.