Initiation à la fouille de données et à l'apprentissage (IFD1)
2011-2012
Cours-TD
- Séance du 13 septembre (V. Emiya): introduction, exemples, modélisation de la classification supervisée.
Diapos Exercices - Séance du 20 septembre (V. Emiya): rappels de proba, modélisation de la régression et estimation de densité, principe ERM, validation d'un apprentissage.
Diapos Exercices - Séance du 27 septembre (V. Emiya): apprentissage d'arbres de décision (1/2).
Diapos (exercices dans le poly). - Séance du 4 octobre (V. Emiya): apprentissage d'arbres de décision (2/2).
Diapos (exercices dans le poly). - Séance du 11 octobre (V. Emiya): intervalles de confiance; régression, régression linéaire (cours au tableau, pas de diapos).
- Séance du 18 octobre (F.X. Dupé): apprentissage non-supervisé (1/2). Diapos
- Séance du 25 octobre (F.X. Dupé): apprentissage non-supervisé (2/2).
TP
Les séances ont lieu le jeudi à 10h30 à partir du 22 septembre (la séance du jeudi 15 septembre est reportée à une date ultérieure).Sujets:
Ressources bibliographiques et logicielles
- Le poly de F. Denis.
- Apprentissage artificiel: concepts et algorithmes, A. Cornuéjols et L. Miclet, Eyrolles.
- Machine Learning, Tom Mitchel, McGrawHill.
- The Elements of Statistical Learning, T. Hastie, R. Tibshirani et J.H. Friedman, Springer.
- Data Mining : Practical Machine Learning Tools and Techniques with Java Implementations, I.H. Witten, E. Frank et M.A. Hall, auteurs de Weka.
Modalités d'évaluation
L'évaluation comprend un examen et un TP noté.
L'examen aura lieu le jeudi 3 novembre 2011 de 10h30 à 12h30 en salle C007.
L'examen durera deux heures. Le sujet comprendra des questions de cours/compréhension et des exercices. Documents autorisés: une feuille manuscrite recto-verso. Apporter une calculatrice est vivement conseillé (pas d'ordinateur ou de téléphone).
Annales
Attention, ces sujets ont été donnés par d'autres enseignants, sur un programme légèrement différent.
Enseignants
- Cours, TD: François-Xavier Dupé et Valentin Emiya.
- TP: Pierre Marchart