===== Matériel de cours ===== * 16/01/08 -- Tour d'horizon web mining : {{teaching:20072008:webmining1.pdf|pdf}} * 16/01/08 -- Analyse d'hyperliens -- HITS, PageRank : {{teaching:20072008:linkanalysis.pdf|pdf}} * 16/01/08 -- Séance de TD : {{teaching:20072008:enonce_td1.pdf|pdf}} * 16/01/08 -- Séance de TP : {{teaching:20072008:enonce_tp1.pdf|pdf}} * Bases de textes : * {{teaching:20062007:filtered.tgz|filtered.tgz}} : textes filtrés en fonction du contenu du titre de l'article et du contenu du résumé. Les meilleurs résultats d'analyse devraient être obtenus avec ces fichiers. * {{teaching:20062007:newtextes.tgz|newtextes.tgz}} : textes semblables (mais plus à jour que la base de textes {{teaching:20062007:textes.tgz|textes.tgz}} mais avec une structure de répertoire ayant un niveau de moins (avec des sous-répertoire ayant un nom comme _ au lieu de /). Cette nouvelle architecture permet de mieux visualiser les relations journaux/candidats/positionnemens.