===== Matériel de cours ===== * Tour d'horizon web mining: {{teaching:20062007:webmining1.pdf|pdf}} * Analyse d'hyperliens (HITS, PageRank): {{teaching:20062007:linkanalysis.pdf|pdf}} * Séance de TP du 12/01/07: {{teaching:20062007:enonce_tp1.pdf|pdf}} * Séances de TP du 2/02/07: {{teaching:20062007:textes.tgz|base de textes}} (maj 3/02/07), {{teaching:20062007:enonce_tp2.pdf|énoncé}} * Analyse sémantique latente (12/02/07): {{teaching:20062007:enonce_tp3.pdf|.pdf}} * Nouvelles bases de textes : * {{teaching:20062007:filtered.tgz|filtered.tgz}} : textes filtrés en fonction du contenu du titre de l'article et du contenu du résumé. Les meilleurs résultats d'analyse devraient être obtenus avec ces fichiers. * {{teaching:20062007:newtextes.tgz|newtextes.tgz}} : textes semblables (mais plus à jour que la base de textes {{teaching:20062007:textes.tgz|textes.tgz}} mais avec une structure de répertoire ayant un niveau de moins (avec des sous-répertoire ayant un nom comme _ au lieu de /). Cette nouvelle architecture permet de mieux visualiser les relations journaux/candidats/positionnemens.