L'enseignement comprend des exposés théoriques d'une à deux heures suivis de travaux pratiques basés sur l'application de Text-Mining en langage Python.
Planning : (23h CM & 13h TP)
Chaque séance sera constituée d'un cours puis d'un TP .
1. Semaines 1, 2: 3 séances de 3h (5/10/2016, 7/10/2016, 12/10/2016; 9:00-12:00)
en Cours: Classication automatique (6h)
{ Perceptron, Adaline, Adaboost, Reseaux de neurones
en TP: Bases en Python (3h)
{ Prise en main de l'environnement UNIX et rappels de programmation (instruc-
tion de bases, structures de contrôles);
{ Implémentation du perceptron, Adaline et Adaboost en Python
2. Semaines 2, 3 : 2 séances de 3h (14/10/2016, 19/10/2016; 9:00-12:00)
en Cours: Clustering (4h)
{ Algorithmes EM, CEM, mesures d'évaluation
en TP: Programmation de l'algorithme CEM (2h)
3. Semaines 3, 4: 2 séances de 3h (21/10/2016, 26/10/2016; 9:00-12:00)
en Cours: Représentation et indexation d'un document (3h)
{ Prétraitements linguistiques : segmentation, normalisation, ltrage par un
anti-dictionnaire.
{ Les deux lois de base en recherche d'information : loi de Zipf et de Heaps
{ Représentation vectorielle d'un document, pondération des termes.
en TP: Application des modèles développes précedemment sur une collection de
documents etiquetés (3h)
4. Semaines 4,5 : 3 séances de 3h. Recherche de thémes latents (28/10/2016, 2/11/2016,
4/11/2016; 9:00-12:00)
Cours : Latent Semantic Indexing (LSI), Probabilistic LSI & Latent Dirichlet
Allocation (LDA) - (7h)
TP: Application Text-Mining (2h)
5. Semaine 6 : 2 séances de 3h. (9/11/2016, 16/11/2016; 9:00-12:00)
Cours: Visualisation (ACP, ...) (3h)
TP : Application Text-Mining (3h)