MaiMoSiNE - CED UGA : formation statistique
5 oct.-16 nov. 2016 Grenoble (France)

Contenu de la formation

L'enseignement comprend des exposés théoriques d'une à deux heures suivis de travaux pratiques basés sur l'application de Text-Mining en langage Python.


Planning : (23h CM & 13h TP)


Chaque séance sera constituée d'un cours puis d'un TP .


1. Semaines 1, 2: 3 séances de 3h (5/10/2016, 7/10/2016, 12/10/2016; 9:00-12:00)
 en Cours: Classi cation automatique (6h)
{ Perceptron, Adaline, Adaboost, Reseaux de neurones
 en TP: Bases en Python (3h)
{ Prise en main de l'environnement UNIX et rappels de programmation (instruc-
tion de bases, structures de contrôles);
{ Implémentation du perceptron, Adaline et Adaboost en Python


2. Semaines 2, 3 : 2 séances de 3h (14/10/2016, 19/10/2016; 9:00-12:00)
 en Cours: Clustering (4h)
{ Algorithmes EM, CEM, mesures d'évaluation
 en TP: Programmation de l'algorithme CEM (2h)


3. Semaines 3, 4: 2 séances de 3h (21/10/2016, 26/10/2016; 9:00-12:00)
 en Cours: Représentation et indexation d'un document (3h)
{ Prétraitements linguistiques : segmentation, normalisation, ltrage par un
anti-dictionnaire.
{ Les deux lois de base en recherche d'information : loi de Zipf et de Heaps
{ Représentation vectorielle d'un document, pondération des termes.
 en TP: Application des modèles développes précedemment sur une collection de
documents etiquetés (3h)


4. Semaines 4,5 : 3 séances de 3h. Recherche de thémes latents (28/10/2016, 2/11/2016,
4/11/2016; 9:00-12:00)
 Cours : Latent Semantic Indexing (LSI), Probabilistic LSI & Latent Dirichlet
Allocation (LDA) - (7h)
 TP: Application Text-Mining (2h)

5. Semaine 6 : 2 séances de 3h. (9/11/2016, 16/11/2016; 9:00-12:00)
 Cours: Visualisation (ACP, ...) (3h)
 TP : Application Text-Mining (3h)

Personnes connectées : 1