Qu'est ce qu'est la science des donnees ou Data Science?
La science des donnees est un domaine interdisciplinaire ayant pour objectif l'extraction de connaissances a partir des donnees heterogenes. Ce domaine est a l'interface de dierents champs disciplinaires comme le traitement du signal, l'apprentissage statistique, les bases de donnees, la visualisation ainsi que le calcul haute performance et s'appuie sur des outils issus de domaines tres divers : optimisation, statistique, probabilites, recherche operationelle, traitement de l'information et informatique. Un des enjeux actuels de la discipline est le traitement de donnees massives, motive par des applications tres diverses en genomique, imagerie medicale, nance, environnement, etc. Les approches basees sur l'apprentissage automatique se sont revelees particulierement performantes pour s'attaquer a cette problematique du Big Data et sont actuellement en plein essor
Objectif
L'objectif de cette formation est de vous faire decouvrir ce domaine de l'apprentissage au- tomatique. Les algorithmes qui seront introduits tout au long de la formation seront illustres sur une application qui est la recherche d'information dans des grandes bases de donnees textuelles. La formation est proposee sous une double etiquette College doctoral/MaiMoSiNE (Mai- son de la Modelisa- tion et de la Simulation) avec une priorite d'acces aux etudiants du college doctoral de Grenoble.