Le Master 2
Statistique et
Informatique pour la
Science des donné
Es (SISE), du parcours Statistique et Informatique, propose une formation avancée à la data science, avec une forte composante machine learning et statistique d’une part, informatique et technologies big data d’autre part.
La complémentarité de ces compétences constitue le socle de la science des données (data science) et de la valorisation des données massives (big data, big data analytics). Les étudiants peuvent se tourner vers les métiers traditionnels de la data science et de la statistique (data scientist, data analyst, ingénieur machine learning, chargés d’études statistiques, consultant data mining, consultant data science, ingénieur score, ...). Ils peuvent également, de par leurs compétences approfondies en informatique – en programmation (R et Python), en technologies big data et leurs applications (ex. hadoop, spark, dataviz, ...), en business intelligence et bases de données (conception et exploitation des entrepôts de données, outils ETL, bases de données NoSql, dataviz, …) – valoriser un profil de data scientist / data analyst dans le sens d’une synergie réelle entre la statistique / machine learning et l’informatique.
Le savoir-faire acquis dans les modules consacrés aux spécialisations et applications (text mining, web mining, analyse des réseaux sociaux, valorisation des données de sécurité) leur permet d’être directement opérationnels dans des environnements exigeants. Ils le sont d'autant plus que près de 40% des enseignants du Master SISE sont assurés par des professionnels. Les étudiants sont ainsi au fait des pratiques et préoccupations récentes des entreprises. Ils sont en prise directe avec les évolutions technologiques particulièrement rapides dans le domaine de la data science.
Le Master SISE peut accueillir, au titre de la formation continue, des professionnels en reconversion, qui ont déjà travaillé plusieurs années en entreprises et qui souhaitent s’investir dans la data science. Ils peuvent suivre la formation à titre personnel, ou en accord avec leur entreprise, ou dans le cadre d’un
congé individuel de formation, ou disposer de tout autre cadre de financement. Les candidats concernés doivent être pleinement disponibles et suivent les mêmes cours que les étudiants en formation initiale.
Les étudiants de notre Master de Science des Données participent au programme académique de DataCamp (
DataCamp for the Classroom). Ils y ont accès gratuitement au titre du Master SISE. Ce programme s’étale sur un semestre, il leur permet d’approfondir leurs connaissances en R, Python, statistique, data mining et machine learning, data visualisation (Dataviz) (la liste des
enseignements est visible sur le site). Le programme DataCamp aboutit à une certification en Data Science.
Pour les candidatures extérieures à notre M1 Informatique, un programme de remise à niveau est prévu durant l’été qui précède la rentrée d’octobre.
Il débute à la mi-juillet lorsque la première vague de recrutement est terminée. Les thématiques abordées sont personnalisées selon le profil et le niveau académique des candidats (
http://tutoriels-data-mining.blogspot.com/p/sise.html). Elle prend la forme de supports de cours à lire, puis des exercices à réaliser, principalement sous R et Python, avec un suivi du responsable de la formation (corrections du travail rendu, commentaires, indications, échanges).
Ce programme est obligatoire pour les candidats en reconversion ou en réorientation. Il constitue la condition sine qua non de la réussite de ces profils. Ils doivent avoir le niveau requis pour attaquer directement l’année au même titre que les étudiants provenant de nos filières habituelles à la rentrée d’octobre.