Mise à jour le 25 mars 2020
Méthodes statistiques pour les données massives

Détails

Infos clés et site web

Durée de la formation
28 heures
Formation continue
Formation courte / qualifiante
Lieu de la formation
Campus Porte des Alpes (PDA)
Langues d'enseignement
Français

Public ciblé

Public ciblé
Public statisticien (ingénieur) souhaitant découvrir les méthodes statistiques récentes pour les données massives.
Accessible en reprise d'études
Oui

Objectifs

· Apprendre à synthétiser et extraire l’information de masses de données ou de données de grande dimension
· Maitriser les outils modernes de statistique pour l’analyse et la prise de décisions
· Savoir mettre en oeuvre les techniques récentes avec le logiciel R

Contenu

· Régression en grande dimension (plus de variables que d’observations) : sélection de variables, régularisation et méthodes sparses, méthodes de projections
· Clustering en grande dimension : modèle de mélange parcimonieux
· Classification en grande dimension : sélection de variables, méthodes de projections, régularisation.

Présentation

Lieux

Campus Porte des Alpes (PDA)

Admission

Pré-requis

Formation(s) requise(s)

- Notions de R (typiquement le contenu du module initiation).
- Notions de statistiques élémentaires (statistique descriptive, analyse des données, test statistique, régression).
- Techniques classiques de data mining.

Programme

· Régression en grande dimension (plus de variables que d’observations) : sélection de variables, régularisation et méthodes sparses, méthodes de projections
· Clustering en grande dimension : modèle de mélange parcimonieux
· Classification en grande dimension : sélection de variables, méthodes de projections, régularisation

Et après ?

Poursuites d'études

Ce module peut donner accès au diplôme universitaire data scientist.

Inscriptions

Coût de la formation

Nous consulter

Modalités d'inscription