ENSAE Paris - École d'ingénieurs pour l'économie, la data science, la finance et l'actuariat

Projet de statistique et science des données appliquées

Objectif

L'objectif de cet enseignement est de parfaire et de compléter la formation méthodologique des étudiants. Il s’agit donc de mettre en application, sur données réelles, les cours d’analyse de données, de statistiques, d’économétrie et / ou de séries temporelles. Dans un premier temps, les étudiants s’attacheront à identifier une problématique et décrire les données à leur disposition. Puis il s’agira de modéliser le problème, d’estimer les paramètres d’intérêt et de tester quelques hypothèses théoriques.
   
La pédagogie retenue est celle de travaux par petits groupes sous la direction d'un animateur. Chaque groupe d'étudiants doit, sur un thème et un fichier bien précis, mettre effectivement en oeuvre les techniques citées plus haut, et rédiger un mémoire synthétique présentant ses travaux et conclusions.
   
Le rôle de l'animateur est de guider les étudiants dans leur étude et de développer certains aspects ponctuels de la statistique mathématique. Enfin, cet animateur fait utiliser par les élèves différentes méthodes ou procédures d’un logiciel de statistique ou de mathématique (Python, R, Stata, Matlab, SAS).

Principaux acquis de la formation : à l’issue du cours, l’étudiant saura

- Poser une question scientifique adaptée à une base de données réelles mise à disposition
- Mener une démarche scientifique collective (groupes de 3, 4 élèves) et guidée par un encadrant, qui inclut une revue de littérature, une description statistique des données et qui utilise les techniques quantitatives adaptées (statistiques et économétriques) pour répondre à la question posée ;
- Savoir synthétiser cette démarche à l’aide d’un rapport de 30 pages adressé à des spécialistes et d’une note de synthèse accessible à des non spécialistes.

Mode d'évaluation:

Une note globale (100%), attribuée selon une grille de notation, évalue la participation aux suivis pendant l'année, le rapport, la soutenance, ainsi que la note de synthèse.

Plan

Le plan est défini par l'encadrant et les élèves doivent le suivre en travaillant régulièrement. L'état d'avancement est présenté par les élèves courant mars par une note d'étape.

Vous trouverez davantage d'informations sur l'intranet de l'ENSAE : https://genes.sharepoint.com/sites/intraensae/SitePages/Groupe-de-statistique-appliqu%C3%A9e.aspx

Références

En statistique, le cours de Statistique 1 (voire de Statistique 2) de l'ENSAE Paris
En économétrie,le cours d'Econométrie 1 et d'Econométrie 2 de l'ENSAE Paris
En séries temporelles,le cours de séries temportelles linéaires de l'ENSAE Paris
En apprentissage statistique, le cours "Theoretical Foundations of Machine Learning"

Pour l'aspect code informatique, les fichiers d'aide R/Python présentés dans différents cours de l'ENSAE Paris.