ENSAE Paris - École d'ingénieurs pour l'économie, la data science, la finance et l'actuariat

Séminaire de sondages

Objectif

Ce séminaire est destiné aux étudiants qui envisagent de produire ou d’utiliser des données issues d’enquêtes, en tant que responsable d’enquêtes ou en tant que chargé d’études (tant dans le domaine économique, sociologique que marketing). Il vise à apporter un approfondissement et un regard critique sur les méthodes de conception et de production de données (échantillonnage, correction de la non-réponse, redressement, estimation...) ainsi que sur leur utilisation par des méthodes d’analyse statistique appropriées.
Il constitue la suite du cours Sondages, avec une orientation forte vers les aspects pratiques des enquêtes par sondage.

Chaque séance comprendra une présentation par un expert du domaine étudié, illustrée d’exemples d’application.

Principaux acquis de la formation
À l’issue du cours, l’étudiant :
•    saura choisir parmi les méthodes d’échantillonnage et de collecte les méthodes les plus efficaces compte tenu des objectifs de l’enquête, des bases de sondage et de l’information disponibles avant l’enquête ;
•    saura mettre en œuvre les méthodes classiques d’imputation pour traiter la non-réponse partielle, de repondération pour traiter la non-réponse totale, et de calage ;
•    connaîtra les principales méthodes d’estimation sur petits domaines ;
•    saura comment tenir compte du plan de sondage dans l’analyse de données d’enquête.

Plan

1 et 2. Méthodes d’échantillonnage : rappels sur les méthodes classiques d’échantillonnage direct ; le sondage équilibré, la macro Cube.
3. Traitement de la non-réponse totale : causes de la non-réponse, mécanismes de réponse (ignorable, non ignorable) ; analyse des facteurs influençant la non-réponse ; modèles de réponse et repondération.
4. Méthodes de calage : théorie du calage sur marges, la macro Calmar et le package icarus, calage et correction de la non-réponse.
5. Traitement de la non-réponse partielle : imputation par prédiction, imputation aléatoire.
6. Les imperfections des bases de sondage. Les principales bases de sondage de l’Insee.
7. Sondage indirect et partage des poids.
8. Échantillonnage spatial.
9 et 10. Méthodologie de collecte : le paradigme de l’erreur d’enquête totale, indicateurs de qualité de la collecte, enquêtes multimodes.
11 et 12. Méthodes d’estimation sur petits domaines.
13 et 14. Analyse des données d’enquêtes : la prise en compte du plan de sondage dans les statistiques, les tests classiques, les modèles économétriques, les logiciels et packages adaptés.

Références

Ardilly P. (2006), Les techniques de sondage, Technip, 2e édition
Ardilly P. (2006), Panorama des principales méthodes d’estimation sur le petits domaines, Document de travail M06/02 de l’Insee
Davezies L., D’Haultfoeuille X., (2009), Faut-il pondérer ?… ou l’éternelle question de l’économètre confronté à des données d’enquête, Document de travail G2009/06 de l’Insee
Haziza D. (2009), Imputation and inference in the presence of missing data, Handbook of Statistics, volume 29, Sample Surveys.
Lavallée P. (2002), Sondage indirect, méthode généralisée du partage des poids, éditions de l’Université de Bruxelles
Razafindranovona T. (2015), La collecte multimode et le paradigme de l’erreur d’enquête totale, Document de travail M2015/01 de l’Insee
Sarndal C.-E., Swensson B., Wretman J.(1992), Model Assisted Survey Sampling, Springer-Verlag