!!! Le programme présenté ici est en cours de finalisation ; des modifications peuvent être apportées.
L'ensemble de la formation sera dispensée en français.
Lundi 16 novembre 2026
Accueil des participants dès 16h
Présentation du déroulé de la formation et activité "brise-glace"
19h30 : Dîner
---
Mardi 17 novembre 2026
8h30 : Définitions : Retour aux sources, qu’est ce que la statistique inférentielle ? - Paul Cochet
Notions fondamentales en statistique inférentielle et en théorie des sondages
- # Population vs échantillon
- # Recensement vs sondage
- # La notion d'estimateur
- # Echantillon probabiliste vs échantillon empirique
10h00-10h30 : Pause
10h30 : Les dangers de l’échantillonnage ! Les conséquences et risques des choix de la pratique d'échantillonnage (petit échantillons, échantillons mal construits, valeurs extrêmes, etc.) - Paul Cochet
Concevoir et tirer un bon échantillon
- # Comment évaluer la qualité d'un échantillon : les notions de biais et de variance
- # Tour d'horizon des principales méthodes d'échantillonnage
- # Exercices pratiques avec le package sampling (R)
12h15-13h45 : Déjeuner - Pique-nique en bord de mer
14h : L'apport et les limites des pondérations. - Paul Cochet
Ouvrir la boîte noire des pondérations : comment sont-elles calculées et quand les utiliser ?
- # Principe général : à quoi servent les pondérations ?
- # Correction de la non-réponse totale
- # Calage sur marges
- # Exercice pratique sur R avec le package icarus
- # Quand faut-il pondérer mes résultats ?
16h-16h30 : Pause
16h30 : Tables ronde : Echanges et discussions : contraintes règlementaires et éthiques autour de la collecte de données
18h30 : Fin de la journée
19h30 : Dîner
---
Mercredi 18 novembre 2026
8h30 : Les valeurs manquantes (Doit-on toujours imputer ? ; Quels enjeux ?) - Julien Bousquet
-
# Typologie des données manquantes (MCAR, MAR, MNAR) -
# Détection et diagnostics -
# Traitement : suppression, imputation simple, imputation multiple -
# Bonnes pratiques : tests, documentation
10h00-10h30 : Pause
10h30 : Les valeurs extrêmes (Les retirer ou non ? Avec quelles techniques ? Quels enjeux ?) - Frédéric Santos
12h15-13h45 : Déjeuner
14h : Retours d’expériences sur les traitements des valeurs manquantes et des valeurs extrêmes
15h : Application sur R studio : traiter des valeurs manquantes (présentation de différents packages). - Julien Bousquet & Frédéric Santos
16h-16h30 : Pause
16h30 : Application sur R studio : traiter des valeurs extrêmes (présentation de différents packages). - Julien Bousquet & Frédéric Santos
17h30 : Échanges et discussions : Regards croisés interdisciplinaires : Les enjeux de la réplicabilité - Table ronde
18h30 : Fin de la journée
19h30 : Dîner et soirée festive
---
Jeudi 19 novembre 2026
8h30 : Tests statistiques robustes - Julien Bousquet
-
# Hypothèses classiques des statistiques fréquentistes, -
# Traitement des non-respects des hypothèses (normalité, hétéroscédasticité, valeurs extrêmes) -
# Estimateurs robustes (moyennes tronquées, winsorisation, M-estimateurs ) -
# Tests robustes avec le package WRS2 : comparaison de moyennes (2 groupes, 3 ou plus) -
# Méthodes par bootstrap
10h00-10h30 : Pause
11h : Application sur R studio : cas pratique de statistiques robustes - Frédéric Santos
12h15-13h45 : Déjeuner
14h : Bilan avec questionnaire de la formation
14h30 : Atelier optionnel : Application : cas concrets - travail sur les données
16h30 : Clôture de l'ANF