Teaching Activities

Here is an overview of my courses. Click on a course card to reveal the full syllabus and sessions.

2026

Méthodes quantitatives en sciences sociales

Sciences Po Undergraduate College | Teaching Fellow | 2026 Spring Semester Introduction aux méthodes quantitatives en sciences sociales et aux concepts de base pour les utiliser.

Contenu protégé

Saisissez le mot de passe pour accéder au syllabus.

Description du cours: Ce cours de première année a plusieurs objectifs. Le principal est d’introduire les étudiants aux usages et à la lecture des sciences sociales quantitatives – comprises de manière large, avec la sociologie, la science politique, l’économie, l’histoire et le droit. Le second objectif est d’introduire les étudiants aux bases de l’analyse de données en utilisant des concepts statistiques simples, afin de mieux saisir comment décrire une variable, associer plusieurs variables et tester la force de l’association entre plusieurs variables. Enfin, par une approche pratique et critique des statistiques, il s’agira de transmettre aux étudiants les manières dont elles peuvent être utiles à l’action publique et à la recherche scientifique en sciences sociales.

Ce cours n’a pas vocation à former de futurs statisticiens. En conséquence, il n’est pas nécessaire d’avoir un bagage mathématique très poussé pour en retirer les principaux enseignements.

🇫🇷 Cours donné en Français.

Syllabus du cours

Organisation des séances

Séance 1: À quoi peuvent bien servir les statistiques ?

Les méthodes quantitatives ne sont pas que des mathématiques. Elles se basent sur un ensemble de choix politiques et de constructions scientifiques qui permettent de chiffrer ou de “mettre en chiffres” la réalité sociale. L’objectif de cette séance est d’introduire les étudiants aux principes scientifiques de ces méthodes ainsi qu’à la manière dont elles se sont construites historiquement. La fin de la séance sera dédiée à l’installation de RStudio, ainsi qu’à la découverte du logiciel. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (PDF)
Télécharger le jeu de données Titanic (titanic.csv)

Séance 2 : D’où viennent les données statistiques ?

Un des éléments clés pour une analyse quantitative réussie, c’est de disposer de bonnes données. L’objectif de cette séance sera d’introduire les étudiants au panorama des données quantitatives qui peuvent exister, et aux conséquences que cela peut avoir sur l’analyse. On identifiera trois grandes sources d’enquêtes différentes : les données issues d’enquêtes régulières ou ad hoc, les données issues d’enquêtes administratives, et les données construites à partir de “traces”. Il s’agira ainsi d’avoir un certain nombre de clés pour repérer les sources de données utilisées par l’action publique ou la littérature scientifique. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (PDF)
Télécharger le script R de la séance 2

Séance 3 : Décrire une variable

Pour comprendre une variable et réaliser des tests statistiques ensuite, il faut d’abord comprendre comment elle est construite et distribuée. Cette séance a pour ambition d’introduire les étudiants aux indicateurs de tendance centrale et aux indicateurs de dispersion. Il s’agira ainsi de bien comprendre quels sont les enjeux derrière l’utilisation de ces concepts statistiques d’analyse univariée, de leurs avantages et de leurs défauts à avoir en tête quand on mène une analyse. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (PDF)
Télécharger le script R de la séance 3

Séance 4 & 5 : Relier des variables entre elles

Comprendre la distribution d’une variable n’est que la première étape dans la construction d’une analyse quantitative d’un jeu de données. Pour opérer des comparaisons entre variables, il faut avant tout comprendre leur nature : on ne peut pas comparer de la même manière des variables qualitatives (genre ou catégorie d’âge, par exemple), et des variables quantitatives (poids ou taille). Ces séances seront dédiées aux manières de comprendre quelle est la nature d’une variable, et aux manières de visualiser une association entre différentes variables, en tableau par exemple. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (séance 4, PDF)
Télécharger les slides (séance 5, PDF)
Télécharger le script R de la séance 4
Télécharger le script R de l’exercice en séance 5

Télécharger les jeux de données à utiliser pendant le cours :

Télécharger le jeu de données avant la loterie
Télécharger le jeu de données après la loterie
Télécharger le jeu de données pour les MES

Séance 6 & 7 : Construire et catégoriser des données

Dans le cadre de ses missions, un chercheur ou un fonctionnaire d’une administration publique peut avoir besoin de mener ses propres enquêtes. Or, construire un questionnaire et construire des données n’est pas sans obstacles ou difficultés. Ces deux séances auront pour objectif d’introduire les étudiants aux problèmes récurrents dans la construction de questionnaires d’enquête : questions ouvertes ou questions fermées, ordre et formulation des questions, impact du Réglement général sur la protection des données (RGPD). La deuxième séance sera dédiée aux problèmes de recodage de données existantes, et des choix éthiques, scientifiques et politiques à réaliser lors de ce même recodage. Il y a une lecture obligatoire pour ces séances.

Télécharger les slides (séance 6, PDF)
Télécharger les slides (séance 7, PDF)
Lecture obligatoire : Desrosieres, Alain. «La portée sociologique des diverses phases du travail statistique». In Des mesures, édité par Jean-Louis Besson et Maurice Comte. Presses universitaires de Lyon, 1986

Télécharger le script R de l’exercice en séance 7
Télécharger la correction R de l’exercice en séance 7
Télécharger le jeu de données pour les communes

Lien de l’exercice : Exercice de la séance 6

Séance 8 & 9 : Tester la significativité du lien entre deux variables

Faire des associations entre des variables est à la base du travail statistique. Toutefois, ces associations peuvent parfois naitre du hasard, et pour vérifier de manière rigoureuse que deux variables sont bien corrélées, il faut opérer plusieurs tests statistiques de routine qu’il faut savoir interpréter. Cette séance visera donc à introduire les étudiants aux tests canoniques en sciences sociales quantitatives, et à faire en sorte qu’ils soient capables de les mettre en oeuvre puis d’interpréter leurs résultats. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (séance 8, PDF)
Télécharger le script R de la séance 8

Théorème Central Limite, animation

Population d'origine : Asymétrique.
Taille de chaque échantillon : n = 30.

Distribution des moyennes : 0 échantillons tirés

Test de Student Bilatéral (Comparaison de moyennes)

Déplacez le curseur pour simuler la moyenne de votre échantillon.

Score Z de l'échantillon : 0.00

H0 NON REJETÉE : Le hasard est plausible

Test du Chi-Deux (Indépendance)

Simulez un score d'écart global pour voir sa position sur la courbe d'improbabilité.

Score Chi-Deux obtenu : 2.00

H0 NON REJETÉE : Indépendance plausible

Séance 10 : Introduction à la régression linéaire univariée

Afin de familiariser les étudiants avec une méthode très populaire en sciences humaines et sociales, cette séance visera à introduire aux bases conceptuelles et géométriques de la régression linéaire. Cette introduction utilisera des modèles univariés, et consistera principalement à apprendre à lire les résultats d’un modèle de régression. Il n’y a pas de lecture obligatoire pour cette séance.

Notions abordées : nuage de points, droite de régression, R², coefficients p (p-value)

Simulateur Interactif : Comprendre la régression linéaire

Utilisez cet outil pour manipuler manuellement la pente et la constante d’une droite de régression et comprendre comment elle s’ajuste à un nuage de points réels.

Comprendre la Régression Linéaire

L'équation générique théorique :
Y = β₁X + β₀ + ε

Y = Variable dépendante (Salaire) | X = Variable indépendante (Années d'études)
β₁ = Pente (Effet d'une année) | β₀ = Constante (Salaire de base) | ε = Résidu (Marge d'erreur)

Paramètres du Modèle

β₁ (Pente / Effet d'une année d'étude)

Valeur actuelle : 0 K€ / an

β₀ (Constante / Salaire à 0 année)

Valeur actuelle : 20 K€

Modèle estimé :

Salaire = 0 * Années + 20

Prédiction pour 5 années d'études :

20.0 K€

> summary(modele)

Call:
lm(formula = Salaire ~ Annees_Etudes, data = df)

Residuals:
Min 1Q Median 3Q Max
-5.2 -1.8 0.4 2.1 4.8

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 20.000 2.100 9.52 1.2e-06 ***
Annees_Etudes 3.500 0.450 7.77 4.5e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.8 on 12 degrees of freedom
Multiple R-squared: 0.834, Adjusted R-squared: 0.820
F-statistic: 60.4 on 1 and 12 DF, p-value: 4.5e-05

Interactivité de la console

Clique sur un élément mis en évidence dans le code ci-dessus pour afficher sa signification statistique détaillée.

Variable	Modèle 1 (Salaire)
Années d'études	3.500***
	(0.450)
Constante	20.000***
	(2.100)
Observations	14
R²	0.834
Note : p<0.1; p<0.05; **p<0.01

Standards de publication

Passe la souris sur les différentes lignes du tableau pour comprendre la manière dont les chercheurs formatent et publient leurs résultats de régression dans les revues académiques.

Programmes de révision

Devoir sur table (DST) du Module 1 : Introduction aux concepts statistiques de base

Notions à retenir :

Séance 1 : statistiques et contrôle des populations (les trois traditions mises en avant par A. Desrosières ; exemple de la variole chez Foucault), régimes de généralisation en sciences sociales en fonction des méthodes, définition de la quantification par A. Desrosières.
Séance 2 : grands types d’enquêtes en sciences sociales (enquêtes scientifiques, enquêtes administratives, enquêtes par traces) ; exemples d’enquêtes ; biais liés aux différents types d’enquêtes ; nom complet des fichiers .csv (comma separated values).
Séance 3 : éléments et vocabulaire pour décrire un fichier tableur (.csv), ainsi que les différentes fenêtres de RStudio ; les différents types d’indicateurs de tendance centrale et leurs défauts ; les indicateurs de dispersion et interprétation d’un écart-type ; quantiles ; interpréter une boîte à moustache (boxplot).
Commandes R à maitriser (à l’écrit!) : read.csv("df.csv", sep = ",") ou read.csv("df.csv", sep = ";"), View(), min(), max(), mean(df$var, na.rm = TRUE), median(df$var, na.rm = TRUE), var(df$var, na.rm = TRUE), sd(df$var, na.rm = TRUE). L’évaluation de la connaissance de ces fonctions sera sous la forme d’un contrôle de vocabulaire, comme en cours de langue.
Vous pouvez poser vos questions en utilisant l’interface ci-dessous. Je verrai d’abord vos questions, puis je les publierai ici en ajoutant une réponse :

Devoir sur table (DST) du Module 2 : Utiliser et traiter des données

Notions à retenir :

Séance 4 : variables indépendantes, variables dépendantes et leurs typologies, types de croisement des variables (quali x quali ; quanti x quali ; quanti x quanti) et outils utilisés afin de les croiser ; interpréter les résultats de ces outils (par exemple, savoir interpréter une variance ou un coefficient de corrélation).
Séance 5 : comprendre le principe de l’essai randomisé contrôlé (ERC ; randomized control trial, en anglais) ; calcul d’une marge d’erreur statistique et interprétation du résultat.
Séance 6 : apprendre les différents types de biais pouvant affecter la qualité d’un questionnaire, à partir de l’article de Jean Paul Grémy évoqué en cours ; schéma de l’article en page 2 de l’article d’Alain Desrosières.
Séance 7 : cas historique de la prédiction des résultats de l’élection américaine de 1936 ; concepts fondamentaux de l’échantillonage ; base de sondage ; grandes familles de sondage et leurs sous-types ; enquêtes par Big Data et leur fonctionnement.
Séance 8 : théorème central limit ; intervalles de confiance ; Test de Student et Test du Khi-2, fonctionnement et interprétation des résultats.
Commandes R à maîtriser (à l’écrit !) :
- Préparation et manipulation des données : read.csv() pour importer, as.factor() pour transformer une variable en variable qualitative, str() pour vérifier la structure, et nrow() pour vérifier la taille du tableau. Savoir utiliser les crochets [] pour extraire des valeurs précises.
- Croisement Quali x Quali : table() pour les effectifs bruts, prop.table(..., margin = 1 ou 2) pour les pourcentages en ligne ou en colonne, et round() pour arrondir.
- Croisement Quali x Quanti : aggregate(Y ~ X, data = ..., FUN = mean ou sd) pour calculer des moyennes ou des écarts-types par sous-groupe, et boxplot() pour afficher une boîte à moustaches.
- Croisement Quanti x Quanti : plot() pour générer un nuage de points, cov(..., use = "complete.obs") pour la covariance, et cor(..., use = "complete.obs") pour la corrélation.
- Échantillonnage : set.seed() pour fixer le hasard, sample() pour le tirage aléatoire simple, ainsi que la syntaxe du package dplyr (%>%, group_by(), slice_sample()
- Tests statistiques et intervalles : calcul manuel de la marge d’erreur 1.96 * sd(...) * (1/sqrt(...) + 1/sqrt(...)), t.test(Y ~ X, data = ...) pour comparer deux moyennes et obtenir directement leurs intervalles de confiance, et chisq.test(tableau) pour tester l’indépendance statistique.

Télécharger la fiche de révision pour les commandes R

Vous pouvez poser vos questions en utilisant l’interface ci-dessous. Je verrai d’abord vos questions, puis je les publierai ici en ajoutant une réponse :

Tutoriels

Ci-dessous, vous trouverez des tutoriels qui vous permettent d’installer R et RStudio sur vos ordinateurs en fonction de votre système d’exploitation (i.e., macOS ou Windows, par exemple), ainsi que d’ouvrir une version en ligne via Posit Cloud.

Télécharger R :
- Rendez-vous sur le site du CRAN : https://cran.r-project.org/bin/windows/base/
- Cliquez sur le lien “Download R 4.x.x for Windows”.
- Ouvrez le fichier .exe téléchargé et suivez les instructions d’installation (validez tout par défaut).
Télécharger RStudio :
- Rendez-vous sur le site de Posit : https://posit.co/download/rstudio-desktop/
- Cliquez sur le bouton “Download RStudio Desktop for Windows”.
- Exécutez l’installation.
Lancement :
- Ouvrez RStudio (icône bleue ronde).
- Note : Il n’est pas nécessaire d’ouvrir le logiciel “R” (icône grise) directement.

Vérifier votre processeur :
- Cliquez sur la  (Pomme) en haut à gauche > À propos de ce Mac.
- Regardez la ligne “Puce” ou “Processeur”. Si vous voyez “Apple M1/M2/M3”, vous avez une puce Apple Silicon. Si vous voyez “Intel Core…”, vous avez une puce Intel.
Télécharger R :
- Rendez-vous sur le site du CRAN : https://cran.r-project.org/bin/macosx/
- Si puce Apple Silicon (M1/M2…) : Téléchargez le fichier sous “R-4.x.x-arm64.pkg”.
- Si puce Intel : Téléchargez le fichier sous “R-4.x.x-x86_64.pkg”.
- Installez le fichier .pkg.
Télécharger RStudio :
- Rendez-vous sur le site de Posit : https://posit.co/download/rstudio-desktop/
- Téléchargez la version pour macOS et installez-la (glissez l’icône dans le dossier Applications).

Installer R :
- Il est recommandé d’utiliser le gestionnaire de paquets de votre distribution (apt, dnf, pacman).
- Exemple pour Ubuntu/Debian : Ouvrez un terminal et tapez : sudo apt-get update && sudo apt-get install r-base
Télécharger RStudio :
- Rendez-vous sur https://posit.co/download/rstudio-desktop/
- Descendez vers la section “All Installers” et choisissez le fichier .deb (Ubuntu/Debian) ou .rpm (Fedora/RedHat) correspondant à votre version.
- Installez le paquet via votre gestionnaire de logiciels ou en ligne de commande.

Un tutoriel YouTube est disponible via ce lien : https://www.youtube.com/watch?v=k0r3iLGJgmQ. Si jamais vous avez encore des problèmes pour installer le logiciel, nous prendrons du temps avant ou après les séances pour régler les soucis d’installation.

Si vous ne pouvez pas installer R et RStudio sur votre ordinateur car vous travaillez sur tablette ou sur Chromebook, vous pouvez utiliser la version “cloud” (en ligne). L’interface est strictement identique, mais tout se passe dans votre navigateur web.

Procédure d’accès :

Création du compte : Rendez-vous sur posit.cloud et cliquez sur “Sign Up” (en haut à droite). Choisissez le plan “Cloud Free” (gratuit) et créez votre compte.
Démarrer un projet : Une fois connecté à votre espace de travail (“Your Workspace”), cliquez sur le bouton bleu “New Project” en haut à droite, puis sélectionnez “New RStudio Project”.
Lancement : L’environnement va mettre quelques secondes à se déployer (“Deploying project”). Une fois terminé, vous retrouverez l’interface familière de RStudio avec ses quatre fenêtres.

Note : Cette solution nécessite une connexion internet constante pour fonctionner.

Évaluations et rendus

Dépôt du Devoir Maison 2 (DM2)

Veuillez déposer votre fichier pour le DM2 directement dans le dossier Google Drive centralisé. Merci de bien nommer votre fichier avec les noms et prénoms de vos groupes avant de le téléverser.
N’oubliez pas de commenter votre code, de le remettre au propre dans le fichier script que je vous ai donné (exercice 5), puis d’interpréter vos résultats dans le script de l’exercice. Si j’exécute votre code, il est censé fonctionner.

Accéder à l’espace de dépôt (Groupe 13h15-15h15)

Accéder à l’espace de dépôt (Groupe 15h30-17h30)

Dépôt du Devoir Maison 3 (DM3)

Veuillez déposer votre fichier pour le DM3 directement dans le dossier Google Drive centralisé. Merci de bien nommer votre fichier avec les noms et prénoms de vos groupes avant de le téléverser.
N’oubliez pas de commenter votre code, de le remettre au propre dans le fichier script que je vous ai donné, puis d’interpréter vos résultats dans le script de l’exercice. Si j’exécute votre code, il est censé fonctionner.

Télécharger le script R du DM3
Télécharger le jeu de données du Titanic

Accéder à l’espace de dépôt (Groupe 13h15-15h15)

Accéder à l’espace de dépôt (Groupe 15h30-17h30)

Évaluation finale

Ce travail final a pour objectif de vous faire mobiliser l’ensemble des compétences analytiques et statistiques acquises durant le semestre. L’évaluation s’articule autour de deux grandes étapes :

1. Le traitement des données (Code R) À partir des données de l’enquête ELIPSS et des variables spécifiques attribuées à votre groupe, vous devrez concevoir un script R propre, reproductible et rigoureusement commenté. Ce script devra contenir toutes les étapes de votre démarche.
2. La restitution (Exposé oral) Vous présenterez ensuite vos conclusions lors d’un exposé oral devant la classe. Votre présentation ne doit pas être une simple lecture de chiffres, mais une véritable démonstration sociologique. Elle devra obligatoirement inclure :
- Une justification méthodologique : une explication claire et vulgarisée des choix effectués dans votre code R.
- L’interprétation des résultats : la présentation visuelle de vos données (tableaux, graphiques) et leur lecture analytique.
- Un ancrage théorique : une brève discussion de vos résultats à la lumière de la littérature existante. Vous devez vous appuyer sur un minimum de 1 à 2 références académiques (articles scientifiques, ouvrages), que vous pouvez tout à fait compléter par des articles de presse pertinents pour ancrer le sujet dans l’actualité.

Télécharger le mini-codebook de l’enquête ELIPSS
Ouvrir le tableur - Groupes, questions et variables choisies

Accéder à l’espace de dépôt (Groupe 13h15-15h15)