Teaching Activities

Here is an overview of my courses. Click on a course card to reveal the full syllabus and sessions.

2026

Méthodes quantitatives en sciences sociales

1st Year Sciences Po Undergraduates Students | Position: Teaching Fellow | Year offered: 2026 Spring Semester Introduction aux méthodes quantitatives en sciences sociales et aux concepts de base pour les utiliser.

+


Description du cours: Ce cours de première année a plusieurs objectifs. Le principal est d’introduire les étudiants aux usages et à la lecture des sciences sociales quantitatives – comprises de manière large, avec la sociologie, la science politique, l’économie, l’histoire et le droit. Le second objectif est d’introduire les étudiants aux bases de l’analyse de données en utilisant des concepts statistiques simples, afin de mieux saisir comment décrire une variable, associer plusieurs variables et tester la force de l’association entre plusieurs variables. Enfin, par une approche pratique et critique des statistiques, il s’agira de transmettre aux étudiants les manières dont elles peuvent être utiles à l’action publique et à la recherche scientifique en sciences sociales.

Ce cours n’a pas vocation à former de futurs statisticiens. En conséquence, il n’est pas nécessaire d’avoir un bagage mathématique très poussé pour en retirer les principaux enseignements.

🇫🇷 Cours donné en Français.

Syllabus du cours

Organisation des séances

Les méthodes quantitatives ne sont pas que des mathématiques. Elles se basent sur un ensemble de choix politiques et de constructions scientifiques qui permettent de chiffrer ou de “mettre en chiffres” la réalité sociale. L’objectif de cette séance est d’introduire les étudiants aux principes scientifiques de ces méthodes ainsi qu’à la manière dont elles se sont construites historiquement. La fin de la séance sera dédiée à l’installation de RStudio, ainsi qu’à la découverte du logiciel. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (PDF)
Télécharger le jeu de données Titanic (titanic.csv)

Un des éléments clés pour une analyse quantitative réussie, c’est de disposer de bonnes données. L’objectif de cette séance sera d’introduire les étudiants au panorama des données quantitatives qui peuvent exister, et aux conséquences que cela peut avoir sur l’analyse. On identifiera trois grandes sources d’enquêtes différentes : les données issues d’enquêtes régulières ou ad hoc, les données issues d’enquêtes administratives, et les données construites à partir de “traces”. Il s’agira ainsi d’avoir un certain nombre de clés pour repérer les sources de données utilisées par l’action publique ou la littérature scientifique. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (PDF)
Télécharger le script R de la séance 2

Pour comprendre une variable et réaliser des tests statistiques ensuite, il faut d’abord comprendre comment elle est construite et distribuée. Cette séance a pour ambition d’introduire les étudiants aux indicateurs de tendance centrale et aux indicateurs de dispersion. Il s’agira ainsi de bien comprendre quels sont les enjeux derrière l’utilisation de ces concepts statistiques d’analyse univariée, de leurs avantages et de leurs défauts à avoir en tête quand on mène une analyse. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (PDF)
Télécharger le script R de la séance 3

Comprendre la distribution d’une variable n’est que la première étape dans la construction d’une analyse quantitative d’un jeu de données. Pour opérer des comparaisons entre variables, il faut avant tout comprendre leur nature : on ne peut pas comparer de la même manière des variables qualitatives (genre ou catégorie d’âge, par exemple), et des variables quantitatives (poids ou taille). Ces séances seront dédiées aux manières de comprendre quelle est la nature d’une variable, et aux manières de visualiser une association entre différentes variables, en tableau par exemple. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (séance 4, PDF)
Télécharger les slides (séance 5, PDF)
Télécharger le script R de la séance 4
Télécharger le script R de l’exercice en séance 5


Télécharger les jeux de données à utiliser pendant le cours :

Télécharger le jeu de données avant la loterie
Télécharger le jeu de données après la loterie
Télécharger le jeu de données pour les MES

Dans le cadre de ses missions, un chercheur ou un fonctionnaire d’une administration publique peut avoir besoin de mener ses propres enquêtes. Or, construire un questionnaire et construire des données n’est pas sans obstacles ou difficultés. Ces deux séances auront pour objectif d’introduire les étudiants aux problèmes récurrents dans la construction de questionnaires d’enquête : questions ouvertes ou questions fermées, ordre et formulation des questions, impact du Réglement général sur la protection des données (RGPD). La deuxième séance sera dédiée aux problèmes de recodage de données existantes, et des choix éthiques, scientifiques et politiques à réaliser lors de ce même recodage. Il y a une lecture obligatoire pour ces séances.

Télécharger les slides (séance 6, PDF)
Télécharger les slides (séance 7, PDF)
Lecture obligatoire : Desrosieres, Alain. «La portée sociologique des diverses phases du travail statistique». In Des mesures, édité par Jean-Louis Besson et Maurice Comte. Presses universitaires de Lyon, 1986

Télécharger le script R de l’exercice en séance 7
Télécharger la correction R de l’exercice en séance 7
Télécharger le jeu de données pour les communes

Faire des associations entre des variables est à la base du travail statistique. Toutefois, ces associations peuvent parfois naitre du hasard, et pour vérifier de manière rigoureuse que deux variables sont bien corrélées, il faut opérer plusieurs tests statistiques de routine qu’il faut savoir interpréter. Cette séance visera donc à introduire les étudiants aux tests canoniques en sciences sociales quantitatives, et à faire en sorte qu’ils soient capables de les mettre en oeuvre puis d’interpréter leurs résultats. Il n’y a pas de lecture obligatoire pour cette séance.

Télécharger les slides (séance 8, PDF)
Télécharger le script R de la séance 8

Théorème Central Limite, animation

Population d'origine : Asymétrique.
Taille de chaque échantillon : n = 30.

Distribution des moyennes : 0 échantillons tirés

Test de Student Bilatéral (Comparaison de moyennes)

Déplacez le curseur pour simuler la moyenne de votre échantillon.

Score Z de l'échantillon : 0.00

H0 NON REJETÉE : Le hasard est plausible

Test du Chi-Deux (Indépendance)

Simulez un score d'écart global pour voir sa position sur la courbe d'improbabilité.

Score Chi-Deux obtenu : 2.00

H0 NON REJETÉE : Indépendance plausible

Programmes de révision

Notions à retenir :

  • Séance 1 : statistiques et contrôle des populations (les trois traditions mises en avant par A. Desrosières ; exemple de la variole chez Foucault), régimes de généralisation en sciences sociales en fonction des méthodes, définition de la quantification par A. Desrosières.

  • Séance 2 : grands types d’enquêtes en sciences sociales (enquêtes scientifiques, enquêtes administratives, enquêtes par traces) ; exemples d’enquêtes ; biais liés aux différents types d’enquêtes ; nom complet des fichiers .csv (comma separated values).

  • Séance 3 : éléments et vocabulaire pour décrire un fichier tableur (.csv), ainsi que les différentes fenêtres de RStudio ; les différents types d’indicateurs de tendance centrale et leurs défauts ; les indicateurs de dispersion et interprétation d’un écart-type ; quantiles ; interpréter une boîte à moustache (boxplot).

  • Commandes R à maitriser (à l’écrit!) : read.csv("df.csv", sep = ",") ou read.csv("df.csv", sep = ";"), View(), min(), max(), mean(df$var, na.rm = TRUE), median(df$var, na.rm = TRUE), var(df$var, na.rm = TRUE), sd(df$var, na.rm = TRUE). L’évaluation de la connaissance de ces fonctions sera sous la forme d’un contrôle de vocabulaire, comme en cours de langue.

  • Vous pouvez poser vos questions en utilisant l’interface ci-dessous. Je verrai d’abord vos questions, puis je les publierai ici en ajoutant une réponse :

Notions à retenir :

  • Séance 4 : variables indépendantes, variables dépendantes et leurs typologies, types de croisement des variables (quali x quali ; quanti x quali ; quanti x quanti) et outils utilisés afin de les croiser ; interpréter les résultats de ces outils (par exemple, savoir interpréter une variance ou un coefficient de corrélation).

  • Séance 5 : comprendre le principe de l’essai randomisé contrôlé (ERC ; randomized control trial, en anglais) ; calcul d’une marge d’erreur statistique et interprétation du résultat.

  • Séance 6 : apprendre les différents types de biais pouvant affecter la qualité d’un questionnaire, à partir de l’article de Jean Paul Grémy évoqué en cours ; schéma de l’article en page 2 de l’article d’Alain Desrosières.

  • Séance 7 : cas historique de la prédiction des résultats de l’élection américaine de 1936 ; concepts fondamentaux de l’échantillonage ; base de sondage ; grandes familles de sondage et leurs sous-types ; enquêtes par Big Data et leur fonctionnement.

  • Séance 8 : théorème central limit ; intervalles de confiance ; Test de Student et Test du Khi-2, fonctionnement et interprétation des résultats.

  • Commandes R à maîtriser (à l’écrit !) :

    • Préparation et manipulation des données : read.csv() pour importer, as.factor() pour transformer une variable en variable qualitative, str() pour vérifier la structure, et nrow() pour vérifier la taille du tableau. Savoir utiliser les crochets [] pour extraire des valeurs précises.
    • Croisement Quali x Quali : table() pour les effectifs bruts, prop.table(..., margin = 1 ou 2) pour les pourcentages en ligne ou en colonne, et round() pour arrondir.
    • Croisement Quali x Quanti : aggregate(Y ~ X, data = ..., FUN = mean ou sd) pour calculer des moyennes ou des écarts-types par sous-groupe, et boxplot() pour afficher une boîte à moustaches.
    • Croisement Quanti x Quanti : plot() pour générer un nuage de points, cov(..., use = "complete.obs") pour la covariance, et cor(..., use = "complete.obs") pour la corrélation.
    • Échantillonnage : set.seed() pour fixer le hasard, sample() pour le tirage aléatoire simple, ainsi que la syntaxe du package dplyr (%>%, group_by(), slice_sample()
    • Tests statistiques et intervalles : calcul manuel de la marge d’erreur 1.96 * sd(...) * (1/sqrt(...) + 1/sqrt(...)), t.test(Y ~ X, data = ...) pour comparer deux moyennes et obtenir directement leurs intervalles de confiance, et chisq.test(tableau) pour tester l’indépendance statistique.

Télécharger la fiche de révision pour les commandes R

  • Vous pouvez poser vos questions en utilisant l’interface ci-dessous. Je verrai d’abord vos questions, puis je les publierai ici en ajoutant une réponse :


Tutoriels

Ci-dessous, vous trouverez des tutoriels qui vous permettent d’installer R et RStudio sur vos ordinateurs en fonction de votre système d’exploitation (i.e., macOS ou Windows, par exemple), ainsi que d’ouvrir une version en ligne via Posit Cloud.

  1. Télécharger R :
    • Rendez-vous sur le site du CRAN : https://cran.r-project.org/bin/windows/base/
    • Cliquez sur le lien “Download R 4.x.x for Windows”.
    • Ouvrez le fichier .exe téléchargé et suivez les instructions d’installation (validez tout par défaut).
  2. Télécharger RStudio :
  3. Lancement :
    • Ouvrez RStudio (icône bleue ronde).
    • Note : Il n’est pas nécessaire d’ouvrir le logiciel “R” (icône grise) directement.
  1. Vérifier votre processeur :
    • Cliquez sur la  (Pomme) en haut à gauche > À propos de ce Mac.
    • Regardez la ligne “Puce” ou “Processeur”. Si vous voyez “Apple M1/M2/M3”, vous avez une puce Apple Silicon. Si vous voyez “Intel Core…”, vous avez une puce Intel.
  2. Télécharger R :
    • Rendez-vous sur le site du CRAN : https://cran.r-project.org/bin/macosx/
    • Si puce Apple Silicon (M1/M2…) : Téléchargez le fichier sous “R-4.x.x-arm64.pkg”.
    • Si puce Intel : Téléchargez le fichier sous “R-4.x.x-x86_64.pkg”.
    • Installez le fichier .pkg.
  3. Télécharger RStudio :
  1. Installer R :
    • Il est recommandé d’utiliser le gestionnaire de paquets de votre distribution (apt, dnf, pacman).
    • Exemple pour Ubuntu/Debian : Ouvrez un terminal et tapez : sudo apt-get update && sudo apt-get install r-base
  2. Télécharger RStudio :
    • Rendez-vous sur https://posit.co/download/rstudio-desktop/
    • Descendez vers la section “All Installers” et choisissez le fichier .deb (Ubuntu/Debian) ou .rpm (Fedora/RedHat) correspondant à votre version.
    • Installez le paquet via votre gestionnaire de logiciels ou en ligne de commande.
  • Un tutoriel YouTube est disponible via ce lien : https://www.youtube.com/watch?v=k0r3iLGJgmQ. Si jamais vous avez encore des problèmes pour installer le logiciel, nous prendrons du temps avant ou après les séances pour régler les soucis d’installation.

Si vous ne pouvez pas installer R et RStudio sur votre ordinateur car vous travaillez sur tablette ou sur Chromebook, vous pouvez utiliser la version “cloud” (en ligne). L’interface est strictement identique, mais tout se passe dans votre navigateur web.

Procédure d’accès :

  1. Création du compte : Rendez-vous sur posit.cloud et cliquez sur “Sign Up” (en haut à droite). Choisissez le plan “Cloud Free” (gratuit) et créez votre compte.
  2. Démarrer un projet : Une fois connecté à votre espace de travail (“Your Workspace”), cliquez sur le bouton bleu “New Project” en haut à droite, puis sélectionnez “New RStudio Project”.
  3. Lancement : L’environnement va mettre quelques secondes à se déployer (“Deploying project”). Une fois terminé, vous retrouverez l’interface familière de RStudio avec ses quatre fenêtres.

Note : Cette solution nécessite une connexion internet constante pour fonctionner.

Évaluations et rendus

NoteDépôt du Devoir Maison 2 (DM2)
  • Veuillez déposer votre fichier pour le DM2 directement dans le dossier Google Drive centralisé. Merci de bien nommer votre fichier avec les noms et prénoms de vos groupes avant de le téléverser.

  • N’oubliez pas de commenter votre code, de le remettre au propre dans le fichier script que je vous ai donné (exercice 5), puis d’interpréter vos résultats dans le script de l’exercice. Si j’exécute votre code, il est censé fonctionner.

NoteDépôt du Devoir Maison 3 (DM3)
  • Veuillez déposer votre fichier pour le DM3 directement dans le dossier Google Drive centralisé. Merci de bien nommer votre fichier avec les noms et prénoms de vos groupes avant de le téléverser.

  • N’oubliez pas de commenter votre code, de le remettre au propre dans le fichier script que je vous ai donné, puis d’interpréter vos résultats dans le script de l’exercice. Si j’exécute votre code, il est censé fonctionner.

Télécharger le script R du DM3
Télécharger le jeu de données du titanic