Emmanuel DupouxSciences cognitives, acquisition du langage et de la sociabilité
Emmanuel Dupoux, directeur d’études à l’EHESS, est responsable de l’équipe Cognitive Machine Learning (CoML) du Laboratoire de sciences cognitives et psycholinguistique (LSCP, CNRS / EHESS / ENS - PSL) qu’il a dirigé entre 1998 et 2009. Sa recherche porte sur les mécanismes et les effets à long terme du développement cognitif et linguistique chez le jeune enfant combinant les outils de la psychologie expérimentale, de l’imagerie cérébrale et de l’intelligence artificielle. Co-créateur, en 2002, du Master de sciences cognitives CogMaster (EHESS / ENS / Université Paris Descartes), il s’est également impliqué dans la création du Département d’études cognitives de l’ENS et du réseau Carnot Cognition.
Après s’être formé en mathématiques appliquées, en informatique (ENS) et en psychologie cognitive (EHESS), Emmanuel Dupoux dirige pendant dix ans le LSCP, créé par Jacques Mehler, l’un des premiers laboratoires de sciences cognitives au monde à étudier le nourrisson. « J’ai été immédiatement fasciné par l’apprentissage du langage chez le jeune enfant, qui parvient à acquérir le système de communs le plus complexe du monde animal, en quelques années, sans instruction explicite ». Son objectif : comprendre les mécanismes qui rendent cette acquisition possible.
« Cette énigme, à la fois biologique, culturelle et computationnelle, m’a conduit à construire une approche interdisciplinaire mêlant psychologie, linguistique et intelligence artificielle. »
Emmanuel Dupoux s’est d’abord intéressé à l’influence de la langue maternelle sur la perception de la parole donnant lieu à des « surdités phonologiques », « une difficulté à percevoir des sons non utilisés dans sa langue » ; puis à l’émergence des préférences sociales et morales chez les nourrissons. Dès 2012, dans le cadre de l’ERC BOOTPHON, il teste l’hypothèse que les bébés apprennent leur langue par analyse statistique de ce qu’ils entendent. « Ne disposant pas alors de modèles statistiques capables d’apprendre à partir de la parole, nous avons organisé des compétitions pour orienter les recherches dans cette direction. Cela abouti en 2021, en collaboration avec META, au tout premier “modèle de langue” apprenant à partir de l’audio brut ». Il montre alors que ces modèles, qui reproduisent bien le développement phonétique et lexical de l’enfant à partir de textes lus, échouent avec la parole spontanée, plus proche de l’environnement réel des enfants.
Aujourd’hui, Emmanuel Dupoux continue sa collaboration avec META : il y construit « un simulateur dans lequel une IA développementale apprend le langage à partir de ses interactions avec son environnement ». Grâce à ces outils distribués en open source, la communauté de sciences cognitives dispose de nouveaux moyens pour étudier le langage de façon quantitative. Côté universitaire, il explore au sein de son projet InfantSimulator, financé par le conseil européen de la recherche (ERC), les hypothèses dominantes en psychologie du développement (grammaire universelle, apprentissage multimodal, constructivisme social) les confrontant aux recherches issues de la linguistique de terrain.
À l’origine de plusieurs initiatives collectives internationales (Zero Resource Challenge, IntPhys), Emmanuel Dupoux s’attache aussi à valoriser les sciences cognitives auprès du grand public et des institutions, en insistant sur leur rôle pour comprendre l’humain à l’ère de l’intelligence artificielle.
« Cette médaille est une reconnaissance forte, à la fois personnelle et collective. Elle met en lumière un champ interdisciplinaire encore jeune, à l’interface entre cognition humaine, sciences sociales, et intelligence artificielle et donne un signal d’encouragement aux jeunes chercheurs et chercheuses qui s’engagent avec enthousiasme dans ce champ. »