Intérêts de recherche

Je m'intéresse principalement au développement de méthodes topologiques et géométriques permettant d'extraire la structure d'un jeu de données, ou encore de comprendre le comportement des systèmes d'apprentissage. Ainsi, mes recherches se situent à l'intersection de la topologie, de l'analyse de données et de l'apprentissage profond.

Projets

Les grands modèles de langage et la géométrie des embeddings

Diagramme abstrait d'un pipeline LLM

Les grands modèles de langage (LLM) encodent des mots, des phrases et des concepts sous forme de vecteurs de grande dimension appelés embeddings. La forme des espaces d'embeddings est loin d'être arbitraire : les relations sémantiques et syntaxiques significatives tendent à s'auto-organiser en structures géométriques.

J'étudie ces structures à l'aide d'outils de topologie computationnelle, notamment l'homologie persistante. L'objectif est de mieux comprendre ce qu'un LLM apprend, avec quelle fiabilité il représente les données, et comment sa géométrie interne évolue au cours d'un entraînement. En obtenant une image plus claire de ces structures géométriques, nous pouvons améliorer l'explicabilité et la robustesse des LLM.

Diagramme abstrait d'un pipeline LLM
Champ gradient d'une fonction de Morse discrète multidimensionnelle

Théorie de Morse discrète multiparamètre

Champ gradient d'une fonction de Morse discrète multidimensionnelle

La théorie de Morse classique étudie comment la topologie d'un espace varie lorsqu'on balaie les ensembles de sous-niveaux d'une fonction à valeurs réelles. Ainsi, elle permet de détecter quand les composantes connexes, les trous ou les vides se forment ou disparaissent. La théorie de Morse discrète transpose ces idées dans un cadre combinatoire, permettant d'analyser la forme de jeux de données complexes de manière efficace d'un point de vue computationnel.

Dans ma thèse de doctorat, je développe les fondements théoriques et algorithmiques nécessaires pour étendre ce cadre à un contexte multidimensionnel, où un espace est filtré simultanément par plusieurs fonctions plutôt qu'une seule. Cette théorie généralisée est étroitement liée à l'homologie persistante multiparamètre, qui fournit un moyen de caractériser un jeu de données selon plusieurs descripteurs.

Fractales multicomplexes

Coupe 3D d'une fractale multicomplexe

Le plan complexe peut être généralisé en dimensions supérieures à l'aide des nombres multicomplexes, ouvrant ainsi la voie aux fractales en dimensions 4, 8, 16 et au-delà. On peut donc se poser la question : à quoi ressemblent ces fractales et comment peuvent-elles être décrites ?

Dans ma thèse de maîtrise, j'explore le monde fascinant des nombres multicomplexes et de leurs fractales associées. En particulier, je classifie les coupes tridimensionnelles principales des ensembles de Mandelbrot généralisés à l'aide d'outils issus des systèmes dynamiques, de l'algèbre et de la géométrie.

Coupe 3D d'une fractale multicomplexe