François Yvon :
la traduction automatique pour passion
⏱ 3 minFrançois Yvon est un spécialiste du traitement automatique des langues, un domaine à la frontière entre l’IA, l’informatique et la linguistique. Directeur de recherche au LISN, il s’intéresse à la diversité des langues et aux applications de ses travaux dans la société.
Faire les choses dans l’ordre ou comme les autres n’a jamais vraiment intéressé François Yvon. C’est pourquoi, à 57 ans, il qualifie sa trajectoire professionnelle de « non linéaire, voire à l’envers ». La raison ? Au départ, ce fils de professeurs ne se voyait pas chercheur, mais plutôt ingénieur. « Enfant, j’aimais beaucoup bricoler, et l’informatique est finalement un art raffiné du bricolage », explique-t-il. Après un bac scientifique et une classe préparatoire à Poitiers, d’où il est originaire, il intègre donc l’École Polytechnique. Mais comme il s’intéresse aussi aux « sciences non exactes » comme l’économie et la sociologie, il poursuit ensuite ses études dans une autre école d’ingénieur : l’Ecole Nationale Supérieure de Statistique et d’Administration Économique (Ensae). Un premier pas de côté qui va finalement lui faire découvrir le domaine dans lequel il exerce aujourd’hui…
Enseignant-chercheur en informatique
C’est en effet lors d’un stage que François Yvon découvre pour la première fois cette branche de l’informatique qu’est le traitement automatique des langues. Diplômé de l’Ensae en 1989, il ne s’oriente pas pour autant dans la recherche comme certains de ses camarades. « Les autres me semblaient plus capables que moi et j’avais aussi envie d’acquérir mon indépendance financière », se justifie-t-il. Le jeune homme se lance alors directement dans la vie active, comme ingénieur informaticien au sein de l’entreprise pharmaceutique Wyeth. Une expérience décevante. Pendant trois ans, il passe la plupart de son temps en réunions alors que c’est avant tout la technique qui lui plaît. Changement de cap : en 1992, il décide donc de rejoindre l’ENST Paris (aujourd’hui Télécom Paris) pour entamer une thèse sur le traitement automatique des langues.
Titulaire de son doctorat en 1996, il est directement recruté par l’ENST comme maître de conférences au département Informatique et Réseaux. Entre ses enseignements et ses recherches sur l’application de méthodes d’apprentissage probabiliste à des problèmes de traitement automatique des langues, François Yvon est dans son élément. Au bout de dix ans, il saisit l’opportunité d’une création de poste de professeur à l’université Paris-Sud sur les thématiques de la traduction automatique pour rejoindre le Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur (Limsi) à Orsay.
Spécialiste du Natural Language Processing
Au sein du groupe Traitement de la Langue Parlée, son activité touche tous les aspects de la traduction automatique : de l’alignement des phrases et des mots à la mesure automatique des performances, en passant par les modèles de traduction et les algorithmes d’apprentissage et de décodage pour la traduction de paroles et de textes écrits. Avec son équipe, il développe même le premier système de traduction entièrement basé sur des modèles neuronaux. « Une période très excitante », résume-t-il.
Mais son engagement ne s’arrête pas là. En 2013, François Yvon prend la direction du Limsi en étant détaché comme directeur de recherche au CNRS : « la gouvernance doit être assurée par un collectif de pairs, chacun son tour doit donc prendre des responsabilités », estime-t-il. Il occupe ce poste pendant sept ans jusqu’au rapprochement du Limsi avec le Laboratoire de Recherche en Informatique (LRI) pour former, en 2021, le Laboratoire Interdisciplinaire des Sciences du Numérique (LISN) dirigé actuellement par Sophie Rosset.
Pour une science participative et ouverte sur la société
Désormais directeur de recherche au LISN, ses travaux au sein du groupe Traitement du Langage Parlé portent sur la traduction multi-domaine, la traduction avec contraintes terminologiques et l’exploitation des mémoires de traduction. « Dans les interactions homme-machine par exemple, l’une des questions d’aujourd’hui est : comment un système peut assister des gens partiellement bilingues pour qu’ils améliorent leur maîtrise de la langue », explique-t-il. Avec ses doctorants et postdoctorants, il cherche donc à développer des « béquilles linguistiques » comme il dit.
Depuis 2021, il est également engagé dans le projet BigScience, initié par l’entreprise franco-américaine Hugging Face et impliquant plusieurs centaines de chercheurs en intelligence artificielle à travers le monde. En 2022, cette collaboration a donné naissance à Bloom (BigScience Large Open-science Open-access Multilingual Language Model), le plus gros modèle de langue multilingue et open source qui intègre des textes en 46 langues. « J’ai participé à ce projet sur le volet de l’évaluation des capacités multilingues », explique-t-il. Ce qu’il aime dans son métier ? « L’immense liberté dont je dispose dans mes recherches et, surtout, que celles-ci répondent à des enjeux sociétaux très importants, comme la capacité d’interagir et de communiquer en surmontant les barrières linguistiques ».
Laure Blancard
Crédit photo : Elisabeth Piotelat