Quels systèmes académiques en data science en France et en Allemagne ?
⏱ 7 minEnseignement de la data science, organisation de la recherche, financement par projet… Tour d’horizon des similitudes et des différences des systèmes français et allemand au cours d’un entretien avec Gilles Blanchard, chercheur en apprentissage automatique qui a travaillé des deux côtés du Rhin, mêlant statistiques et informatique théorique. Il est actuellement en séjour invité à l’Institut des hautes études scientifiques (IHES) de l’université Paris-Saclay.
Quel est votre parcours ? Comment avez-vous été amené à travailler en Allemagne ?
Gilles Blanchard : Après avoir étudié à l’École Normale Supérieure (ENS) de Paris et obtenu mon doctorat à l’université Paris-Nord en 2001, je suis devenu chercheur au CNRS, à l’université Paris-Sud Orsay. De formation mathématiques plutôt orientées probabilités, je me suis progressivement intéressé aux aspects statistiques de l’apprentissage automatique, à l’interface entre statistiques et informatique théorique. J’avais notamment suivi en 1995 des cours de l’ENS Cachan, dont celui sur les réseaux neuronaux de Robert Azencott, un des pères fondateurs de certaines applications des statistiques, en particulier dans le traitement d’images [lire l’article DAP « Les débuts de l’aventure française de l’intelligence artificielle », NDLR]. L’apprentissage automatique est devenu mon domaine de recherche.
Après avoir passé un an au CNRS, j’ai rejoint l’Institut FraunhoferLes Instituts Fraunhofer sont orientés vers la recherche appliquée et le transfert technologique. de Berlin en 2002, c’est là que j’ai découvert le machine learning dans le laboratoire du professeur Klaus-Robert Müller, un laboratoire où j’ai travaillé jusqu’en 2008 en tant que chercheur sur des applications d’informatique théorique.
J’ai ensuite passé un an à l’Institut Weierstrass de mathématiques appliquées dans le groupe de Vladimir Spokoiny (orienté vers la statistique mathématique) avant d’être recruté, en 2010, en tant que professeur, à l’Institut de mathématique de l’université de Potsdam sur la chaire de statistiques. J’y enseigne les statistiques en Bachelor (l’équivalent de nos années de licence) et en Master. Je donne un cours d’initiation assez classique, un autre d’analyse de données et un troisième de théorie de l’apprentissage.
Vous travaillez en Allemagne depuis 2002. Quelle était la perception de l’apprentissage automatique à l’époque, comparée à ce que vous aviez connu en France ? Comment cela se traduisait-il dans l’enseignement ?
G. B. : Je pense, après coup, que mon recrutement à Potsdam répondait à une volonté de l’université d’aller vers plus d’interdisciplinarité et vers l’enseignement des mathématiques appliquées. Mon parcours, entre mathématiques statistiques et informatique théorique est un peu à l’image de ce que certains précurseurs français défendaient dès le début des années 2000, comme Robert Azencott, Alain Trouvé, Olivier Catoni – ces deux derniers étaient mes directeurs de thèse – Jean-Michel Morel, Donald Geman, Pascal Massart ou Alexandre Tsybakov. Au milieu des années 1990, plusieurs d’entre eux avaient organisé un séminaire de recherche particulièrement formateur à l’ENS Paris, sur des thèmes variés allant de la statistique mathématique à la théorie de l’apprentissage. Comme d’autres, j’ai baigné dans cette mouvance.
La France avait une longueur d’avance à cette époque en ce qui concerne cette perméabilité entre maths et informatique, qui a ensuite donné naissance à ce qu’on a appelé les data science. Outre Cachan, cette volonté était partagée au moins en région parisienne, en particulier à Paris ou à Orsay. C’était un mouvement important.
À la même époque, en Allemagne, il y avait encore une certaine rigidité : un master de maths était un master de maths ; un master d’informatique était un master d’informatique. Le machine learning y était un domaine réservé de l’informatique. Ce qui n’a pas empêché l’émergence de groupes de recherche à la pointe en apprentissage automatique, comme celui de Klaus-Robert Müller, dont est issu Bernhard Schölkopf par exemple, directeur du Max Planck InstituteLes Instituts Max Planck sont orientés vers la recherche fondamentale. for Intelligent Systems (Tübingen) et internationalement reconnu. À noter d’ailleurs que certains chercheurs français ont contribué à rapprocher les deux disciplines en Allemagne. C’est par exemple le cas d’Olivier Bousquet, lors des deux années qu’il a passées à Tübingen entre 2002 à 2004 – il dirige aujourd’hui le laboratoire de recherche en intelligence artificielle de Google à Paris.
Qu’en est-il de l’enseignement de la data science aujourd’hui ?
G. B. : Progressivement, il est devenu assez comparable en Allemagne au nôtre avec une large offre de masters, les études étant néanmoins plus « à la carte » outre-Rhin à partir de la troisième année, avec également des modules dans lesquels les étudiants organisent des séminaires sur des sujets précis, ce qui se fait seulement en master en France. Mis à part cela, de part et d’autre du Rhin, les universités ont développé des cursus qui allient mathématiques, statistiques et informatique.
Le lien entre mathématiciens d’horizons très divers et informaticiens date de la fin des années 2000, notamment avec le développement de méthodes très à la mode à l’époque, les méthodes à noyaux, qui avaient l’avantage de reposer sur des concepts mathématiques extrêmement propres. Quant aux réseaux de neurones, leur enseignement selon un cadre théorique mathématiquement satisfaisant est délicat, aujourd’hui encore, car leur formalisation est difficile. Les outils mathématiques n’existent pas encore.
Que diriez-vous de l’organisation de la recherche en France et en Allemagne ?
G. B. : Elle est, pour le coup, encore assez différente. En Allemagne, elle est beaucoup plus pyramidale qu’en France, avec un professeur, responsable d’une chaire, qui constitue son groupe de collaborateurs (Mitarbeiter) et mène ses projets de recherche comme de véritables petites entreprises, avec une forte hiérarchie. Ses collaborateurs dépendent directement de lui, là où, en France, les maîtres de conférence sont des collègues qui partagent les enseignements avec les professeurs au sein d’un département commun. Il y a aussi beaucoup moins de professeurs : par exemple, seulement trois professeurs de probabilités et un de statistiques à l’université Humboldt de Berlin, une des plus grandes d’Allemagne. Le professeur y est le représentant de sa discipline. En France, dans les départements de mathématiques, il y a beaucoup de professeurs, y compris en région.
Résultat : les postes de professeurs sont particulièrement convoités en Allemagne. D’autant plus que ce sont les seuls postes permanents, l’écrasante majorité des collaborateurs étant en contrat à durée déterminée. Cela crée des situations personnelles difficiles, notamment quand on se « retrouve sur le carreau » à la quarantaine, car l’université ne peut plus renouveler le contrat et n’a pas les moyens d’octroyer un poste permanent. Cette organisation, avec un nombre progressivement réduit de postes permanents, tend à se développer en France.
Pour ma part, je ne pense pas que cela permette d’augmenter la « productivité » des chercheurs, même s’ils sont mieux payés en Allemagne qu’en France. Un chercheur a besoin d’une certaine sérénité. Néanmoins, même si cette compétition pour les postes est dure, il faut reconnaître l’efficacité du système allemand grâce à une exigence de résultats plus systématique, une culture de la valorisation et une interaction assez systématique avec le privé.
Qu’en est-il du financement des recherches ?
G. B. : En Allemagne, le système repose depuis longtemps sur une gestion par projet via des financements octroyés par la Fondation allemande pour la recherche (Deutsche Forschungsgemeinschaft en allemand, ou DFG) : 32 000 projets (bourses, projets collaboratifs nationaux et internationaux, infrastructures, etc.) étaient soutenus en 2017, nouveaux ou en cours, pour 3,2 milliards d’euros. La DFG est l’équivalent de notre Agence nationale de la recherche (ANR) qui, par comparaison, a financé 1 380 projets en 2017 avec près de 500 millions d’euros d’aides – l’ANR a soutenu 18 000 projets depuis sa création en 2005.
Ce mode de fonctionnement qui vient des États-Unis, inspiré de l’économie libérale, s’est rapidement développé en Grande-Bretagne, puis en Allemagne, et a gagné la France. C’est aussi le mode de financement des projets européens. L’Allemagne y était plus encline du fait de son histoire, sa politique et sa culture du management, à laquelle les professeurs sont encouragés. Outre-Rhin, il faut déposer une demande de projet que ce soit pour payer un doctorant, un post-doctorant ou pour la création d’un regroupement de laboratoire comme les Labex (laboratoires d’excellence) en France.
Le même système s’est généralisé depuis en France, via l’ANR, mais seulement pour le financement de projets de recherche. Le système fonctionne toujours mieux en Allemagne, car il y a beaucoup plus de moyens attribués, donc un pourcentage bien plus important de projets financés, y compris pour financer du personnel. À noter cependant qu’en France, nous bénéficions d’écoles doctorales et de bourses d’université qui compensent cet aspect-là (cela existe aussi dans les Instituts Max Planck).
Quelles sont les conséquences de ce financement par projet ?
G. B. : De manière générale, cela peut favoriser une saine compétition, ainsi que la mobilité vers l’industrie. Mais on passe désormais beaucoup de temps à écrire et évaluer des projets. L’efficacité du système allemand vient notamment du fait que les agences de financement allemandes ne sont pas obtuses et privilégient la vision scientifique des projets. Elles sont moins bureaucratiques qu’en France.
Toutefois, le financement par projet incite par nature à ne proposer que des idées déjà très bien balisées et à ne pas prendre de risques, en restant dans les formats imposés, pour augmenter les chances de financement. Cet effet de bridage est un défaut important, pointé par de nombreux chercheurs.
Que pensez-vous du soutien à la recherche fondamentale en France et en Allemagne ?
G. B. : Chaque discipline bénéficie d’un budget spécifique en Allemagne, y compris en mathématiques. Beaucoup de mes collègues de Potsdam ont décroché des financements en maths théoriques. Par ailleurs, les jeunes chercheurs brillants, quelle que soit leur origine, bénéficient du programme Emmy Noether qui permet aux jeunes post-doctorants qui parviennent à décrocher la bourse de constituer un groupe de recherche junior indépendant (avec 2 à 4 doctorants) pendant six ans et de se qualifier pour le poste de professeur d’université. L’objectif étant d’attirer des chercheurs en Allemagne, les boursiers doivent poursuivre leurs recherches sur place.
C’est un peu le pendant des bourses européennes octroyées par le Conseil européen de la recherche (ERC en anglais) qui financent des chercheurs d’exception, junior ou senior, pour mener des recherches exploratoires. Nous n’avons pas d’équivalent français. Et notre financement de programmes « blancs » par l’ANR dont le contenu est déterminé par la communauté scientifique – comme le propose également la DFG – est très limité.
Quid de la collaboration franco-allemande autour de l’intelligence artificielle (IA) ?
G. B. : Nos gouvernements respectifs affichent leur volonté de créer un « Airbus de l’IA », comme l’a proposé l’Allemagne, où les secteurs public et privé, après avoir été peut-être un peu frileux et conservateurs vis-à-vis des progrès de la data science, changent désormais à grande vitesse. Mais pour faire le poids face aux géants américains (et bientôt Chinois) de l’IA, c’est à l’échelle de l’Europe qu’une vision cohérente est nécessaire. C’est ce que propose la communauté scientifique qui milite pour créer un institut européen de recherche sur l’intelligence artificielle.
Baptisé ELLIS pour European Lab for Learning and Intelligent Systems, ce laboratoire, qui comprendrait plusieurs centres européens, aurait pour objectif de maintenir la recherche fondamentale en Europe pour y favoriser l’impact économique de l’IA (je note cependant que les entreprises qui soutiennent ELLIS sont allemandes, britanniques voire américaines, mais pas françaises). Ces initiatives, politique d’un côté et de la communauté scientifique de l’autre, sont encore trop disparates. La cohésion reste à parfaire. Mais les opportunités sont là !
Propos recueillis par Isabelle Bellin