Paroles de chercheurs qui ont sauté le pas vers l’industrie
⏱ 7 min[vc_row][vc_column][vc_column_text]Pourquoi un certain nombre de chercheurs en intelligence artificielle (IA) rejoignent-ils la recherche industrielle ? Quelles sont les conséquences pour notre recherche publique ? Quelques chercheurs « passés » chez Facebook, Google ou Criteo ont accepté de nous raconter leurs parcours. Des cas particuliers à partir desquels on se gardera bien de généraliser.
« Sur le papier, on compte 13 chercheurs en machine learning dans mon équipe, SequeL, raconte Lilian Besson, doctorant d’INRIA à Lille. Dans la réalité, seuls 4 membres sont présents physiquement, au jour le jour. » Parmi les 9 autres, 7 sont en détachement et 2 en congés (« leave of absence ») : ils sont tous partis à temps plein, certains dans la recherche publique comme professeurs associés en France ou à l’étranger ; pour la plupart, ils sont allés dans l’industrie, chez Google, Facebook, Criteo ou FishLife Research.Ce phénomène, qui prend la forme d’une petite hémorragie pour cette équipe, semble s’être accéléré ces deux dernières années. L’installation à Paris des labos IA de Google, Facebook ou DeepMind n’y est évidemment pas pour rien. Au sein de Facebook AI Research (FAIR), inauguré en juin 2015, environ la moitié de la cinquantaine de data scientists est issue de la recherche publique. Mais chaque cas est particulier.
Se confronter à la réalité
Alessandro Lazaric, membre de l’équipe Inria en question, est en détachement pour cinq ans, chez Facebook. « J’ai travaillé neuf ans à Inria, où je suis arrivé en tant que post-doctorant en août 2008, raconte-t-il. J’ai demandé mon détachement en juin 2017 pour plusieurs raisons : à la suite du départ de plusieurs collègues, on m’a proposé de prendre la responsabilité de l’équipe, un rôle de gestionnaire qui ne m’attirait pas, même si j’en ai été flatté ; cela m’a néanmoins amené à réfléchir à l’orientation de ma carrière de chercheur, et m’a finalement conduit à sauter le pas vers l’industrie pour me confronter à autre chose. » Spécialiste de l’apprentissage par renforcement, une expertise qui intéressait Facebook, ce théoricien a eu envie d’aller au-delà et de tester ses algorithmes sur des grosses infrastructures de calcul, de changer d’échelle, avec des données en quantité. Or soyons clair, seuls quelques industriels disposent aujourd’hui de ces infrastructures permettant de traiter et d’expérimenter de grands ensembles de données.
« Je continue à faire de la recherche, insiste Alessandro Lazaric, qui a refusé le temps partiel que lui proposait Facebook, préférant se consacrer pleinement à de nouveaux projets sachant qu’il pourrait revenir un jour à Inria. Mes recherches aboutiront peut-être à des applications pratiques, mais mon travail reste bien loin de la mise en production. En revanche, après avoir travaillé pendant des années sur un simple ordinateur et un bout de tableau, la plupart du temps seul, j’étais attiré par l’idée de travailler en équipe, avec des data ingénieurs qui m’aident au niveau technique sur ces infrastructures. » L’autre raison, plus inattendue, était de profiter des compétences en deep learning des chercheurs de Facebook pour se mettre à niveau, car il reconnaît être passé à côté de cette révolution.
« Finalement, mon quotidien de scientifique n’a pas beaucoup changé, assure-t-il. J’avais peur de perdre en termes de publications mais, ici comme à Inria, nous sommes encouragés à publier, sans contrainte particulière, ainsi qu’à produire des logiciels en open source sur Github. Je suis extrêmement satisfait de l’ouverture d’esprit de Facebook, je peux parler de mes travaux – sans pour autant partager des données internes bien sûr – une philosophie a priori partagée chez Microsoft, Google ou Criteo –, ce qui est loin d’être le cas partout. Concrètement, je passe moins de temps à chercher des financements, et je suis plus investi dans le recrutement ou dans des activités plus proches des produits. »
Des frontières poreuses
Selon Jean-Philippe Vert, chercheur en machine learning et bio-informatique dans le laboratoire parisien Google Brain, « en IA, les frontières ont toujours été poreuses entre les laboratoires académiques et l’industrie. Les Bell Labs d’ATT, par exemple, laboratoire industriel connu notamment pour ses neuf prix Nobel et trois prix Turing, a vu passer dans les années 1990 de nombreux chercheurs qui ont joué des rôles de pionniers dans les progrès de la discipline, avec des carrières variées dans l’académique et l’industrie, comme Yann Le Cun, Léon Bottou, Corinna Cortes, Vladimir Vapnik, Yoshua Bengio et bien d’autres. La concurrence entre entreprises pour recruter des experts s’est clairement accentuée depuis environ cinq ans, en raison des progrès rapides de la discipline et de la relative prospérité économique, qui poussent grosses et petites entreprises à investir massivement dans ces technologies ».
De fait, que ce soient les Gafam (Google, Apple, Facebook, Amazon, Microsoft), les Natu (Netflix, AirBnb, Tesla, Uber), les BATX (Baidu, Alibaba, TecCent, Xiaomi), les géants de la finance, de l’industrie traditionnelle ou les milliers de start-up du domaine, nombreux sont les acteurs industriels qui ont recruté des chercheurs en IA. « L’IA, et plus particulièrement le machine learning, sont devenus des technologies stratégiques, résume Jean-Philippe Vert. Elles impactent les moteurs de recherche, la traduction automatique, les voitures autonomes, bientôt la santé et l’environnement. Toutes ces entreprises cherchent naturellement à développer une expertise dans ces domaines, donc à recruter des experts. »
L’industrie comme acteur scientifique
Pour sa part, pour rejoindre Google Brain en août 2018, ce chercheur renommé, alors directeur du centre de bio-informatique à Mines ParisTech et directeur adjoint d’une unité sur le cancer et le génome associant Mines ParisTech, l’Institut Curie et l’Inserm, a pris l’option de se mettre en disponibilité de la fonction publique pour trois ans : « J’ai choisi de rejoindre Google à temps plein, tout en conservant un statut de chercheur associé bénévole à Mines ParisTech, afin de poursuivre mes activités de supervision d’étudiants et d’enseignement, explique Jean-Philippe Vert. Pour moi, c’est l’occasion d’être confronté à de nouveaux problèmes et défis scientifiques, de pouvoir travailler sur des applications à fort impact économique et sociétal en disposant de moyens considérables grâce à la puissance de calcul et aux grandes quantités de données disponibles. »
Il ajoute que les Gafamont globalement de très bons contacts avec le monde académique : « Ce sont des acteurs à part entière de la communauté scientifique, publiant leurs résultats et produisant des logiciels libres ; leurs laboratoires sont remplis d’anciens étudiants et chercheurs des universités du monde entier. » Pas moins de 10 % des articles de la conférence NeurIPS (Neural Information Processing Systems, ex Nips), considérée comme la plus importante conférence académique en IA, sont signés par un chercheur travaillant chez Google. Les laboratoires IA de Facebook, Google ou Criteo ont une vision à long terme et travaillent sur des questions théoriques, assurent les uns et les autres.[/vc_column_text][/vc_column][/vc_row][vc_row][vc_column][vc_empty_space][/vc_column][/vc_row][vc_row][vc_column][vc_cta h2= » »]
Des conférences plus convoitées que les meilleurs spectacles du monde !
ICML ou NeurIPS rassemblent chaque année environ 8 000 personnes autour du machine learning. Les places sont de plus en plus convoitées : elles sont parties en onze minutes en septembre dernier… pour NeurIPS 2018. Les organisateurs ont même dû en garder de côté, pour que les orateurs aient bien leurs tickets d’entrée. Certains reprochent à ces conférences internationales de machine learning (il y en a eu plus de 250 en 2018 !) d’être devenues des méga forums de l’emploi, où la sponsorisation par les entreprises (voir la liste) est à l’image de la concurrence acharnée qu’elles mènent pour approcher les meilleurs data scientists.[/vc_cta][/vc_column][/vc_row][vc_row][vc_column][vc_empty_space][/vc_column][/vc_row][vc_row][vc_column][vc_column_text]
Rattraper le retard en deep learning
Quoi qu’il en soit, les chercheurs académiques qui sautent le pas vers l’industrie défendent leur choix. À l’instar de Vianney Perchet, professeur de mathématiques appliquées au CMLA à l’ENS-Paris-Saclay, qui a demandé une autorisation de cumul pour travailler à temps partiel (40 %) chez Criteo tout en poursuivant ses recherches à l’ENS avec ses doctorants, qu’il ne voulait en aucun cas abandonner. « C’est bénéfique pour tous, soutient le data scientist qui bénéficie de cette double position depuis juin 2017, d’abord demandée pour un an, puis renouvelée pour trois ans. Cette culture d’association entre laboratoires académiques et recherche privée existe depuis longtemps aux États-Unis.Tout le monde peut y gagner : cela permet de créer des liens – via des thèses Cifre[1] ou des stages de master –, et de répondre aux problématiques actuelles en orientant les activités des laboratoires dans le concret. Favoriser ces interactions avec les entreprises peut notamment nous permettre de rattraper notre retard, en France, en matière de deep learning. »
Vianney Perchet reconnaît que les grands industriels, Gafa en tête, ont énormément poussé au recrutement d’enseignants-chercheurs pour satisfaire leur besoins d’expertise et défricher de nouveaux domaines. « Il y a quelques années, en général, le chercheur abandonnait son poste dans le public, rappelle-t-il. Maintenant, on voit apparaître ces doubles positions académique-privé, comme la mienne. Nous sommes trois chercheurs français dans ce cas chez Criteo sur une trentaine de data scientists [il y a environ 80 chercheurs et ingénieurs au Criteo AI Lab, NDLR]. » Comme les autres, il attache beaucoup d’importance à l’accès que cela lui permet à un « bac à sable de données », ainsi qu’à des problématiques nouvelles, auxquelles un chercheur public, seul dans son labo, n’aurait pas pensé, même si le CMLA est réputé pour veiller à l’application de ses recherches. « Cela m’inspire pour aborder de nouvelles questions et travailler dessus avec mes étudiants à l’ENS d’un point de vue théorique, reconnaît-il. Et je fais évoluer mon enseignement pour y intégrer des aspects que nous n’enseignions pas en France comme les interactions entre théorie des jeux (enchères notamment), apprentissage et algorithmiques. Un laboratoire fermé sur lui-même est voué à disparaître…»
Maintenir le bon équilibre public/privé
« Les entreprises ont besoin des laboratoires académiques pour former les experts de demain et pour maintenir une recherche de long terme au plus haut niveau, renchérit Jean-Philippe Vert. De leur côté, les académiques ont besoin des entreprises pour embaucher les étudiants qu’ils forment, valoriser certains résultats de recherche, et bénéficier de moyens de calculs et de financements pour mener à bien leurs travaux. » Selon lui, le recrutement est une des formes de ces synergies qu’il considère comme bénéfique pour tous, les autres étant le mécénat pur, des collaborations scientifiques sur des sujets industriels, des bourses de doctorants, de nombreux stages, ainsi que des demandes d’expertise et de conseil, des laboratoires communs, ou encore des échanges de chercheurs plus ou moins longs.
Chacun précise que les industriels sont conscients qu’il ne faut pas débaucher trop d’enseignants-chercheurs, au risque de tarir leur vivier de recrutement de chercheurs et d’ingénieurs. Mais comment savoir quand le point d’équilibre est dépassé ? « On n’a probablement pas encore passé le pic de recrutement, juge Alessandro Lazaric. Il faut prévoir d’autres départs de l’académique vers le privé, notamment vers les nouvelles entreprises installées à Paris [Facebook a par exemple annoncé viser une équipe de 60 chercheurs et ingénieurs au sein de FAIR d’ici à 2022, soit 10 de plus qu’actuellement, NDLR]. Toutefois, même si un grand nombre de chercheurs ont quitté l’université pour s’installer dans une entreprise privée, ce changement est temporaire, car la plupart sont détachés et peuvent revenir à l’université. Par ailleurs, de nouvelles formes d’interactions entre recherches privée et publique aideront à trouver le bon équilibre. » Cet équilibre dépend en grande partie d’une part des moyens octroyés par l’État, que ce soit en termes d’infrastructures matérielles de modélisation ou de financements de chaires (voir notre prochain article de ce dossier sur ce sujet), d’autre part des facilités à mettre en place ces doubles positions, pour l’heure sujet à de longues procédures. Tous les chercheurs ne sont pas tentés par l’aventure du privé, mais ces questions, tout comme l’accès aux données et la maigre rémunération de la recherche publique, ne doivent pas être sous-estimées.
[1] Ce dispositif de « convention industrielle de formation par la recherche » permet aux entreprises de bénéficier d’une aide financière pour recruter de jeunes doctorants dont les projets de recherche sont menés en liaison avec un laboratoire académique.
Isabelle Bellin
[/vc_column_text][/vc_column][/vc_row]