Alexandru Ginsca, touche-à-tout des data sciences
⏱ 4 minDe ses études universitaires dans son pays natal à son poste actuel de chief data scientist chez Atos, en passant par les data challenges, dont il est un fervent participant, et la recherche académique, ce jeune Roumain a un parcours bien rempli, marqué du sceau de la diversité.
« Ce qui m’intéresse dans les data sciences, ce sont les applications pratiques qu’on peut en tirer, ainsi que leur diversité, qui ne connaît pas de limite. » Ce côté applicatif, Alexandru Ginsca le découvre en 2010, au cours de sa licence en informatique à l’université Alexandru Ioan Cuza, de Iași, en Roumanie. Un module sur le machine learning lui fait alors réaliser toute l’étendue des utilisations de ce domaine de l’intelligence artificielle (IA) – de l’analyse des virus informatiques à la classification des images, en passant par la reconnaissance d’écriture -, et le persuade de continuer dans cette voie.
Pour le jeune homme curieux de nature, c’est aussi l’opportunité de tisser des liens concrets avec deux autres passions qu’il cultive : la littérature et les langues. Pour son master, il se penche ainsi sur l’analyse de textes par machine learning, en particulier l’analyse de sentiments, ou encore la détection « d’entités nommées » – personnes, entreprises, lieux. Enthousiaste et passionné, l’étudiant publie une dizaine d’articles scientifiques sur le sujet pendant son master !
De la Roumanie à la France
À cette même époque, Alexandru Ginsca, véritable touche-à-tout, commence également à participer à des compétitions internationales de data science organisées par des organismes scientifiques (lire l’article « Data Challenge : Au défi des vraies données »). « Ces concours sont le meilleur moyen d’apprendre. Ils permettent de comparer son niveau à celui des autres équipes mondiales et surtout de se tenir au courant des derniers développements en matière d’algorithmes ». Sa curiosité est vite récompensée. Au cours d’une compétition où il s’illustre particulièrement, il est repéré par un laboratoire du Commissariat à l’énergie atomique et aux énergies alternatives (CEA) spécialisé dans les systèmes numériques qui lui propose alors une thèse. Désireux de maîtriser tous les outils théoriques pour pouvoir ensuite développer de nouvelles applications, le jeune diplômé n’hésite pas une seule seconde.
Départ pour la France et la région parisienne. Dans son nouvel environnement, Alexandru Ginsca ne rate pas une occasion de satisfaire son insatiable appétit de connaissances. Il assiste à des meet-up (des rencontres informelles entre experts sur un thème précis) de machine learning, échange avec de nombreux chercheurs et continue de participer à des data challenges, dont les fameux concours Kaggle.
Au cours de sa thèse, il s’intéresse à l’analyse d’images, et plus précisément à la crédibilité des données en ligne : les images du web sont-elles de bonne qualité, et leurs sources sont-elles fiables ? « C’était les débuts du deep learning et de ses multiples retombées pour l’analyse d’images. Grâce à l’analyse de la fiabilité des données en ligne que je développais, on pouvait disposer de meilleures sources d’apprentissage pour les modèles de deep learning, et ainsi les améliorer ». Les travaux du thésard vont même plus loin : ils conduisent à la mise au point d’un moteur de recherche d’images sémantique, plus précis pour répondre aux requêtes dans de grandes bases d’images. Un outil toujours utilisé et commercialisé par le CEA.
Durant son doctorat, le jeune homme ne souhaite pas se cantonner à un seul sujet. Toujours aussi motivé par l’envie d’apprendre et de progresser, il revient également à son premier amour, l’analyse de textes, et publie plusieurs articles sur ce thème en collaboration avec d’autres chercheurs. « C’est important d’explorer différents sujets. Cela permet d’identifier des points communs, de créer des passerelles entre des domaines pour les enrichir mutuellement ».
De la thèse à la recherche
À la fin de sa thèse, Alexandru Ginsca déborde toujours d’idées et d’énergie pour finir de développer les outils sur lesquels il travaille, et en créer de nouveaux. Alors, quand on lui propose d’intégrer le laboratoire, cette fois en temps que chercheur, il ne refuse évidemment pas ! D’autant que rapidement, il participe à un projet européen sur la protection de la vie privée qui lui tient particulièrement à cœur, et sur lequel il peut exprimer pleinement son côté touche-à-tout. Il s’agit alors de sensibiliser le grand public sur la capacité des outils d’IA à récupérer bon nombre de données personnelles postées sur les réseaux sociaux.
Pendant ces trois années de recherche au CEA, Alexandru Ginsca ajoute d’autres cordes à son arc. Il encadre des stages, une thèse et un post-doc, l’occasion pour lui de partager avec passion ses connaissances. Il pilote un projet européen. Il répond à de nombreux appels d’offre de partenariats industriels, met un pied dans la partie commerciale ou encore accompagne des start-up françaises sur la reconnaissance de plantes pour une application d’aide au jardinage.
Mais le jeune data scientist n’est toujours pas rassasié intellectuellement. Dans sa tête grandit le désir de rejoindre le monde industriel. « J’ai eu beaucoup de chance de travailler au CEA, j’ai pu toucher à des sujets très variés et avoir des rôles extrêmement divers, mais j’avais soif de plus de diversité encore. D’une part, je voulais mettre en pratique toutes mes connaissances sans exception, même celles engrangées sur mon temps libre et lors des compétitions, ce qui n’est pas toujours possible dans la recherche académique. D’autre part, j’aspirais à plus de responsabilités, et à plus de pouvoir de décision, pour avoir un impact plus grand sur les projets et les mener d’un bout à l’autre ».
De la recherche à l’industrie
Pour toutes ces raisons, il postule chez Atos. Il intègre l’entreprise début 2019 en tant que chief data scientist. Un rôle qui comble totalement ses attentes. Responsable de l’équipe data science du groupe, il supervise de nombreux projets d’IA divers et variés (maintenance prédictive, analyse de textes, reconnaissance faciale, développement de semelles connectées pour mesurer les charges portées par des ouvriers…) et offre son expertise technique à tous les niveaux, depuis la prospection de clients jusqu’à la réalisation des projets, où il prodigue de précieux conseils à son équipe, à la communauté IA d’Atos et aux clients.
À la lumière d’un parcours aussi bien rempli et mené tambour battant, Alexandru Ginsca conseille aux futurs data scientists de « ne pas se contenter du cadre de l’université, de l’école ou du travail ; il faut se montrer curieux de tout, toujours vouloir en savoir plus et apprendre par soi-même, notamment via les cours en ligne ou les data challenges. Dans le domaine des data sciences, où tout évolue très vite, c’est primordial ».
Julien Bourdet