logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
Menu
mobile logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
2 octobre 2017
DAP, Portrait de data scientist

Guillaume Obozinski met l’apprentissage statistique au service des autres disciplines

⏱ 3 min

Chercheur à l’École des Ponts, Guillaume Obozinski travaille à la construction d’algorithmes d’apprentissages plus efficaces. Sa recherche porte sur les méthodes dites parcimonieuses et les algorithmes d’optimisation rapide. Il s’intéresse beaucoup aux applications depuis la compréhension du rôle des protéines jusqu’à la reconnaissance de scènes 3D en passant par la prévision des consommations électriques.

Il hésitait entre les neurosciences théoriques ou l’intelligence artificielle (IA)… ce sera finalement l’apprentissage statistique. Une révélation pour Guillaume Obozinski qui, sur les conseils de ses professeurs à l’École normale supérieure de Cachan (aujourd’hui École normale supérieure Paris-Saclay), a suivi à la fois des cours de théorie de probabilités, de statistiques, d’analyse et des cours d’informatique. « Ce double bagage m’a beaucoup aidé par la suite », souligne-t-il.

Lors d’un stage de recherche pendant son master MVA, il découvre la science telle qu’on la pratique aux États-Unis. Il adore : « le rapport à la science y est très différent de ce que l’on connaît en France, observe-t-il. Nous apprécions la précision, la rigueur, l’excellence, la théorie, tandis que les Américains aiment rêver la science, la pratiquer expérimentalement. Aux États-Unis, je passais des soirées à regarder des étoiles au télescope avec des étudiants passionnés d’astrophysique. » À l’époque, il était pertinent de partir aux États-Unis, car de nombreuses branches de l’apprentissage n’étaient encore que peu développées en France, mais aujourd’hui « le programme de formation du MVA est aussi riche que celui des meilleures universités américaines, et avec l’apparition d’un grand nombre de start-up dynamiques dans le domaine, la constitution d’équipes spécialisés en IA et data science dans plusieurs grand groupes européens, il existe de nombreuses opportunités en France et en Europe, notamment pour réaliser une thèse CIFRE1 en entreprise avec un encadrement académique », rappelle le chercheur.

Combiner théorie et problématiques appliquées

Aux États-Unis, Guillaume Obozinski poursuit une thèse à l’université de Berkeley en Californie sous la direction de Michael Jordan (pas le basketteur, bien-sûr, mais lui aussi très connu dans son domaine). Sa thèse est à la fois théorique et orientée vers les applications en bio-informatique. En particulier, il tente de prédire les fonctions des protéines, c’est-à-dire de deviner leur rôle dans l’organisme à partir de leur séquence ADN et de leur forme. Pour cela, il utilise des modèles dits « parcimonieux » : ce sont des modèles statistiques adaptés aux situations dans lesquelles on a plus de variables que de données (ici, plus de gènes à étudier que de patients). L’idée est alors de sélectionner les variables les plus pertinentes à étudier grâce à un algorithme.

Après sa thèse, le chercheur hésite entre rester aux États-Unis ou rentrer en France. Il est alors contacté par Francis Bach, un ancien du master MVA, directeur de Sierra, une équipe de recherche  en apprentissage statistique à l’INRIA/ENS, qui lui propose un post-doc. Quelques années plus tard, il rejoint le laboratoire d’informatique de l’École des Ponts. Aujourd’hui, Guillaume Obozinski mène ses recherches sur plusieurs thématiques – toujours cette envie de combiner théorie et problématiques appliquées, et de mener plusieurs activités de front. L’un de ses doctorants travaille sur la « sémantisation » de scènes 3D en environnement urbain : comment reconnaître automatiquement des éléments tels que les rues, les arbres, les véhicules ou les piétons ? Ces recherches nécessitent de construire des algorithmes d’apprentissage rapide prenant en compte les dépendances qui existent entre les différentes variables, par exemple le fait qu’un arbre ne flotte pas, ou qu’une fenêtre est rarement située au niveau du sol.

Un autre doctorant tente d’améliorer les modèles de prévision des consommations électriques, en collaboration avec Réseau de transport d’électricité (RTE), l’entreprise chargée d’acheminer l’électricité haute tension. Un troisième fait une thèse co-encadrée par Facebook sur « l’apprentissage de représentations pour le raisonnement dans les bases de données de connaissance ». L’idée est que les machines deviennent capables d’inférer à partir de nouvelles connaissances sans même qu’on leur indique les règles logiques ou les relations existantes. Par exemple, qu’elles soient capables de repérer que les gens nés aux États-Unis sont américains, sans qu’on leur indique cette règle, et même s’il  y a des exceptions.

Son conseil aux data scientists :

De son riche parcours, Guillaume Obozinski a tiré quelques conseils pour les étudiants. Notamment d’apprendre à dialoguer avec les experts des domaines d’applications sur lesquels ils travaillent. Il est souvent nécessaire d’acquérir des connaissances dans le domaine appliqué, pour parler « la même langue ». Par exemple la connaissance fine des caractéristiques de la consommation électrique était cruciale pour la construction de modèles de prévision.

Car « ce qui est passionnant, c’est qu’il ne s’agit pas de maths pour les maths : au départ, il y a quelque chose de non mathématique, qu’il faut formuler au mieux en termes mathématiques. » Le chercheur suggère aussi de travailler, du moins au début, avec des personnes expérimentées. « Il peut être tentant d’aller dans une start-up ou une entreprise sans culture de l’intelligence artificielle, mais il est nécessaire de côtoyer d’autres experts, lors d’une thèse ou dans un environnement où l’on peut échanger sur les aspects techniques. »

Cécile Michaut

1 Ce dispositif de « convention industrielle de formation par la recherche » permet aux entreprises de bénéficier d’une aide financière pour recruter de jeunes doctorants dont les projets de recherche sont menés en liaison avec un laboratoire extérieur.

Termes liés :
  • Algorithme
  • Intelligence artificielle (IA)
  • Machine learning
  • Data science
  • Données
Share:
Posts you'd might like
ChatGPT a-t-il accouché d’une souris ?
Entretien avec Jean-Gabriel Ganascia
Laurent Gardès : sur les rails de l’IA
Grande distribution : l’IA en tête de gondole
Parkinson : l’IA améliore le diagnostic
L’IA au chevet des séismes et tsunamis
François Yvon :
la traduction automatique pour passion
DAP, la newsletter du Data Analytics Post Recevez chaque semaine un éclairage sur les data science

Peut-on laisser un algorithme apprendre tout seul ?

A la différence de l’apprentissage supervisé, le contexte non supervisé est celui où l’algorithme doit opérer à partir d’exemples non annotés.

En savoir plus

ARTICLES RÉCENTS
  • ChatGPT a-t-il accouché d’une souris ?
    Entretien avec Jean-Gabriel Ganascia
  • Laurent Gardès : sur les rails de l’IA
  • Grande distribution : l’IA en tête de gondole
  • Parkinson : l’IA améliore le diagnostic
  • L’IA au chevet des séismes et tsunamis

Tout savoir sur…

Le DAP

Comité Éditorial

Partenaires

Équipe


Copyright © Data Analytics Post. Tous droits réservés.

Mentions légales & CGU