logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
Menu
mobile logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
28 juin 2017
DAP, Portrait de data scientist

Olivier Teboul, de Google à l’enseignement des langues

⏱ 2 min

Après 5 ans passés chez Google au Brésil, Olivier Teboul a créé une startup d’apprentissage des langues par tchat. Le point commun de ces deux expériences : la mise à profit des données.

Après sa thèse en vision par ordinateur en 2011, Olivier Teboul, titulaire du master MVA de l’ENS Paris-Saclay, décide de tenter sa chance à l’étranger. Direction le Brésil, à Belo Horizonte, un pays en pleine croissance que le chercheur connaît déjà, et qu’il trouve très accueillant. Embauché par Google qui cherche à se développer dans différents pays, notamment en Amérique latine, pour recruter à l’échelle locale, il y travaille pendant 5 ans.

Il a pour mission d’améliorer le cœur du moteur de recherche du géant américain fondé treize ans plus tôt. Il s’intéresse plus particulièrement à « l’algorithme de ranking », autrement dit le classement des résultats des requêtes, une des clés de la pertinence des recherches. Il s’attache à observer et évaluer les résultats. Les équipes de Google lui fournissent des exemples de requêtes où les réponses sont bonnes, ou décevantes. Il doit comprendre pourquoi tel document ressort lorsqu’on tape telle requête. « Ce sont des mathématiques appliquées : nous creusons dans les subtilités de l’algorithme, afin de découvrir quels documents sont surévalués ou sous-évalués par rapport à la requête, explique-t-il. Pour cela, on émet des hypothèses, on crée un modèle mathématique et on évalue la nouvelle version ainsi obtenue. C’est à la fois un travail d’ingénieur et de chercheur. »

L’avantage de travailler pour Google réside dans les moyens conséquents mis à disposition. « Nous avons accès à des outils de pointes en big data et machine learning et une puissance de calcul hors du commun. Ce sont des moyens exceptionnels pour travailler, s’enthousiasme Olivier Teboul. Scientifiquement aussi, la recherche est particulièrement stimulante, de par les problèmes ouverts à résoudre, la qualité des équipes de recherche et la quantité de données à disposition. »

Du moteur de recherche au moteur d’apprentissage des langues

Pourtant, l’idée de fonder sa propre entreprise fait son chemin. Il travaille trois mois dans une startup brésilienne pour prendre la mesure d’un tel changement, puis rentre en France pour créer Brother Tongue, une société d’apprentissage de langues étrangères par tchat écrit et oral. Un an plus tard, elle compte aujourd’hui 6 personnes. Partant du constat que pratiquer une langue est indispensable pour l’apprendre, Brother Tongue met en relation des professeurs et des élèves via un tchat. Son originalité et son succès viennent des outils scientifiques pour apprendre plus vite : « nous appliquons des techniques d’analyse de textes issues du big data pour donner des outils tant à l’apprenant qu’à l’enseignant, précise Olivier Teboul. Cela permet aussi de mieux suivre et analyser les progrès de l’élève. »

Travailler sur les données, « c’est un beau métier » assure-t-il.

Son conseil aux data scientists :

Avant tout, regarder les données dont on dispose, car un algorithme sorti du chapeau ne résout rien. « Il est indispensable de bien connaître ses données. Pour cela, il faut y passer du temps, comprendre le type et la nature des données, leur taux d’erreur, faire des hypothèses, regarder des exemples précis… afin de mettre en place un algorithme performant. L’intelligence artificielle a besoin de l’intelligence humaine. »

Cécile Michaut
Termes liés :
  • Données
  • Ordinateur
  • Algorithme
  • Big Data
  • Machine Learning
  • Intelligence artificielle
Share:
Posts you'd might like
L’apprentissage profond permet de lire dans notre cerveau… ce qu’il voit
Cette IA hybride apprend à jouer au sudoku…
et à concevoir des protéines
Canicules, orages violents : l’IA apprend à prévoir les épisodes météo extrêmes
Des réseaux de neurones “informés par la physique”, pour modéliser et simuler des systèmes complexes
Faut-il créer un GIEC de l’intelligence artificielle ?
Entretien avec Raja Chatila
ChatGPT a-t-il accouché d’une souris ?
Entretien avec Jean-Gabriel Ganascia
DAP, la newsletter du Data Analytics Post Recevez chaque semaine un éclairage sur les data science

Peut-on laisser un algorithme apprendre tout seul ?

A la différence de l’apprentissage supervisé, le contexte non supervisé est celui où l’algorithme doit opérer à partir d’exemples non annotés.

En savoir plus

ARTICLES RÉCENTS
  • L’apprentissage profond permet de lire dans notre cerveau… ce qu’il voit
  • Cette IA hybride apprend à jouer au sudoku…
    et à concevoir des protéines
  • Canicules, orages violents : l’IA apprend à prévoir les épisodes météo extrêmes
  • Des réseaux de neurones “informés par la physique”, pour modéliser et simuler des systèmes complexes
  • Faut-il créer un GIEC de l’intelligence artificielle ?
    Entretien avec Raja Chatila

Tout savoir sur…

Le DAP

Comité Éditorial

Partenaires

Équipe


Copyright © Data Analytics Post. Tous droits réservés.

Mentions légales & CGU