
Olivier Teboul, de Google à l’enseignement des langues
⏱ 2 minAprès 5 ans passés chez Google au Brésil, Olivier Teboul a créé une startup d’apprentissage des langues par tchat. Le point commun de ces deux expériences : la mise à profit des données.
Après sa thèse en vision par ordinateur en 2011, Olivier Teboul, titulaire du master MVA de l’ENS Paris-Saclay, décide de tenter sa chance à l’étranger. Direction le Brésil, à Belo Horizonte, un pays en pleine croissance que le chercheur connaît déjà, et qu’il trouve très accueillant. Embauché par Google qui cherche à se développer dans différents pays, notamment en Amérique latine, pour recruter à l’échelle locale, il y travaille pendant 5 ans.
Il a pour mission d’améliorer le cœur du moteur de recherche du géant américain fondé treize ans plus tôt. Il s’intéresse plus particulièrement à « l’algorithme de ranking », autrement dit le classement des résultats des requêtes, une des clés de la pertinence des recherches. Il s’attache à observer et évaluer les résultats. Les équipes de Google lui fournissent des exemples de requêtes où les réponses sont bonnes, ou décevantes. Il doit comprendre pourquoi tel document ressort lorsqu’on tape telle requête. « Ce sont des mathématiques appliquées : nous creusons dans les subtilités de l’algorithme, afin de découvrir quels documents sont surévalués ou sous-évalués par rapport à la requête, explique-t-il. Pour cela, on émet des hypothèses, on crée un modèle mathématique et on évalue la nouvelle version ainsi obtenue. C’est à la fois un travail d’ingénieur et de chercheur. »
L’avantage de travailler pour Google réside dans les moyens conséquents mis à disposition. « Nous avons accès à des outils de pointes en big data et machine learning et une puissance de calcul hors du commun. Ce sont des moyens exceptionnels pour travailler, s’enthousiasme Olivier Teboul. Scientifiquement aussi, la recherche est particulièrement stimulante, de par les problèmes ouverts à résoudre, la qualité des équipes de recherche et la quantité de données à disposition. »
Du moteur de recherche au moteur d’apprentissage des langues
Pourtant, l’idée de fonder sa propre entreprise fait son chemin. Il travaille trois mois dans une startup brésilienne pour prendre la mesure d’un tel changement, puis rentre en France pour créer Brother Tongue, une société d’apprentissage de langues étrangères par tchat écrit et oral. Un an plus tard, elle compte aujourd’hui 6 personnes. Partant du constat que pratiquer une langue est indispensable pour l’apprendre, Brother Tongue met en relation des professeurs et des élèves via un tchat. Son originalité et son succès viennent des outils scientifiques pour apprendre plus vite : « nous appliquons des techniques d’analyse de textes issues du big data pour donner des outils tant à l’apprenant qu’à l’enseignant, précise Olivier Teboul. Cela permet aussi de mieux suivre et analyser les progrès de l’élève. »
Travailler sur les données, « c’est un beau métier » assure-t-il.
Son conseil aux data scientists :
Avant tout, regarder les données dont on dispose, car un algorithme sorti du chapeau ne résout rien. « Il est indispensable de bien connaître ses données. Pour cela, il faut y passer du temps, comprendre le type et la nature des données, leur taux d’erreur, faire des hypothèses, regarder des exemples précis… afin de mettre en place un algorithme performant. L’intelligence artificielle a besoin de l’intelligence humaine. »