Plutôt que d’expliquer à un ordinateur avec précision comment résoudre un problème, le Machine Learning (ou apprentissage automatique) permet de lui apprendre à apprendre à résoudre un problème par lui-même. Ce champ d’étude comporte des dizaines d’algorithmes.
On parle aussi de systèmes entrainables car ces algorithmes sont capables de faire émerger des règles mathématiques dans les données en s’entrainant sur la base d’exemples, puis d’appliquer ces règles à de nouvelles données en s’améliorant sans cesse avec l’expérience. Parmi les algorithmes les plus courants, on trouve les SVM (Support Vector Machine), le boosting, les random forests, les réseaux de neurones, les réseaux bayésiens, etc. Ils opèrent dans des contextes variés : supervisé, semi-supervisé ou non-supervisé, en mode séquentiel ou batch (par lot), par renforcement, etc. Ce sont des systèmes « entrée-sortie » avec une donnée en entrée (image, son, texte) et une en sortie (telle que la catégorie de l’objet dans l’image, le mot prononcé, le sujet dont parle le texte).
Toutes les tâches nécessitant d’entrer des données et de les classifier peuvent ainsi être automatisées : cela permet de doter des ordinateurs ou des machines de systèmes de perception de leur environnement comme la vision, la reconnaissance d’objets (visages, schémas, langages naturels, écriture, formes syntaxiques…), de la parole ; sur Internet, cela permet de filtrer des contenus indésirables (spam), d’ordonner des réponses à une recherche, de faire des recommandations ou de sélectionner les informations intéressantes pour chaque utilisateur (moteurs de recherche) ; de concevoir des systèmes d’aide aux diagnostics, médical notamment, des programmes de jeu, des interfaces cerveau-machine, des systèmes de détection de fraudes à la carte de crédit, d’analyse financière, de classification des séquences d’ADN, d’analyse prédictive en matière juridique et judiciaire…
+ Retour à l'index