L’apprentissage auto-supervisé (en anglais “Self-Supervised Learning” ou SSL) est une modalité d’apprentissage automatique dans laquelle la supervision est réalisée à l’aide d’étiquettes qui ne sont pas d’origine humaine et fournies avec le jeu de données, mais créées automatiquement à partir des données d’apprentissage elles-mêmes. Il consiste typiquement à entraîner un modèle à prédire une partie cachée des données. Les modèles de langage apprennent par exemple à prédire le mot caché dans un texte ou le mot suivant un texte tronqué. De même, en vision artificielle, un modèle peut apprendre à reconstituer une région cachée d’une image ou, s’il s’agit de vidéo, à prédire l’image suivant une séquence.
+ Retour à l'index