Ce problème est l’un des plus étudiés en mathématiques, statistiques et machine learning grâce au challenge Netflix.
Pour améliorer son moteur de recommandation, la société Netflix met à contribution la communauté scientifique en organisant une compétition mettant en jeu un million de dollars. Les participants disposent de la matrice contenant les votes des clients (presque 500 000 utilisateurs et 17 000 films, mais seulement 1 % des valeurs renseignées), des données contextuelles sur les utilisateurs et sur les films et des informations temporelles sur ces données. Objectif : prédire pour chaque client, le vote final et améliorer les performances du moteur cinematch de Netflix de 10% (en termes d’erreur-type RMSE). Cela a permis de mettre en évidence tout l’intérêt de la complétion de matrices de faible rang. Le défi a été remporté, presque trois ans après son lancement, par l’équipe « BellKor’s Pragmatic Chaos ». Mais l’agrégat de modèles proposé s’est avéré beaucoup trop coûteux en temps et en énergie pour pouvoir être mis en production.