Les algorithmes de bandit constituent une classe de stratégies utilisées en apprentissage automatique. Leur histoire a commencé il y a près d’un siècle, mais ils n’ont pas dit leur dernier mot. Au générique de l’intelligence artificielle, on découvre parfois d’étranges