Des données sensibles à mieux protéger
⏱ 4 minLa collecte des données d’apprentissage fait courir le risque que ces informations soient réutilisées de façon détournée à l’insu des élèves et des étudiants, à des fins commerciales notamment. Certains militent pour que ces données sensibles soient aussi bien encadrées et protégées que les données médicales.
Imaginez que vous passiez un entretien d’embauche et que l’on vous dise : « On sait que vous avez eu des difficultés en français au CE2 et que vous avez eu des mauvaises notes en maths en terminale ». Cette anecdote semble caricaturale, et pourtant elle n’est peut-être pas si éloignée que ça de la réalité. En effet, si l’analyse des données numériques des élèves et des étudiants offre d’alléchantes perspectives d’amélioration des enseignements, de meilleur accompagnement des élèves et de personnalisation de l’apprentissage (voir les articles précédents du dossier Learning Analytics), elle fait aussi courir le risque de voir ces informations utilisées de façon détournée et de porter ainsi atteinte à la vie privée des personnes. Cela va du recruteur qui ciblerait les profils des candidats dans cette manne d’informations à l’assureur qui pourrait y déceler des profils à risque pour augmenter leurs tarifs.
La réutilisation des données pédagogiques pourrait ainsi conduire à de nouvelles formes de discrimination. « Il est faux de penser que des données quantitatives peuvent restituer une personne dans sa globalité. Un seul exemple : on sait bien que la façon de noter peut fortement varier d’un enseignant à l’autre. À elle seule, une note ne révèle donc ni le niveau ni les qualités d’un élève », avance Pierre Saurel, maître de conférence en intelligence artificielle à l’École supérieure du professorat et de l’éducation de l’académie de Paris. Pour cet enseignant, il est indispensable que les élèves – ou leurs parents s’ils sont trop jeunes – et les étudiants gardent à tout moment la main sur leurs données, et soient en mesure de choisir de les confier ou non à un acteur en dehors du système éducatif et pour quels usages. Cela vaut aussi bien pour un recrutement que dans le contexte où une entreprise de l’EdTech fournit un outil d’apprentissage numérique à un enseignant.
Des données à anonymiser
Gilles Dowek, président du conseil scientifique de la Société informatique de France et professeur en informatique à l’ENS Paris-Saclay, se montre plus prudent encore sur la réutilisation de ces données. « Les données pédagogiques sont bien plus sensibles que les données médicales, car elles concernent des enfants, qui construisent leur personnalité, et il serait grave de leur assigner des mauvais résultats ou une mauvaise conduite qui les suivront le reste de leurs vies. Pour cette raison, il est impératif que ces données restent confidentielles et qu’elles ne puissent pas être communiquées vers l’extérieur ».
Mais comment faire en sorte que les données n’échappent pas aux élèves et à leurs enseignants ? Outre leur sécurisation, il faudra qu’elles soient anonymisées. Pour cela, il ne suffira pas de supprimer le nom de famille des élèves, il faudra modifier aussi d’autres informations qui permettraient de remonter à l’identité des personnes. « Tout le jeu consiste à flouter les données, suffisamment pour rendre les utilisateurs anonymes, mais pas trop pour que ces données soient utiles aux chercheurs pour étudier les processus d’apprentissage, et aux plateformes numériques pour améliorer les enseignements », souligne Gilles Dowek.
L’anonymisation n’empêchera pas d’exploiter ces données pour en tirer des informations à l’échelle d’une population d’étudiants. En revanche, pour personnaliser l’apprentissage d’un élève en particulier, il est indispensable de pouvoir l’identifier pour lui proposer les exercices et les leçons les mieux adaptés. Dans ce cas, il faudra être particulièrement vigilant à la protection des données le concernant.
Au-delà des aspects techniques, les mentalités aussi devront changer. « Il faut sensibiliser les enseignants, et le monde éducatif dans son ensemble, à l’importance des données qu’ils détiennent. Aujourd’hui, on y réfléchit pas encore assez, ce qui fait courir le risque que certains divulguent, sans même s’en rendre compte, des informations sur les élèves qui auraient dû rester confidentielles », note Gilles Dowek.
Une prise de conscience récente
Heureusement, les choses commencent à changer. S’il y a cinq ans seulement, le ministère de l’Éducation nationale n’était pas trop regardant sur la manière dont les enseignants pouvaient stocker les données des élèves, il s’est doté récemment d’un comité d’éthique pour réfléchir à la question de la protection des données, et d’une charte du numérique. Dans cette charte figurent notamment l’interdiction d’utiliser les données à des fins commerciales et l’obligation de les héberger sur un serveur situé en France ou en Europe.
Déjà, certaines plateformes numériques font figure de modèle à suivre. C’est le cas de la plateforme publique de MOOC France université numérique (FUN). Outre le fait que les données collectées par FUN sont hébergées sur un serveur public français, la plateforme s’engage à utiliser ces informations exclusivement dans le cadre de services offerts sur le site, à ne pas les diffuser à des tiers et à ne pas les commercialiser. Une disposition qui tranche avec les pratiques d’autres plateformes de cours en ligne, tel le site américain de MOOC Coursera, qui a envisagé un moment de revendre les données de ses utilisateurs à des recruteurs.
Autre avancée importante pour les élèves et les étudiants : l’entrée en vigueur en mai dernier du règlement européen sur la protection des données personnelles (lire le dossier sur les données personnelles). Ce nouveau règlement, qui concerne toutes les entreprises, organismes publics et associations collectant des données à caractère personnel, renforce le droit des utilisateurs – et donc des apprenants – sur l’utilisation de leurs données. Désormais, les organisations devront fournir une information claire et explicite aux individus sur l’utilisation de leurs données, et ce, usage par usage. Et demander pour chacun de ces usages l’autorisation des personnes.
Toutes ces mesures sont-elles suffisantes ? « On n’en fait jamais assez pour protéger les données pédagogiques, estime Gilles Dowek. Même si des progrès ont été réalisés ces dernières années, le prochain enjeu sera de faire inscrire le côté sensible de ces données dans la loi française, comme les données médicales, et qu’elles puissent ainsi être encadrées et protégées de la même manière ». Pour que les résultats scolaires des enfants ne les poursuivent pas tout au long de leur vie.
Julien Bourdet