Exploiter des données de plus en plus personnelles
⏱ 4 minDans la panoplie des données désormais disponibles ou assez facilement accessibles, celles qui concernent le comportement humain, le corps ou les émotions sont de plus en plus convoitées. Elles sont au cœur de nombreuses recherches et développements tant dans le domaine de la santé que du recrutement ou du marketing. Pour le meilleur ou pour le pire…
En quelques années sont apparus de nombreux outils de mesure de nos performances, de notre état général ou de notre santé à l’instar de ces montres, bracelets ou vêtements connectés, ces trackers d’activité qui comptent le nombre de nos pas, évaluent notre activité physique quotidienne, mesurent notre fréquence cardiaque ou analysent notre sommeil. Ces wearables, nouveau prêt-à-porter électronique, ont inauguré l’ère du quantified self. Et bien qu’ils séduisent moins vite le public que les marchés ne l’escomptaient, ils sont au cœur d’une véritable révolution en matière de collecte et de valorisation de données : ces objets permettent de quantifier le comportement humain « sur le terrain » en milieu naturel, en temps réel et de façon continue. Fitbit, le leader du marché des bracelets connectés, a ainsi agrégé en quelques mois le plus grand ensemble de données sur le sommeil, sur des millions de personnes, ouvrant aussi leur accès.
Le corps comme entité biologique
« Au-delà des gadgets technologiques, toutes ces données, qui viennent en complément de données biologiques, génotypiques, psychologiques ou sociologiques, tout aussi peu coûteuses, ouvrent la voie à une nouvelle ère, affirme Pierre-Paul Vidal, neurophysiologiste, directeur de l’unité mixte de recherche Cognac-G (Université Paris-Descartes-CNRS-Ministère de la Défense) : une ère où le corps, en tant qu’ « entité biologique » est au cœur de nouveaux enjeux. L’un d’eux concerne notre « maintenance » personnalisée, pour vivre le plus longtemps possible en bonne santé. Cela promet une révolution dans les pratiques médicales (cf. prochaine newsletter). Autre enjeu : notre capacité à nous adapter à la complexité croissante des interfaces matérielles qui nous entourent (par exemple pour piloter un avion ou une centrale nucléaire) ainsi qu’à faire face à des situations tout aussi complexes comme peuvent les affronter un policier ou un médecin lors d’un attentat, un militaire sur le champ de bataille ou un athlète sur le terrain. Dans un autre registre, il va falloir aussi lutter contre les conséquences néfastes de notre sédentarité croissante et « contre nature ». » Au niveau collectif, le contrôle des bases de données sur la personne est un enjeu politique et économique majeur que les Etats-Unis et la Chine ont bien compris, tout comme certains constructeurs de capteurs qui ne donnent plus accès aux données brutes collectées, ce qui s’apparente à un véritable kidnapping.
Dans ce contexte, l’UMR Cognac-G mène des recherches fondamentales et translationelles dans le but de comprendre et quantifier le comportement normal et pathologique chez l’Homme et sur des modèles animaux. « Nous avons pu montrer que chaque individu est unique et très différent des autres, précise Pierre-Paul Vidal, au moins du point de vue du comportement sensoriel et moteur. Et ces caractéristiques sont très stables dans le temps. Ceci permet, par un suivi à long terme bien pensé, de détecter des dysfonctionnements à un stade très précoce pour assurer une prévention efficace et éviter des problèmes médicaux majeurs et souvent difficilement réversibles comme le surentrainement des athlètes, le syndrome post traumatique des militaires, le surmenage des salariés, la fragilité des séniors, etc. »
Le comportement comme variable
L’analyse des expressions faciales (par facial coding), de la prosodie (inflexion, intonation, modulation, rythme de la voix), des mouvements oculaires (eye tracking), de la fréquence cardiaque, de la conductance cutanée… ont ouvert aussi des perspectives quant à la caractérisation de nos émotions. Nous verrons que l’analyse de ces données intéresse de nombreux domaines comme la santé, mais aussi le recrutement ou le neuromarketing (cf les 2 articles à suivre). En soi, ce type d’analyse n’est pas nouveau : « Nous travaillons sur le sujet depuis 15 ans, en ce qui nous concerne du point de vue du traitement du signal, explique Renaud Séguier, enseignant chercheur de CentraleSupélec à Rennes, responsable de l’équipe FAST (Facial Analysis, Synthesis & Tracking). Nous développons des solutions pour capter « l’espace expressif » des personnes dans le cadre de nombreuses recherches fondamentales ou appliquées qui se sont concrétisées par plusieurs startups. » Le succès de telles recherches repose sur un dialogue fructueux entre des équipes pluriculturelles comme des experts en neurosciences, en traitement du signal, en algorithmique, des ingénieurs, etc.
Quelques exemples des travaux de l’équipe FAST avec Cognac-G : la surveillance des visages de malades en réanimation pour détecter les signes précurseurs de leur réveil et éviter qu’ils ne se désintubent ou encore le traitement des praxies faciales, ces paralysies d’une partie du visage qui touchent un certain nombre d’enfants et leur pose des problèmes d’articulation. « Nous avons testé notre système de casque avec caméra embarquée pour la rééducation de cette pathologie, raconte Renaud Séguier. L’orthophoniste montre le bon mouvement ; l’enfant en cherchant à le reproduire anime le visage d’un avatar sur un écran. Voir cet avatar tenter d’articuler plutôt que sa propre image est bien plus efficace et ludique. Il n’y a malheureusement pas eu de suite à ces recherches faute de transfert technologique. »
La surveillance prédictive comme perspective
Ces données humaines sont-elles spécifiques, mathématiquement parlant ? « Dans la majorité des applications, que ce soit dans l’industrie, dans la finance ou la santé, les données collectées (on parle de données brutes) sont successivement nettoyées, prétraitées puis agrégées pour calculer ce qu’on appelle des indicateurs de haut-niveau (features), rappelle Mathilde Mougeot, professeur à l’ENSIIE (École Nationale Supérieure d’Informatique pour l’Industrie et l’Entreprise). C’est en comparant la valeur de ces indicateurs à un modèle statistique ou de machine learning préalablement calibré sur un historique de données que l’on peut diagnostiquer un comportement considéré comme usuel ou pas. La découverte et la mise en place de ces features est donc un élément essentiel pour la pertinence et la robustesse de l’application modélisée. Par opposition aux machines industrielles qui fonctionnent toutes de la même façon, dans des contextes maitrisés, l’empreinte motrice et comportementale d’un individu est unique. La variabilité du comportement humain rend ainsi sa modélisation et sa surveillance prédictive plus complexe que celle d’une machine. » Nos machines biologiques ne sont pas encore à l’image de robots ! En attendant, on l’aura compris, toutes ces données sont des pépites, à ne pas mettre dans les mains de n’importe qui au risque d’entrainer des dérives comme ces assureurs aux Etats-Unis, qui consentent des rabais à leurs clients équipés de bracelets connectés ou les créateurs de jeux vidéo qui cherchent à les rendre addictifs. Gageons que notre éducation en tant qu’utilisateur et les contre-pouvoirs qui se mettent en place limiteront les risques.