logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
logo fullscreen logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
Menu
mobile logo
  • Dossier
    • IA quantique
    • Réseaux de neurones enzymatiques
    • Le méta-apprentissage fait ses premiers pas…
    • Les avancées prometteuses de l’apprentissage auto-supervisé
    • Que peut l’intelligence artificielle contre les fake news ?
    • Quand l’IA nous regarde…
    • Les réseaux de neurones impulsionnels
    • Quantification de la fragilité
    • Covid-19 et data
    • Ville algorithmique
    • Perception des véhicules autonomes
    • Formation continue
    • Data gouvernance
    • À la recherche des sens perdus
    • Deepfake
    • Agriculture numérique
    • Legal Tech
    • Données de santé
    • Start-up IA
    • Learning Analytics
    • Métiers de la data
    • Recherche IA : public/privé
    • Cybersécurité
    • Emplois dans la Data
    • Innovation et Data
    • Open source
    • Green IA
    • Sciences humaines et sociales et data
    • Voiture autonome
    • IA et création artistique
    • Des algos de confiance
    • Data cities
    • L’homme sur mesure
    • Débats autour des datas
    • Data science & robots
    • Usine 4.0
    • Données personnelles
    • Valorisations des données
    • Formation
  • Innovation
  • Expertise
  • Portrait
  • Point de vue
  • Lexique
  • + loin
    • Timeline
    • Repository
  • Emploi
    • Fiches métiers
  • S’abonner
    • NEWSLETTERS DÉJÀ PARUES
18 septembre 2017
A la Une, DAP, Données personnelles, Dossiers thématiques, News

Dossier Données personnelles : qui a accès à quoi ? #chercheurs

⏱ 3 min
Entreprises, chercheurs, État… De nombreux acteurs récupèrent et utilisent nos données personnelles. Mais quelles sont les règles en la matière ? Le citoyen-consommateur peut-il garder la main sur ses propres données ?

CHERCHEURS : FACILITER L’ACCÈS POUR BOOSTER LA SCIENCE

Grâce à des avancées législatives et technologiques, l’accès des scientifiques aux données que l’État collecte sur les citoyens commence à se déverrouiller. À la clef : la promesse d’une recherche plus performante. Décryptage.

Revenus et patrimoine, état et dépenses de santé, parcours scolaire et professionnel, indemnités chômage, taxe d’habitation, allocations familiales… Les services de l’État possèdent une foule d’informations très précises sur chaque citoyen. Une véritable mine d’or lorgnée par les chercheurs pour booster leurs études dans de nombreux domaines : épidémiologie,  sociologie, économie, santé publique, etc.

« Mais pour garantir la confidentialité et le respect des libertés individuelles, cette mine d’or est protégée par des dispositifs de loi rendant l’accès à ces données extrêmement restrictif », estime Kamel Gadouche, qui dirige le Centre d’accès sécurisé aux données (CASD). Les chercheurs doivent notamment soumettre un dossier au comité du secret statistique pour obtenir une autorisation de l’administration des archives, et réaliser des démarches préalables auprès de la Commission nationale de l’informatique et des libertés (CNIL). Au total, obtenir une telle autorisation peut prendre jusqu’à un an !

Des avancées significatives

Toutefois, les choses commencent à bouger. Venant tout juste d’entrer en vigueur, la Loi pour une République Numérique élargit par exemple l’accès aux données très détaillées à potentiellement toutes les sources de données de l’administration. Concrètement, ce sont des données dont on n’a retiré aucun détail, hormis le nom, le prénom et l’adresse exacte remplacée par une indication géographique assez précise.

« Ce nouveau texte offre aussi aux chercheurs de nouvelles possibilités de croisement de données, à partir d’un identifiant unique et fiable : le numéro de sécurité sociale », ajoute Kamel Gadouche.

En 2016, la Loi de modernisation du système santé a aussi ouvert aux chercheurs l’accès au Système national des données de santé (SNDS) à des fins de recherche, d’étude ou d’évaluation d’intérêt public. Issu de la base de données de la Caisse Nationale d’Assurance Maladie (CNAM), l’une des plus grandes au monde en santé, ce SNDS regroupe les données anonymisées issues de 1,2 milliard de feuilles de soins, de 500 millions d’actes médicaux et de 11 millions d’hospitalisations annuelles !

L’anonymisation freine les recherches

Mais avant de pouvoir en profiter, ces données doivent être anonymisées. Or, cela s’avère problématique pour les chercheurs. Car anonymiser ce n’est pas juste enlever le nom de la personne, mais toutes les données qui, croisées entre elles, pourraient permettre de l’identifier. « À l’ère du numérique, la donnée personnelle a changé de nature : des informations non directement identifiantes peuvent le devenir si on les agrège à d’autres, confirme Francesca Musiani, chercheuse à l’Institut des Sciences de la Communication du CNRS. D‘où l’importance de considérer le contexte d’accès et non pas seulement la donnée en elle-même. »

Et ce ne sont pas là que des suppositions… Un exemple ? Juste en croisant diverses sources de données publiques, des chercheurs sont déjà parvenus à retrouver l’identité de donneurs anonymes de prélèvements génétiques. La mise en évidence de cette faille avait même fait l’objet d’une publication dans la revue Science1. « Le problème c’est qu’en anonymisant trop les données, on gomme beaucoup d’informations, précise toutefois Emmanuel Bacry qui coordonne l’Initiative « Data Science » à  l’École Polytechnique. Or c’est précisément en ouvrant les données dans leur granularité la plus fine qu’on peut obtenir les meilleurs résultats. » Pas facile donc de trouver le bon équilibre entre recherche de qualité et protection de la vie privée…

Accès sécurisé

Autre danger du traitement de données personnelles par des chercheurs : le risque de piratage. Voilà pourquoi certains scientifiques souhaitant travailler sur des données sensibles ont des locaux dédiés au sein même de l’administration. C’est d’ailleurs le cas de l’équipe d’Emmanuel Bacry qui possède ses propres bureaux à la CNAM.

Mais tous les chercheurs n’ont pas cette possibilité… Heureusement pour eux, les technologies progressent.

« Aujourd’hui, plus de 1500 chercheurs et datascientists en Europe utilisent le Centre d’accès sécurisé aux données (CASD) pour traiter des données individuelles très détaillées de l’administration directement ou indirectement identifiantes« , indique Kamel Gadouche.

Le concept ? Ces données restent confinées dans des locaux techniques du CASD baptisés « la bulle »; pour y pénétrer à distance et accéder à des outils pour les traiter, tout chercheur  doit utiliser un boîtier d’authentification par empreintes digitales nommé « SD-Box ».  Résultat : ce système de bulle sécurisée hermétique crée une isolation totale du boiter qui fonctionne donc en circuit fermé, sans aucun contact avec l’extérieur. Des procédures qui peuvent paraitre contraignantes, mais c’est sans doute le prix à payer pour garantir le respect de notre vie privée.

 

Jean-Philippe BRALY
Notes

1 M. Gymrek et al., Science, 339, 321, 2013

 

Retrouvez la suite dossier sur les Données personnelles :
Citoyens : la voie du « self data »

Termes liés :
  • Données
  • Data science
Share:
Posts you'd might like
Parkinson : l’IA améliore le diagnostic
L’IA au chevet des séismes et tsunamis
François Yvon :
la traduction automatique pour passion
En attendant l’ordinateur quantique universel…
L’IA teste ses premiers algorithmes quantiques
Les promesses de l’IA quantique
DAP, la newsletter du Data Analytics Post Recevez chaque semaine un éclairage sur les data science

Peut-on laisser un algorithme apprendre tout seul ?

A la différence de l’apprentissage supervisé, le contexte non supervisé est celui où l’algorithme doit opérer à partir d’exemples non annotés.

En savoir plus

ARTICLES RÉCENTS
  • Parkinson : l’IA améliore le diagnostic
  • L’IA au chevet des séismes et tsunamis
  • François Yvon :
    la traduction automatique pour passion
  • En attendant l’ordinateur quantique universel…
  • L’IA teste ses premiers algorithmes quantiques

Tout savoir sur…

Le DAP

Comité Éditorial

Partenaires

Équipe


Copyright © Data Analytics Post. Tous droits réservés.

Mentions légales & CGU