Sécurité publique : que dire de la police prédictive ?
⏱ 7 minLes logiciels de police prédictive sont de plus en plus utilisés, surtout aux États-Unis. Au-delà des discours marketing, notamment autour du plus connu, Predpol, que peut-on en attendre ? Changent-ils les pratiques de la police ? Quelles sont les solutions expérimentées en France ?
Predpol, Hunchlab, Key crime, Palantir, Beware, Paved… les logiciels de police prédictive, apparus depuis les années 2000, sont devenus un véritable marché. À la hauteur de l’attention portée sur les enjeux de sécurité dans la société. Tout d’abord, derrière le terme de police prédictive se cachent des solutions très diverses : certains outils, comme Beware ou Palantir, visent des personnes, alors que la plupart des logiciels ciblent les lieux et moments supposés des futures infractions (vols et cambriolages) : ils fournissent des cartographies des zones à risques ou « points chauds » de délinquance (on parle de cartes de chaleur, traduction de heat maps).
Avant de s’intéresser aux effets de ces outils sur ces types d’infractions et sur les pratiques policières, notons que ces logiciels ne sont pas tous forcément adaptés au contexte français. En particulier, notre cadre juridique de protection des données personnelles interdit le ciblage de personnes. Par ailleurs, la France privilégie une politique de prévention au moyen de patrouilles (le flagrant délit doit être constaté pour appréhender quelqu’un) alors que la police américaine tente de dissuader les délinquants en multipliant les contrôles et fouilles dans la rue.
Où en est-on ?
À quel point les logiciels de police prédictive participent-ils à la safe city ? Predpol, commercialisé depuis 2012 par une société américaine éponyme, est devenu une des références en la matière. Cet outil prédit en temps réel le lieu et le moment où des vols ont le plus de risques de survenir. Une soixantaine de départements de police aux États-Unis se sont équipés. Plusieurs l’ont déjà abandonné, tout comme le comté du Kent, au Royaume-Uni, en 2018, après avoir été le premier à l’utiliser en Europe, dès 2013. Pourtant, Predpol affirme que son logiciel, fruit des recherches en prédiction de crime de George Mohler, chercheur en mathématiques appliquées, est plus efficace que les modèles paramétriques (1), et deux fois plus précis que les analystes spécialisés. Selon la start-up, utiliser leur logiciel équivaudrait à accroître de 20 % le personnel de patrouille à moindre coût.
Beaucoup de chercheurs contestent ces affirmations, à commencer par David Marsan, sismologue à l’université de Savoie, à Chambéry, à l’origine de l’algorithme dont s’est inspiré Predpol. Quel rapport avec la sismologie ? Predpol compare la prédiction des crimes à celle d’une contagion épidémique ou des secousses secondaires de séismes : « L’idée est qu’il y aurait une dimension de contagion dans la diffusion des infractions dans l’espace et le temps, indique Bilel Benbouzid, sociologue, maître de conférences à l’université Paris-Est-Marne-la-vallée. Selon les théories de criminologie des années 1980-90, les infractions, bien que rares, se propagent de proche en proche ; elles sont concentrées sur une petite partie de la population sur laquelle elles se répètent. »
Les cambriolages prédisent les cambriolages
À partir de trois types de données anonymisées (lieu, temps, infraction) sur dix ans, les paramètres du modèle de Predpol sont estimés par un algorithme EM (expectation-maximization), expliquent Céline Castets-Renard et ses collègues dans un récent rapport sur la police prédictive (2). Leur serveur fournit en temps réel des prévisions ou probabilités d’occurrence par type de délit dans des cellules géographiques de 200 x 200 mètres, en mode SaaS (Software as a Service). « Cela revient à révéler des régularités avec des méthodes de clustering à partir de données spatio-temporelles, précise Bilel Benbouzid. Predpol utilise le modèle de physique statistique de David Marsan, en additionnant de la concentration et de la contagion. Même si nous n’avons pas accès au code, il est assez simple et transparent. Innovant car non paramétrique, il a aussi l’intérêt d’utiliser peu d’apprentissage, ce qui permet de comprendre la modélisation du phénomène. »
« À ma demande, David Marsan a accepté de tester son algorithme de prédiction des répétitions de tremblements de Terre sur les données de Predpol de Chicago, en accès libre, raconte Bilel Benbouzid. Ses résultats mettent en doute la pertinence de l’usage de son algorithme dans ce contexte (3 et 4) : Predpol ne fait pas mieux que les classiques cartes de point chauds. La contribution de l’aspect contagion ne compte que pour 1,7 % pour le meilleur modèle. Par ailleurs, le travail effectué par la Police limite aussi probablement le phénomène de contagion, donc la pertinence de la comparaison. »
Les rares travaux publiés d’évaluation de l’approche de Predpol ne concernent pas la qualité de prévision et laissent supposer une efficacité modeste, renchérissent les auteurs de ce même rapport (2). Sans surprise, compte tenu des données d’apprentissage de l’outil, la prédiction des crimes a lieu majoritairement… dans les zones historiquement les plus criminogènes des villes, n’apprenant rien aux policiers expérimentés, concluent-ils.
Dès lors, pourquoi un tel succès ? L’entreprise a su orchestrer parfaitement son plan marketing, comme le détaille Bilel Benbouzid (3) : elle fonde ses résultats sur un mythe, relayé par la presse, celui d’apporter une nouvelle solution à l’analyse criminelle grâce à la sismologie. S’ajoute à cela une promotion douteuse basée sur des données peu fiables dénoncée entre autres par le groupe pour la protection des droits civiques de la ville d’Oakland, dans une lettre ouverte, en 2015.
Predpol, meilleur contre-exemple
Predpol n’a donc pas révolutionné la criminologie. « La start-up a réussi à s’implanter dans la police en proposant un outil simple d’utilisation, une application sous la forme d’un tableau de bord avec une carte, téléchargeable sur un téléphone ou une tablette, au lieu des modèles qui tournaient jusque-là sur l’intranet de la police, résume Bilel Benbouzid. Leur outil est avant tout une aide à la gestion des forces de police. » Il apporte également de nouvelles métriques. Ainsi, Predpol a découvert que l’effet dissuasif était efficace dès que les policiers patrouillaient plus de 5 % de leur temps dans les points chauds. Leur tableau de bord illustre cette information. Les voitures de police sont équipées d’un système de suivi GPS. Et les points chauds identifiés par le logiciel passent du rouge au vert lorsque les 5% sont atteints. Autre mesure fournie : la quantification des faux positifs, autrement dit des personnes innocentes contrôlées.
« Ainsi, Predpol permet d’explorer des hypothèses, poursuit Bilel Benbouzid. La sécurité devient une quantité et l’algorithme est envisagé comme un « dosomètre » qui permet de mesurer par exemple la bonne quantité de patrouilles pour prévenir les vols sur un secteur donné selon un calcul de rationalisation économique de l’activité policière basé sur le classique retour sur investissement. » La police devient une entreprise visant la rentabilité et la productivité de ses policiers, dont le travail peut être contrôlé par cet outil, par exemple avec Compstat, un logiciel d’évaluation du travail des policiers mis au point par le préfet de police de New York (testé à Paris dans les années 2000). D’autres start-up ont choisi d’autres métriques. Une partie de la dynamique de l’innovation policière obéit désormais à ces principes commerciaux, au risque d’aboutir à une inversion de la hiérarchie homme-machine.
Qu’en est-il en France ?
Les premières expérimentations datent de 2015, dans l’Oise, et concernent le vol de véhicules. Elles ont montré que de classiques algorithmes de machine learning (régression logistique, forêts aléatoires, boosting, XGBoost) suffisaient pour obtenir les mêmes résultats que Predpol. L’outil développé à l’époque, baptisé Predvol, est néanmoins critiqué aujourd’hui (5). En parallèle, depuis 2013, la Gendarmerie nationale investit ce champ et développe d’autres outils propriétaires comme Paved, au sein d’un service dédié.
Paved est un outil de prévention des cambriolages et dégradations de véhicules dans les jours à venir (ceux-ci représentent un tiers de la délinquance en zone gendarmerie, avec un taux de déclaration assez élevé). Paved se nourrit des données historiques déclarées et fournit des cartes de chaleur au niveau national. Selon le colonel Laurent Collorig, qui coordonne le développement de l’outil, Paved a pour but de permettre aux responsables opérationnels de mieux organiser au quotidien leurs zones de patrouille, sans contraintes. Sur les 11 départements où l’outil a été testé en 2018, en moyenne, 83 % des cambriolages auraient été prédits à une distance moyenne de 2,24 km ; 3,15 km pour les atteintes liées aux véhicules. Il y aurait une correspondance quasi exacte entre les projections d’infractions et les zones et périodes d’infractions réelles.
Néanmoins, l’efficacité, là encore, est discutable, comme l’analyse la revue L’écho du képi. Ces versions numériques des cartes criblées de punaises des gendarmeries ne devraient donc pas révolutionner les pratiques. Pourtant, on constate une attente importante en matière d’outils numériques au sein des services de police et gendarmerie dans un souci d’efficacité et de gain de temps (2 et 5). « Or, pour l’instant, ces outils mettent une couche de complexité sur des problèmes assez simples », résume Bilel Benbouzid. Et ils ont plusieurs biais, comme celui de reporter la délinquance un peu plus loin. Ils risquent aussi de creuser les inégalités en délaissant un peu plus ceux qui ne portent pas plainte, dont les données ne sont donc pas prises en compte. Ce dont se défend Predpol, soulignant que ces biais sont ceux de la société elle-même. Par ailleurs, le choix du type d’infractions visées n’est pas neutre, et oriente vers un type de criminalité et de population. Qu’en serait-il si on visait la criminalité financière ?
Finalement, les outils de police prédictive doivent-ils se développer eu fonction des données disponibles ou en fonction de stratégies policières ? Au-delà d’instruments de gestion, ces logiciels doivent être au service du public, et leur utilisation mérite d’être soumise au débat. « Il faut y intégrer nos propres manières de comprendre le crime, les signaux de désorganisation, l’efficacité collective dans les quartiers, et construire nos propres outils, qui ne supplantent pas l’action humaine », conclut Bilel Benbouzid.
(1) George Mohler, « Marked Point Process Hotspot Maps for Homicide and Gun Crime Prediction in Chicago », International Journal of Forecasting, 30(3), 491–497, 2014 https://www.researchgate.net/publication/261564053_Marked_Point_Process_Hotspot_Maps_for_Homicide_and_Gun_Crime_Prediction_in_Chicago
(2) Céline Castets-Renard, Philippe Besse, Jean-Michel Loubes et Laurent Perrussel, « Encadrement des risques techniques et juridiques des activités de police prédictive (Technical and Legal Risk Management of Predictive Policing Activities) » (12 juillet 2019). Rapport 2019, CHEMI, ministère de l’Intérieur. https://ssrn.com/abstract=3418855
(3) Bilel Benbouzid, « À qui profite le crime ? Le marché de la prédiction du crime aux États-Unis », La Vie des idées ,13 septembre 2016. ISSN : 2105-3030. URL : http://www.laviedesidees.fr/A-qui-profite-le-crime.html
(4) Gouverner la ville numérique, coordonné par Antoine Courmont et Patrick Le Galès, Puf, Laviedesidees.fr, 28 août 2019.
(5) La police prédictive : Enjeux soulevés par l’usage des algorithmes prédictifs en matière de sécurité publique, Institut d’Aménagement et d’Urbanisme, Île-de-France, avril 2019.
Illustration à la une : Cette carte de chaleur de Predpol indique aux forces de police les zones à surveiller. © Predpol
Isabelle Bellin