Réagir plus vite face aux catastrophes naturelles grâce à l’analyse automatique de tweets
⏱ 5 minDes chercheurs du BRGM et de l’université de technologie de Troyes (Aube) (UTT) ont conçu une plateforme de suivi en temps réel des catastrophes naturelles basée sur les tweets francophones. Adaptée pour l’instant aux séismes, et dans une moindre mesure aux inondations, elle pourrait être étendue aux tempêtes ou aux cyclones.
À 11 h 52, ce 11 novembre 2019, la terre tremble à proximité de la commune du Teil (proche de Montélimar, dans la Drôme). De magnitude 5,2, le séisme – le plus puissant survenu en métropole depuis 1996 – est ressenti dans un rayon de plus de 200 km, jusqu’à Marseille (Bouches-du-Rhône) et Narbonne (Aude) au sud, Bourg-en-Bresse (Ain) au nord. Un événement inédit, qu’il est devenu normal de partager immédiatement via les réseaux sociaux (fig 1). Facebook, Twitter, Instagram, WhatsApp sont ainsi devenus la règle pour alerter ses proches.
Pourquoi ne pas tirer parti de ces nombreux témoignages sur le vif comme source d’information pour renseigner les services de secours et de sécurité sur la localisation, l’intensité des événements et l’étendue des dégâts. Depuis plusieurs années, des plateformes de surveillance et d’analyse des réseaux sociaux sont testées ici et là pour aider les gestionnaires de crise à appréhender les catastrophes naturelles, de manière spécifique, comme PetaBencana.id pour les inondations à Jakarta, ou générique comme AIDR, ou E2mC. En complément des capteurs sur le terrain, susceptibles d’enregistrer certains de ces phénomènes, les messages échangés sur les réseaux sociaux sont une nouvelle source de données intéressante à analyser pour détecter ces phénomènes à cinétique rapide.
Accélérer la remontée d’informations de terrain
« Les utilisateurs de Twitter sont de véritables capteurs humains, particulièrement réactifs (voir fig 2), résume Samuel Auclair, ingénieur en sismologie appliquée au Bureau de recherches géologiques et minières (BRGM), responsable du projet Suricate-nat, plateforme de suivi en temps-réel des catastrophes naturelles développée avec l’université de technologie de Troyes (UTT) et soutenu par la fondation MAIF. Notre plateforme a détecté le séisme du Teil à 11 h 54, moins de 2 minutes après l’événement. Elle a collecté automatiquement 6 427 tweets, dont plus d’un quart émanait de témoins directs. Elle a rapidement permis d’obtenir une représentation assez précise de l’étendue de la zone de perception des secousses. »
Les services de secours français utilisent déjà les réseaux sociaux, mais « à la main » avec une équipe de soutien chargée « d’écouter » et de traiter les données de Twitter notamment. Compte tenu de la masse de données, un outil de veille et de traitement automatisé serait évidemment plus efficace. « Concrètement, Suricate-nat surveille 24 heures sur 24 les tweets francophones, et suit quasi en temps réel une liste de mots clés liés aux séismes et aux inondations via l’API publique de Twitter (gratuite) qui nous permet d’automatiser ces tâches de veille et d’analyse », précise Faïza Boulahya, responsable de la partie data science de la plateforme.
Ainsi, pour détecter un événement, et notamment s’affranchir des tweets envoyés depuis des automates, l’analyse est filtrée (comme pour tout capteur). Elle est couplée aux pics d’activité de Twitter (nombre de tweets par minute). « Ceux-ci sont très marqués lors de catastrophes naturelles à cinétique rapide, reprend-elle, ce qui permet de caler nos modèles de détection de séisme, seule catastrophe investiguée pour l’instant – trop de tweets concernant les inondations étant des commentaires et informations de seconde main difficilement exploitables. Nous utilisons par la suite des méthodes de traitement automatique du langage francophone pour pré-traiter les messages avant de les soumettre individuellement à des algorithmes de classification (random forest, régression logistique ou SVM en fonction des cas) pour déterminer une première série d’informations : si la personne est victime, témoin. »
Une part importante du travail, qui reste à approfondir, concerne la cartographie des zones de ressenti. « Nous parvenons à géolocaliser les tweets à l’échelle de la commune, ce qui est suffisant pour les séismes, explique la data scientist, en extrayant les noms de lieux dans les messages, car moins de 3 % des tweets sont nativement géolocalisés – cette information sera bientôt floutée par Twitter. » Quant à l’étendue de la zone de ressenti, elle se dessine en quelques minutes, bien avant que les autorités n’en soient conscientes via une « cartographie de chaleur », autrement dit, la carte de concentrations de tweets (voir fig 4, au milieu). « Pour fournir une cartographie de l’intensité du séisme et de ses impacts, cette information devra être pondérée selon la population présente et nos données devront être fusionnées avec celles des capteurs physiques », précise Samuel Auclair.
Intégrer les citoyens au-delà de Twitter
Pour l’instant, 12 000 tweets provenant de 30 séismes ont été labellisés à la main. Une base sans cesse enrichie, par exemple par les données récentes du séisme du 11 novembre 2019. « Elle est également enrichie par les utilisateurs de notre site internet éponyme. Car outre le traitement automatique des tweets, notre projet comporte un volet participatif, explique Samuel Auclair. Ce site web, destiné au grand public, permet de restituer aux citoyens l’information que l’on déduit de leurs messages (voir fig 4), mais aussi d’enrichir les informations recueillies en demandant aux témoins des précisions quant au lieu de l’événement, aux dégâts éventuels, des images, etc. après s’être assuré de leur mise en sécurité. »
Autre point important : le site web contribue à l’analyse manuelle des tweets pour contribuer à la classification en confirmant les informations que les algorithmes détectent pour les améliorer (fig 5). C’est même une condition pour assurer la pérennité de la solution.
« Nous avons démontré les bénéfices liés à l’utilisation de ce nouveau capteur humain, conclut Samuel Auclair. Reste à définir comment automatiser en temps réel des procédures de secours basées sur ces informations. C’est l’objet des prochains travaux. » Par ailleurs, d’autres risques naturels, tels que les tempêtes et les cyclones, pourraient être pris en compte.
Pour en savoir plus :
Article dans The Conversation : https://theconversation.com/je-tremble-donc-je-tweete-quand-les-citoyens-aident-a-mesurer-les-catastrophes-naturelles-127048
Isabelle Bellin