Innovation en action : Quand la data science coule au robinet
⏱ 3 minLocalisation plus rapide des fuites, meilleure détection des pollutions, facturation au plus juste… Autant de progrès attendus de la science des données appliquée aux réseaux d’eau potable.
Le secteur de l’eau potable génère un flot incessant de données. Sur les réseaux tout d’abord, on assiste à la multiplication de capteurs de données sur la qualité de l’eau : nombre de bactéries, concentration de chlore, pH, potentiel redox, matière organique dissoute, turbidité… Des capteurs acoustiques sont également capables de localiser des fuites par le son caractéristique qu’elles créent dans les canalisations. Un enjeu de taille sachant qu’un tiers de l’eau potable est aujourd’hui perdue avant même d’arriver au robinet ! Mais bien d’autres données sont générées : interventions sur les réseaux, réclamations des clients, analyses en laboratoires, compteurs communicants installés chez les abonnés… Bref, une mine d’informations qu’il serait bien dommage de laisser fuir.
Une cascade de données
« Dans le domaine de l’eau potable, les données sont souvent des objets mathématiques de types séries temporelles ou processus stochastiques, indique Gilles Faÿ, l’expert référent en data science du groupe SUEZ à la tête d’une équipe de cinq personnes. Ils peuvent être indexés en temps et parfois aussi dans l’espace, de manière continue ou sur un graphe représentant le réseau. » Dans la pratique, la plupart des approches reposent sur des techniques de clustering (par exemple pour créer des groupes de clients représentatifs, des sous-ensembles, des archétypes de comportements…), de régression (ex : régression spatiale pour faire de la maintenance prédictive et réduire les coûts d’inspection) ou de classification (ex : telle classe de signatures hydrauliques signe la présence d’une vanne ouverte ou d’une fuite).
« Mais nombre de phénomènes spatio-temporels sont difficilement modélisables par des équations aux dérivées partielles car les réseaux d’eau potable peuvent faire des milliers de kilomètres et comporter plusieurs milliers de nœuds, précise Gilles Faÿ. Voilà pourquoi on tente plutôt de les étudier et de les estimer en accumulant des données et en utilisant des approches de type machine learning. » Cet apprentissage statistique peut être en mode supervisé quand on dispose d’une base de données annotées par les experts. Il peut également être en mode non-supervisé lorsque les algorithmes sont appliqués « à froid » sur les réseaux d’eau potable et qu’ils apprennent à détecter des événements selon des paradigmes de la détection d’anomalie (ou de nouveauté). Comme souvent, les outils reposent sur une bonne paramétrisation de ces données plus ou moins structurées, et donc sur la construction de caractéristiques (features) bien pensées.
Une foule d’applications
Le Groupe SUEZ a développé un système informatique qui regroupe, traite et analyse nombre de ces données en temps réel. Baptisé Aquadvanced, ces algorithmes de machine learning développés en interne permettent déjà de localiser plus vite une fuite ou une pollution sur une carte. Il génère 1500 télémaintenances par an. « Nous comptons y intégrer de nouveaux algorithmes de maintenance prédictive développés en interne et capables d’anticiper la survenue de casses ou de pannes sur le réseau, en fonction des données obtenues sur les canalisations, pompes, vannes… », précise Gilles Faÿ. SUEZ a aussi installé 3 millions de compteurs communicants qui calculent la consommation quasiment en temps réel. De quoi éviter les relevés manuels, facturer le client au plus juste, déceler la signature d’une fuite d’eau, d’une surconsommation inhabituelle… et en alerter immédiatement le client par mail ou SMS. Ils pourraient également être mis à profit pour mieux détecter les signes avant coureurs de défaillance des compteurs âgés qui se mettent à sous-compter. Ils contribuent enfin à mesurer la performance du réseau presque en temps réel grâce au bilan matière (différence entre les volumes d’eau entrants et sortants).
Et Gilles Faÿ de conclure : « cette nouvelle culture de la donnée est en train d’imprégner notre métier en profondeur. » Un métier qui attire désormais des géants de l’informatique comme IBM et des startups de purs data scientists telle Visenti issue du MIT (Massachussets Institute of Technology). Rachetée en novembre 2016 par le groupe suédois Xylem, cette jeune pousse basée à Singapour propose aux opérateurs d’eau potable des plateformes d’analyse et de management des données 24h/24. Ces plateformes permettent de détecter des fuites et anomalies dans les canalisations, des coupures d’eau, de donner les tendances de consommation nocturnes, de prédire des défaillances, etc. Parmi ses clients, on compte notamment Thomas Water (le plus gros opérateur britannique) et les australiens Yarra Valley Water et SA Water. La dataéconomie de l’or bleu est bel et bien en marche !
Jean-Philippe Braly, journaliste scientifique
Illustration principale
Vue de la plateforme Aquadavanced Water Network pour la supervision quotidienne des opérations pour la gestion de l’eau (hydraulique et qualité) et de l’énergie. Crédit photo: Schwebel