Un traitement industriel des données
⏱ 2 minLes usines 4.0 généreront une masse considérable de données. Divers outils de data science sont envisagés pour en tirer le meilleur parti. Un enjeu également économique qui aiguise les appétits…
Les usines 4.0 généreront des quantités colossales de données. Selon les experts interrogés, rien qu’une seule ligne de production pourrait produire plusieurs téraoctets… par jour ! Pour tirer le meilleur parti de toutes ces données industrielles, divers outils de data science devront donc être développés.
Big ou smart data ?
On l’a vu, des algorithmes de maintenance prédictive sont déjà à l’œuvre dans certaines usines (voir article « Vers des usines digitalisées hyperconnectées« ). Mais plus largement, c’est tout un éventail de traitements de données qu’il faudra développer : « de la construction et sélection de variables à du machine learning adapté à chaque problème, en passant par l’extraction de règles métier, la fusion de données… ou bien encore la mise à jour de modèles a priori à partir d’un flux de données observées », résume Hadrien Szigeti, spécialiste Manufacturing & Supply Chain chez Dassault Systèmes.
Toutefois, à son avis, ces données seront sans doute trop nombreuses pour que s’avèrent rentables des approches brutales type data lake, consistant à tout collecter pour chercher l’aiguille dans la botte de foin. Il faudra d’abord identifier les sources potentielles de données importantes afin d’affiner le plan de collecte. Une vision que semble partager Damien Andrieu, responsable digital chez think project! France : » dans de nombreux cas, l’erreur est de collecter des informations aux formats hétérogènes avant même de savoir comment les consolider; car c’est souvent trop tard pour les exploiter efficacement : manque d’informations cruciales, informations inutiles, données mortes… » Bref, on serait plutôt dans une approche « smart data ».
La guerre des PaaS aura bien lieu
En attendant, les grandes manœuvres ont déjà commencé sur ce marché prometteur de la data industrielle 4.0. « On assiste actuellement à une bataille titanesque pour la mise au point d’une plateforme de données industrielle qui fera référence », confirme Hubert Tardieu, en charge de la Communauté scientifique d’Atos. Le concept général ? Chaque industriel qui le souhaite disposerait d’un espace réservé sur un cloud où seraient transférées en continu une foule de données. Nombre d’entre elles seraient captées en temps réel sur les machines, robots, ateliers et autres lignes de production… tous rendus communicants grâce à l’internet des objets (IoT). « Un peu comme sur un smartphone, l’idée est aussi que l’industriel puisse ensuite souscrire à diverses applis », complète Laurent Mismacque, en charge de la plateforme MindSphere disponible depuis 18 mois chez Siemens.
Dotées d’algorithmes programmés ou de modèle de machine learning, ces applis pourraient offrir toute une gamme de services à la carte : maintenance prédictive, aide à la prise de décision, visualisation dynamique des données au format souhaité, etc. Un concept déjà baptisé Platform as a service (PaaS), en écho au désormais célèbre Software as a Service (SaaS). « Ces Paas permettront aussi aux industriels d’échanger diverses données choisies avec leurs clients, fournisseurs, sous-traitants et autres acteurs de leur écosystème », complète Hubert Tardieu. Des données souvent confidentielles qu’il faudra protéger de manière adéquate, par exemple grâce à l’encryptage homomorphe et la technologie Blockchain. Mais on s’en doute, de nombreux acteurs comptent investir ce marché prometteur, au premier rang desquels le concurrent américain historique de Siemens : General Electric avec sa plateforme Predix. Le match ne fait que commencer…
Jean-Philippe BRALY