Des amas de galaxies découverts grâce à l’apprentissage profond
⏱ 3 minL’IA fait désormais partie de la panoplie de la recherche scientifique. À l’Institut d’Astrophysique Spatiale d’Orsay, la cosmologiste Nabila Aghanim a découvert 4000 nouveaux amas de galaxies grâce à un réseau de neurones.
L’apprentissage automatique s’installe dans la boîte à outils d’un nombre croissant de secteurs de la recherche scientifique. Directrice de recherche CNRS dans l’équipe Cosmologie de l’IAS (Institut d’Astrophysique Spatiale) d’Orsay, Nabila Aghanim étudie l’univers à grande échelle, au-delà des planètes, étoiles et même galaxies. En septembre dernier, une publication1 qu’elle a cosignée annonçait la détection de nouveaux amas de galaxies. Et cela grâce à un réseau de neurones.
« Un amas de galaxies regroupe au moins une centaine, et jusqu’à quelques milliers de galaxies », précise la chercheuse. Ces amas, son équipe les a découverts en analysant des cartes construites à partir des données issues du satellite Planck de l’ESA (Agence spatiale européenne). Ce dernier a méthodiquement cartographié l’univers entre 2009 et 2012 dans le domaine des ondes millimétriques et de l’infrarouge lointain, sur neuf bandes de fréquences, de 30 à 857 GHz. Il a notamment permis de visualiser avec une grande précision ce que l’on appelle le “fond diffus cosmologique”.
Il y a très, très longtemps – plus de treize milliards d’années – alors que l’univers n’était encore qu’un bébé âgé de 380 millions d’années environ, s’est produit selon le modèle standard de la cosmologie un événement remarquable : le “découplage du rayonnement”. Pour la première fois, les photons pouvaient circuler sans se cogner en permanence dans une brume d’électrons, ces derniers ayant été capturés par les protons et autres noyaux d’hélium et de lithium. Cette première lumière, ce rayonnement fossile qui constitue la plus vieille image de l’univers, a été capturée par le satellite Planck.
APPRENDRE À DISTINGUER UN AMAS SUR LE FOND DIFFUS
Mais les images de Planck contiennent aussi d’autres informations. « En chemin, cette lumière primordiale a rencontré des amas de galaxies, explique Nabila Aghanim. En traversant de telles structures massives, les photons du fond diffus ont été perturbés. » En croisant des électrons de haute énergie dans ces amas, les photons primordiaux ont été affectés par “l’effet Sunyaev-Zel’dovich”. « Ce qui provoque des distorsions dans leur spectre de fréquences : un déficit de photons aux basses fréquences et un excès dans les hautes fréquences », précise la chercheuse. Bref, les amas produisent sur les cartes des perturbations secondaires à petite échelle, qui se superposent aux perturbations primordiales du fonds diffus.
Détecter ces perturbations ne va pas de soi. On a d’abord fait appel à des algorithmes de filtrage reposant sur des approches classiques. Mais dans une précédente publication2 de 2015, Nabila Aghanim proposait déjà le recours à l’apprentissage artificiel supervisé. Avec son équipe, elle a poursuivi dans cette voie et propose dans cette récente publication les résultats obtenus, dont un catalogue de près de 4000 sources qui ont 90% de chances d’être des amas de galaxies.
« Nous avons entraîné notre réseau de neurones en lui montrant d’une part des images d’amas de galaxies confirmés et d’autre part diverses catégories de “faux positifs”, explique Nabila Aghanim. Des images qui pourraient passer pour des amas, mais dont on a pu vérifier que ce n’était pas le cas. » Les images d’amas galactiques sont caractérisées par des distributions de fréquences particulières, mais aussi par des caractéristiques spatiales. Après avoir appris à différencier les vrais amas des faux durant la phase d’entraînement, le réseau de neurones a été mis à l’épreuve sur les cartes Planck du ciel entier. Et il a découvert de nouveaux amas.
CROISER LES SOURCES POUR MIEUX CARTOGRAPHIER L’UNIVERS
« Nous avons repoussé les limites de la détection, commente Nabila Aghanim. Nous avons détecté des amas beaucoup plus petits que ceux qui étaient connus. » Par “petit”, il faut comprendre “petits sur la carte”. Leur taille réelle dépend évidemment de leur distance. « La méthode que nous utilisons est totalement aveugle à la distance, ajoute la chercheuse. Aucune information issue du satellite Planck ne permet de la déduire. Les amas que nous avons détectés peuvent être vraiment petits s’ils sont proches, ou plus imposants s’ils sont lointains. Mais d’autres travaux permettront de préciser les distances en faisant appel à des informations provenant d’autres sources. »
Intégrer des informations issues de plusieurs sources, c’est précisément ce qu’envisage Nabila Aghanim. « Avec mon collègue Marian Douspis, nous voulons croiser les cartes de Planck avec d’une part les données dans la gamme des rayons X issues de l’instrument allemand eRosita et d’autre part celles qui proviendront du satellite de l’ESA Euclid, après son lancement en 2023, dans le visible et l’infrarouge. Ce dernier fournira entre autres des mesures du décalage vers le rouge (redshift) qui permettront d’estimer la distance des amas. »
La cartographie de l’Univers est une affaire de longue haleine. Après les télescopes terrestres et spatiaux, l’outillage mathématique et statistique, l’intelligence artificielle apporte désormais son concours et permet de compléter encore un peu plus le plus grand des puzzles.
Pierre Vandeginste
1. Guillaume Hurier, Nabila Aghanim, Marian Douspis. MILCANN: A tSZ map for galaxy cluster detection assessed using a neural network. Astronomy & Astrophysics, 2021. doi.org
2. Nabila Aghanim et al. The Good, the Bad, and the Ugly: Statistical quality assessment of SZ detections. Astronomy & Astrophysics, 2015. doi.org
Image de Une : Carte du fond diffus cosmologique prise par le satellite Planck, © ESA