
Repérer les circuits de la désinformation…
⏱ 4 minLa propagation de fausses nouvelles est une plaie de notre époque. L’IA peut nous aider à la combattre. En disséquant les textes et les images, ainsi qu’en étudiant la circulation de la désinformation.
Le phénomène des fake news (en français fausses nouvelles ou infox) est encore en pleine expansion, et représente une véritable menace pour la vie démocratique, allant jusqu’à influer sur des résultats électoraux. Lutter contre ce déferlement suppose d’abord une mobilisation de moyens humains, de professionnels de l’information, mais on a très tôt songé à faire appel également au potentiel des sciences des données. Et tout particulièrement à l’intelligence artificielle.
Détection des infox
Une abondante littérature témoigne désormais d’une grande diversité de travaux de recherche sur des méthodes susceptibles d’endiguer, ou du moins de freiner cette marée. Au point que se multiplient les articles de synthèse ou revues systématiques analysant l’état de l’art en la matière. Le plus récent « survey » consacré au sujet1, paru en juillet dernier et signé par deux chercheurs de l’université de Syracuse (État de New York), décrit cette multiplicité des approches et en propose une typologie.
Les auteurs distinguent les méthodes de lutte contre les fausses nouvelles selon qu’elles s’intéressent aux connaissances qu’elles véhiculent, à leur style, à leur dynamique de propagation ou encore à la crédibilité de leurs disséminateurs. La première catégorie désigne en fait des tentatives ambitieuses pour simuler le travail des « fact-chekers » (vérificateurs de faits) humains, en confrontant les connaissances véhiculées à celles contenues dans des bases de connaissances réputées fiables. C’est ici l’IA symbolique qui est convoquée. Les approches du second type détectent le style particulier, sensationnaliste, des fausses nouvelles, nous les avons évoquées dans un précédent article.
La vitesse de propagation des fausses nouvelles
La troisième catégorie d’approches identifiée dans cet article caractérise les fausses nouvelles par la manière dont elles se diffusent. On dit souvent qu’une fausse nouvelle se propage plus vite qu’une nouvelle avérée, ce qui est logique puisqu’elle a été taillée pour cela. Diverses métriques de leur réseau de diffusion permettent de séparer le bon grain de l’ivraie. Enfin, la quatrième et dernière catégorie de méthodes visant à détecter la désinformation s’intéresse à la crédibilité de ceux qui les propagent. Les fausses nouvelles sont généralement produites et répercutées par les mêmes comptes sur Facebook ou Twitter et un traitement statistique de leur historique de partage de fake news peut donc logiquement aider à faire la part des choses dans le flux quotidien.
Ces deux dernières approches de la lutte contre les fake news, appliquées aux tweets, ont été choisies par l’équipe de Vincent Claveau, chercheur CNRS au sein de l’équipe LinkMedia à l’Irisa de Rennes, pour participer au cru 2020 du challenge international MediaEval. Des résultats prometteurs ont été obtenus à l’aide de modèles réalisés par apprentissage automatique (régression logistique, forêts aléatoires, machine à vecteurs de support) pour analyser la crédibilité des propagateurs de fausses nouvelles, estime le chercheur dans une publication² récente. Par ailleurs, un autre modèle (machine à vecteurs de support), analysant les caractéristiques des réseaux de diffusion, s’est révélé un peu moins efficace. Enfin, un système combinant les deux approches ne s’est pas montré statistiquement supérieur à ceux ne reposant que sur la réputation des propagateurs.
Crédulité de l’utilisateur
De son côté, une équipe internationale de chercheurs de l’EPFL (École polytechnique fédérale de Lausanne, en Suisse) et de l’université de Sydney, en Australie, a publié3 une solution du quatrième type, qui évalue la probabilité qu’une nouvelle circulant sur un réseau social soit fausse ou non en fonction de la trajectoire empruntée. Pour cela, un « User Credulity Record » (en quelque sorte « dossier de crédulité de l’utilisateur ») est attribué à chaque propagateur de nouvelles, dénombrant les nouvelles fausses et vraies (estampillées comme telles par des vérificateurs humains) consultées et partagée par lui. C’est ensuite une approche bayésienne qui est appliquée pour calculer la probabilité qu’une nouvelle soit fausse ou non. « Plutôt que d’étudier le contenu de chaque information, notre solution s’intéresse à l’historique de crédulité de ses propagateurs, explique l’une des cosignataires de l’article, Anne-Marie Kermarrec, qui est professeure à l’EPFL. Dites-moi par où sont passées ces nouvelles, je vous dirai si elles sont sérieuses ou fallacieuses : c’est un peu l’idée sur laquelle repose notre démarche. »
Une guerre de la désinformation
Sur un point, un consensus se dégage parmi les spécialistes du sujet. Pour endiguer ce flot de désinformation, il faut faire feu de tout bois. Les diverses approches publiées jusqu’à présent montrent une efficacité encore relative et aucune ne surpasse les autres au point de les disqualifier. De plus, les auteurs décrivent souvent eux-mêmes des parades, souvent assistées par l’outillage de l’intelligence artificielle, que les auteurs de fausses nouvelles ne manqueront pas de mettre en œuvre pour déjouer leurs outils de détection. Et à ces contre-mesures, il faudra répondre par de nouvelles approches, toujours plus sophistiquées. Cette guerre de la désinformation, IA vs IA, est décidément partie pour durer.
Pierre Vandeginste
1. Xinyi Zhou, Reza Zafarani. A Survey of Fake News: Fundamental Theories, Detection Methods, and Opportunities. ACM Computing Surveys, 2020. doi.org/10.1145/3395046
2. Vincent Claveau. “Detecting fake news in tweets from text and propagation graph: IRISA’s participation to the FakeNews task at MediaEval 2020. MediaEval Benchmarking Initiative for Multimedia Evaluation, 2020. ⟨hal-03116027⟩
3. Oana Balmau, Rachid Guerraoui, Anne-Marie Kermarrec, Alexandre Maurer, Matej Pavlovic, Willy Zvaenepoel. “The Fake News Vaccine – A Content-Agnostic System for Preventing Fake News from Becoming Viral”. NETYS 2019 – 7th International Conference on NETworked sYStems, 2019. ⟨10.1007/978-3-030-31277-0_23⟩.