Deepfakes : comment certifier l’originalité d’une vidéo ?
⏱ 5 minPour détecter une vidéo truquée, on pourrait utiliser les métadonnées… si elles n’étaient pas supprimées lors de la mise en ligne. Actuellement, la seule solution d’identification de vidéos permettant de certifier son contenu est le tatouage numérique. Une technologie éprouvée qui revient sur le devant de la scène.
À chaque fichier d’image ou de vidéo (et tout autre contenu tel que du texte, de la musique, etc.) sont associées des métadonnées, un ensemble d’information sur le contenu (sujet, date, coordonnées géographiques…), les droits (auteur, licence, etc.), et des éléments techniques (appareil, focale, résolution, logiciel de retouche…). Cette indexation garantit à la fois les droits d’auteur, et la visibilité du contenu via les moteurs de recherche. Les données indexées, pour partie générées automatiquement par la caméra, le smartphone ou autre appareil photo, doivent être complétées par les auteurs, un travail fastidieux pour ajouter notamment des informations de copyright et des mots-clés. Dès lors, pourquoi ne pas utiliser ces métadonnées pour certifier les contenus ?
Une « carte d’identité » des images et vidéos
Cette idée est plus complexe à mettre en œuvre qu’il n’y paraît. D’abord parce qu’il y a plusieurs standards de métadonnées, comme EXIF, IPTC, XMP, etc. S’entendre sur des normes communes, qui plus est au niveau international, est une gageure. Même les agences photo ont bien du mal à remplir les métadonnées de leurs images de façon exhaustive ; ne parlons pas des photographes indépendants, encore moins amateurs.
Et de toute façon, avant de diffuser les contenus, la plupart des éditeurs web (Facebook, Youtube, Google, etc.) suppriment bon nombre de métadonnées quand ils retraitent et compressent les images et vidéos pour « alléger » leur poids. « Un argument technique obsolète à l’heure du haut débit mais une habitude prise aux débuts de l’internet quand son débit était lent, précise Mathieu Desoubeaux, CEO d’Imatag. Selon notre étude publiée en mai 2018, 85 % des images publiées sur internet n’ont pas (ou plus) de métadonnées ; et seulement une sur cinq contient des informations permettant de connaître l’auteur, les droits d’utilisation, l’agence et la description de la photo. Ce n’est d’ailleurs guère mieux sur les sites de presse. » Et probablement pas pour les vidéos.
… qui disparaît lors de leur diffusion
« On aimerait que les éditeurs web conservent les métadonnées, regrette Denis Teyssou, responsable du Medialab de l’AFP. Cela nous aiderait à vérifier l’originalité des contenus mis en ligne et à détecter des incohérences avec les vidéos falsifiées, dont les deepfakes. Sauf que rien ne garantit qu’elles n’aient pas été falsifiées ; il est très facile de modifier des métadonnées, par exemple de changer les coordonnées GPS d’une image ou d’une vidéo avec un logiciel de retouche. On a des outils pour identifier ce genre de falsification géographique. C’est plus difficile à contrer en ce qui concerne la date de prise de vue par exemple. »
Miser sur ces métadonnées était une des pistes évoquées aux États-Unis l’an dernier par des élus de la Chambre des représentants. S’alarmant des risques induits par les deepfakes lors des élections de mi-mandat de novembre 2018, ils avaient demandé qu’ils soient inscrits sur la liste des menaces pour la sécurité nationale. « Le fait est qu’aujourd’hui, les métadonnées disparaissent des contenus publiés, constate Teddy Furon, chercheur à Inria Rennes. Il s’agit donc de convaincre non seulement les producteurs de contenus de les renseigner, mais aussi tous les éditeurs, sites web et réseaux sociaux de ne pas les enlever. » Cela évolue lentement… car il y a bien sûr en filigrane la question de la rémunération des auteurs, un sujet au cœur de la directive européenne sur les droits d’auteurs, enfin approuvée en avril dernier, mais qui n’aborde pas cette question des métadonnées.
Un tatouage numérique indélébile et imperceptible
« Il existe bien une solution, avance Teddy Furon : le tatouage numérique [aussi qualifié de filigrane numérique ou watermarking, NDLR] qui permettrait d’insérer un numéro de série dans chaque image d’une vidéo, une info qui persiste même si les métadonnées sont supprimées. » Très répandu depuis la fin des années 1990, il s’applique à beaucoup de types de contenus (image, vidéo, son, code source, carte géographique, modèle 3D, séquence ADN, molécule chimique). C’est, par exemple, ce que font les studios hollywoodiens pour lutter contre les copies illicites de leurs films, ou les agences de presse pour leurs photos.
La technologie est donc mûre, et beaucoup de sociétés, à l’instar d’Imatag, proposent ce service. En quoi cela consiste-t-il ? « On cache dans les images un message numérique, une série imperceptible de 0 et de 1, explique Teddy Furon, qui a fait sa thèse sur le sujet. Ce message, ensuite décodé par un ordinateur, permet de garantir le contenu. Un message de 64 bits par image semble faisable et suffisant pour donner un numéro de série unique, une marque, à chaque image. » On pourrait imaginer un registre commun décentralisé, nourri par les producteurs de contenus.
« Le problème est que pour utiliser cela comme certification des vidéos, il faudrait que toutes les vidéos soient tatouées, poursuit le chercheur. Cela ne pose pas de problème technique : tatouer tous les pixels de toutes les images d’une vidéo se fait quasiment en temps réel. La question de la mise en œuvre se pose plutôt du côté des producteurs de contenus et des éditeurs, pour construire un modèle commun de numéro de série. » Or cette certification n’a pas d’intérêt financier… car la crédibilité des contenus est encore bien mal valorisée. Cela pourrait néanmoins changer avec la déferlante de fake news à base d’images truquées et maintenant de deepfakes.
Automatiser les analyses de contenu
« Dans l’idéal, sans parler de tous les contenus existants, pour les nouvelles vidéos (et photos), il faudrait d’une part, insérer le tatouage au moment de la prise d’images (dans tous les appareils de prise d’images ou de vidéos) et d’autre part, concevoir un plug-in pour les navigateurs internet, en mesure de vérifier automatiquement la présence d’un tatouage sur les contenus téléchargés, » précise le chercheur. Ce que certaines entreprises proposent déjà, comme Imatag, dont Teddy Furon est cofondateur : « Chaque identifiant, caché aléatoirement au sein des pixels, est unique et imperceptible (car placé dans les zones où la perception humaine est moindre), affirme Mathieu Desoubeaux, CEO d’Imatag. Il persiste même après une forte compression, un changement de format, un montage, un recadrage, etc. C’est ce qu’on appelle un tatouage robuste. Nous avons breveté une IA pour faire une recherche d’images par similarité puis une détection de tatouage. Cela permettra ensuite de vérifier si le contenu a été modifié, une étape d’analyse sur laquelle nous travaillons avec Inria. Nous proposerons également une telle solution de monitoring automatisé pour les vidéos à destination des plateformes web. »
Imatag analyse 100 millions d’images par jour (le volume quotidien d’images téléchargées sur Instagram) et génère 100 000 alertes quotidiennes de similarité dont une partie concerne des images marquées (la start-up ayant pour sa part rassemblé une base de 20 millions d’images tatouées). « Le tatouage numérique est le seul système d’identification qui permet de certifier un contenu aujourd’hui, affirme Mathieu Desoubeaux. Ce n’est pas une solution universelle, mais il serait judicieux de tatouer les contenus les plus sensibles, comme les discours d’un président. »
Tatouage fragile
À l’inverse, le tatouage peut être utilisé comme moyen de détecter qu’une falsification a eu lieu : on parle alors de tatouage fragile, car il disparaît dès que l’image est manipulée (à l’exception de la compression). « Il s’agit d’un signal très structuré, ajouté dans l’image, et imperceptible, décrit Teddy Furon. À mon sens, ce serait plus puissant que le forensics, cette analyse des traces numériques de manipulation des images [abordé dans l’article 2 du dossier, NDLR]. »
Isabelle Bellin