Google a récemment dévoilé une version ouverte de sa technologie SynthID, un outil de filigrane invisible conçu pour identifier les contenus créés par ses IA, comme Gemini et Lyria. Ce système marque les textes, images, sons et vidéos de façon indétectable à l’œil nu, mais lisible par un logiciel, afin de prévenir la désinformation et les fraudes. Découvrez comment cette technologie fonctionne et en quoi elle constitue une avancée dans la gestion des contenus générés par intelligence artificielle.
SynthID : un filigrane pour détecter les contenus générés par l’IA
Avec l’évolution rapide de l’intelligence artificielle, la nécessité de différencier les contenus humains des créations de machine est plus que jamais d’actualité. Une récente loi en Californie, soutenue par OpenAI, souhaite marquer l’ensemble des contenus générés par l’IA d’un filigrane permettant de les distinguer des contenus humains. Dans ce contexte, Google a lancé SynthID pour répondre à ce besoin. Cette technologie permet d’ajouter des filigranes invisibles aux contenus générés par ses IA, que ce soit sous forme de texte, d’images, d’audio ou de vidéo.
La particularité de SynthID réside dans son marquage indétectable à l’œil nu, tout en restant lisible par des outils spécialisés. Ce filigrane vise à sécuriser les contenus en limitant leur usage abusif, notamment pour prévenir les risques de manipulation comme les deepfakes et autres formes de désinformation.
SynthID pour les textes : une détection dès trois phrases
La version texte de SynthID s’appuie sur un système sophistiqué d’analyse de jetons. Lors de la génération d’un texte par IA, le modèle découpe les mots en jetons et attribue à chacun un score de probabilité basé sur le mot suivant le plus probable. SynthID ajuste ces scores pour incorporer un filigrane à chaque niveau du processus.
Grâce à cet ajustement, SynthID peut détecter si un texte de trois phrases minimum a été produit par un modèle génératif d’IA. Cette détection rapide et discrète garantit la traçabilité des textes générés, facilitant leur identification sur les différentes plateformes où ils sont partagés.
Une protection étendue aux contenus audio avec SynthID et Lyria
SynthID ne se limite pas aux textes. Pour les contenus audio, Google utilise la même technologie pour intégrer des filigranes dans les créations de Lyria, son IA spécialisée dans la génération musicale. Ce processus convertit les ondes sonores en spectrogrammes, un format graphique de l’audio qui permet d’ajouter un marquage invisible.
Ce filigrane audio résiste aux compressions, comme le format MP3, ainsi qu’aux ajustements de vitesse, garantissant une traçabilité efficace même après des modifications. SynthID s’affirme ainsi comme une solution robuste pour le suivi des contenus multimédia générés par IA.
Un marquage imperceptible pour les images et vidéos générées par IA
La capacité de SynthID à marquer des images et vidéos repose sur une intégration directement dans les pixels d’une image ou dans chaque image d’une vidéo. Ces filigranes sont conçus pour persister même en cas de recadrage ou de compression du fichier. On pourrait tout à fait imaginer l’incorporation de ces filigranes sur des outils vidéos comme Adobe Firefly Video ou encore Sora d’OpenAI.
Pour les contenus visuels, cette technique permet d’identifier les images générées par IA, prévenant ainsi les tentatives de manipulation visuelle. En assurant un marquage stable et durable, SynthID vise à renforcer la transparence des contenus dans un environnement numérique où les images modifiées se multiplient.
SynthID disponible en open source pour une adoption élargie
Google a choisi de publier SynthID en open source, facilitant son intégration par d’autres développeurs via le Google Responsible Generative AI Toolkit. En rendant cette technologie accessible, Google encourage une adoption large de son filigrane invisible, visant à faire de SynthID un standard pour la sécurité et la transparence des contenus générés par IA.
Avec cette ouverture, SynthID pourrait jouer un rôle majeur dans le domaine de la régulation des contenus numériques et devenir un outil essentiel pour les plateformes, créateurs et entreprises désireux de sécuriser leurs productions face aux manipulations de l’IA.
Source : https://deepmind.google/technologies/synthid/