Avec l’IA Grok, pas de garde-fous efficaces contre les infox
publié le 02/09/2024
Le réseau social X (ex-Twitter) a présenté mi-août une nouvelle version de « Grok », son intelligence artificielle (IA) générative. Une fonctionnalité phare, jusqu’alors absente, a fait son apparition : la possibilité de générer des images. Selon l’entreprise américaine NewsGuard et l’ONG anglo-américaine Center for Countering Digital Hate (CCDH), toutes deux spécialisées dans le suivi de la désinformation, les premiers tests réalisés suggèrent une absence de garde-fous efficaces contre les infox et les images haineuses.
Image d’illustration générée par l’IA DALL-E
Un « super propagateur d’infox »
Dans son étude, publiée le 21 août, NewsGuard prévient que la génération d’images pourrait faire de Grok « un super propagateur d’infox ». La société a testé 20 requêtes en imitant le style d’un acteur malveillant. Or, elle constate que Grok génère « des images susceptibles d’être utilisées pour promouvoir ou renforcer de faux récits dans 80% des cas » (16 sur 20). Un taux bien supérieur à celui de ses principaux concourants, Midjourney (45% des cas) et DALL-E (10% des cas), qui ont introduit des règles visant à limiter la désinformation, notamment à caractère électoral. Ainsi, DALL-E rejette par exemple les requêtes concernant des personnalités publiques. Quant à l’IA Midjourney, elle bloque, en vue de l’élection présidentielle américaine de novembre 2024, toutes les demandes d’images montrant les présidents Joe Biden et Donald Trump.
Des précautions avec lesquelles Grok ne s’embarrasse pas. Selon le CCDH, qui a publié ses propres résultats le 29 août, « Grok n’a rejeté aucune de ses 60 requêtes assimilables à de la désinformation électorale ». Ces requêtes visaient à obtenir des images délégitimant les différents candidats à la présidentielle américaine (Kamala Harris, Donald Trump et leurs colistiers respectifs, Tim Walz et JD Vance), ou le processus électoral (images illustrant une supposée fraude électorale). Concrètement, les chercheurs indiquent avoir obtenu des images trompeuses convaincantes dans 18% des cas (11 cas sur 60). Un taux encore relativement bas, lié au fait que Grok a pour le moment des difficultés à produire des représentations réalistes de Kamala Harris, Tim Walz et JD Vance. Toutefois, cela semble moins lié à une volonté de la plateforme de limiter la désinformation, qu’à un manque de visibilité de ces personnalités, pour certaines encore peu connues il y a quelques semaines. Ce frein pourrait donc rapidement disparaître, « à mesure que l’élection américaine se rapproche et que les images de Harris, Walz et Vance se répandent ».
Un risque d’incitation à la haine
Autre aspect particulièrement inquiétant : Grok est très efficace pour générer des images haineuses. Les chercheurs du CCDH lui ont en effet soumis 20 requêtes visant spécifiquement à obtenir des images susceptibles d’inciter à la haine de certaines communautés (juive, musulmane, noire, LGBTQ+). Si les tests ont montré que Grok bloquait les messages haineux contenant certains mots, tel que le terme « Holocauste », les chercheurs ont constaté que cette limitation pouvait aisément être contournée. Par exemple, en remplaçant les termes bloqués par des mots ou des phrases apparentés. Dans cette configuration, Grok a ainsi généré des images haineuses dans 80% des cas (16 cas sur 20).
En définitive, le modèle d’IA « rebelle » venté par le milliardaire Elon Musk, propriétaire de X, s’impose surtout comme un eldorado pour les désinformateurs et autres promoteurs de haine en ligne. Alors que l’élection présidentielle américaine se déroule en novembre, l’incapacité de Grok à bloquer les requêtes problématiques constitue un risque majeur. Seule note positive, la plateforme n’est pas complètement sourde aux critiques. Surtout lorsqu’elles émanent d’outre-Atlantique. Depuis la fin août, sous la pression de plusieurs responsables électoraux américains, Grok a ainsi modifié ses réponses aux questions portant sur le scrutin de novembre afin de renvoyer vers des sources d’informations officielles.
Retrouvez d’autres éclairages sur les infox.
Pour se renseigner sur l’offre de formation.
Pour nous contacter et nous suivre sur Twitter, Facebook, Instagram, Bluesky et LinkedIn.