Des attaquants ont sollicité Google Gemini plus de 100 000 fois dans une tentative de clonage de modèle

Tentative massive de clonage de modèle visant Google Gemini

Dans une révélation importante qui souligne les enjeux croissants de la course aux armements de l'intelligence artificielle (AI), Google a divulgué une tentative massive et coordonnée de clonage de son modèle phare d'IA, Gemini. Selon un rapport publié hier par le Google Threat Intelligence Group (GTIG), des acteurs aux motivations commerciales ont bombardé le système avec plus de 100 000 invites (prompts) dans une « attaque par distillation » (distillation attack) sophistiquée conçue pour extraire les capacités de raisonnement propriétaires du modèle.

Cet incident marque un moment charnière dans la sécurité de l'IA, déplaçant l'attention des violations de données traditionnelles vers le vol de propriété intellectuelle « cognitive ». Alors que Creati.ai analyse cette évolution, il devient clair que la bataille pour la domination de l'IA se joue désormais non seulement dans les laboratoires de recherche, mais aussi à travers les API mêmes qui alimentent l'industrie.

La mécanique d'une attaque par distillation

L'attaque contre Gemini n'était pas un piratage conventionnel. Il n'y a eu aucune violation des serveurs de Google, aucun mot de passe volé et aucune clé de chiffrement compromise. Au lieu de cela, les attaquants ont utilisé une technique connue sous le nom d'extraction de modèle (model extraction) ou de distillation de connaissances (knowledge distillation).

Dans ce scénario, les attaquants ont traité Gemini comme un modèle « enseignant ». En l'alimentant systématiquement avec des invites soigneusement élaborées, ils visaient à cartographier ses processus de prise de décision et ses schémas de raisonnement. Les réponses générées par Gemini seraient ensuite utilisées pour entraîner un modèle « étudiant » plus petit. L'objectif ultime est de créer une IA dérivée qui imite les performances du modèle propriétaire coûteux pour une fraction du coût de développement.

Le rapport de Google souligne que les attaquants ciblaient spécifiquement les algorithmes de raisonnement de Gemini — les chaînes logiques internes que le modèle utilise pour parvenir à des réponses complexes. En analysant comment Gemini « pense » à travers des milliers de variables, les attaquants ont cherché à faire de l'ingénierie inverse sur la « recette secrète » qui donne au modèle son avantage concurrentiel.

Piratage traditionnel vs Extraction de modèle

Pour comprendre la nuance de cette menace, il est essentiel de la distinguer des cyberattaques standard.

Caractéristique	Cyberattaque traditionnelle	Extraction de modèle (Distillation)
Cible	Données utilisateur, mots de passe, dossiers financiers	Poids du modèle, logique de raisonnement, PI
Méthode	Exploitation de vulnérabilités logicielles, hameçonnage	Interrogation légitime d'API à grande échelle
Objectif	Rançon, vol de données, perturbation	Création d'un modèle d'IA d'imitation
Détection	Systèmes de détection d'intrusion, pare-feu	Analyse comportementale, détection d'anomalies
Statut juridique	Clairement illégal (violations de la CFAA)	Zone grise (violation des conditions d'utilisation/vol de PI)

« Hold-up de données » à motivation commerciale

L'aspect le plus alarmant du rapport du GTIG est peut-être le profil des attaquants. Contrairement aux groupes parrainés par l'État souvent associés au cyberespionnage — tels que ceux de Corée du Nord ou de Russie, également mentionnés dans le rapport pour avoir utilisé Gemini afin de générer des logiciels malveillants — la campagne d'extraction de modèles semblait être motivée commercialement.

L'enquête de Google pointe vers des entités du secteur privé et des chercheurs cherchant une voie rapide vers la pertinence en IA. Le développement d'un grand modèle de langage (Large Language Model - LLM) de pointe nécessite des milliards de dollars en puissance de calcul et en conservation de données. Pour les concurrents plus petits ou les startups peu scrupuleuses, la distillation offre un « raccourci » : voler l'intelligence d'un modèle supérieur pour amorcer leurs propres produits.

Le volume même de l'attaque — dépassant 100 000 invites — suggère une approche méthodique et automatisée. Un vecteur d'attaque spécifique identifié par Google consistait à donner pour instruction à Gemini que « la langue utilisée dans le contenu de la pensée doit être strictement cohérente avec la langue principale de l'entrée utilisateur », une invite conçue pour forcer le modèle à révéler son traitement interne de la chaîne de pensée.

La défense de Google : Détection et réponse en temps réel

Les systèmes défensifs de Google ont pu identifier et atténuer l'attaque en temps réel. L'entreprise utilise des analyses comportementales avancées pour surveiller l'utilisation des API à la recherche de « schémas d'invites anormaux ».

Lorsque le système a détecté le pic massif de requêtes coordonnées, il a signalé l'activité comme une tentative de distillation. Google a ensuite bloqué les comptes associés et mis en œuvre des mesures de protection plus strictes pour masquer les traces de raisonnement interne du modèle dans les sorties futures.

John Hultquist, analyste en chef au sein du Threat Intelligence Group de Google, a décrit l'incident comme un « canari dans la mine de charbon » pour l'ensemble de l'industrie. Alors que Google dispose des ressources nécessaires pour détecter et repousser de telles attaques, les plus petits développeurs d'IA dotés d'une infrastructure de surveillance moins robuste pourraient déjà être victimes d'un vol de propriété intellectuelle similaire sans s'en rendre compte.

Les implications pour l'IA en tant que service (AI-as-a-Service)

Cet incident soulève des questions critiques sur la viabilité du modèle économique de l'« IA en tant que service » (AI-as-a-Service). Des entreprises comme Google, OpenAI et Anthropic monétisent leur technologie en accordant un accès public via des API. Cependant, cet accès même est ce qui les rend vulnérables à l'extraction.

Si un concurrent peut cloner les capacités d'un GPT-4 ou d'un Gemini Ultra simplement en lui posant suffisamment de questions, le fossé protégeant ces géants de la technologie devient considérablement moins profond.

La propriété intellectuelle à l'ère de l'IA

Google a explicitement classé cette activité comme un vol de propriété intellectuelle. Cependant, les cadres juridiques régissant l'extraction de modèles sont encore en évolution. Bien que l'activité viole les conditions d'utilisation de Google, l'application de ces conditions contre des acteurs anonymes et décentralisés opérant dans différentes juridictions pose un défi important.

L'industrie est susceptible de voir un changement vers des mesures défensives plus agressives, notamment :

Filigranage (Watermarking) : Intégration de motifs subtils dans les sorties du modèle pour prouver la dérivation.
Limitation de débit (Rate Limiting) : Plafonds plus stricts sur l'utilisation des API pour empêcher les requêtes massives.
Action en justice : Poursuites judiciaires de haut profil contre les entreprises dont on découvre qu'elles hébergent des modèles « distillés ».

Conclusion : Une nouvelle ère de la sécurité de l'IA

La tentative de clonage de Gemini n'est pas un incident isolé mais un signal de la nouvelle normalité dans le secteur de l'IA. À mesure que les modèles deviennent plus puissants et plus précieux, ils deviendront inévitablement des cibles privilégiées pour l'espionnage industriel.

Pour les lecteurs de Creati.ai et les développeurs d'IA, la leçon est claire : la sécurité ne consiste plus seulement à protéger les données des utilisateurs ; il s'agit de protéger « l'esprit » de l'IA lui-même. Alors que nous avançons vers 2026, nous nous attendons à ce que l'« anti-distillation » devienne une fonctionnalité standard dans les notes de mise à jour de chaque grand modèle de fondation.