OpenAI utilise une version personnalisée de ChatGPT pour identifier les responsables de fuites internes

L'IA surveille l'IA : OpenAI déploie un ChatGPT personnalisé pour traquer les auteurs de fuites internes

Dans un tournant récursif qui semble tiré des pages d'un roman cyberpunk, OpenAI aurait retourné sa propre création contre son personnel. Le géant de l'intelligence artificielle (Artificial Intelligence, AI) utilise désormais une version spécialisée et personnalisée de ChatGPT pour enquêter et identifier les employés responsables de la fuite d'informations internes sensibles vers la presse. Ce développement marque une escalade significative dans la guerre du secret de la Silicon Valley, modifiant fondamentalement la dynamique entre les créateurs d'IA et les systèmes qu'ils construisent.

Pour une entreprise dont la mission est de « garantir que l'intelligence artificielle générale (Artificial General Intelligence, AGI) profite à toute l'humanité », l'atmosphère interne semble de plus en plus concentrée sur le fait de s'assurer que les informations concernant cette intelligence restent strictement confinées. Comme le rapporte The Information, ce nouvel outil permet au personnel de sécurité d'injecter des articles de presse externes — tels que ceux détaillant des modèles non publiés ou des tensions internes — dans le système, qui compare ensuite le texte public à de vastes archives de communications internes.

Le « Leak Catcher » : comment fonctionne l'outil

Le mécanisme derrière ce détective numérique est aussi puissant que dystopique. Selon des sources familières avec le processus, lorsqu'une fuite fait surface dans des médias comme The New York Times ou The Information, l'équipe de sécurité d'OpenAI saisit l'article dans cette instance ChatGPT conçue à cet effet.

Contrairement à la version grand public de ChatGPT, qui est isolée des données privées, cette variante interne bénéficie d'un accès privilégié aux journaux de communication les plus profonds de l'entreprise. Elle peut analyser :

Messages Slack : Des années de conversations informelles, de mises à jour de projets et de messages directs.
Archives d'e-mails : Correspondance formelle et communications externes.
Journaux d'accès aux documents : Registres indiquant qui a ouvert des notes techniques ou des documents stratégiques spécifiques.

L'IA analyse l'article ayant fui pour y trouver des formulations spécifiques, des points de données uniques ou des noms de code de projets obscurs qui ne seraient connus que de quelques privilégiés. Elle corrèle ensuite cette « empreinte numérique » avec les dossiers internes pour signaler les employés qui avaient accès à cette information spécifique ou qui ont utilisé un langage similaire dans des discussions privées.

Cette analyse médico-légale automatisée réduit considérablement le temps nécessaire pour remonter jusqu'à une fuite. Ce qui prenait autrefois des semaines de révision manuelle des journaux par des enquêteurs humains peut désormais être réduit à une liste restreinte de suspects en quelques minutes. Cela transforme le vague soupçon que « quelqu'un a parlé » en un classement probabiliste de « qui a le plus probablement parlé ».

Un héritage de fuites et de paranoïa

Le déploiement de cet outil n'est pas une mesure isolée mais une réaction à une période tumultueuse de l'histoire d'OpenAI. L'entreprise a été assiégée par des fuites de haut niveau qui ont non seulement embarrassé la direction mais ont sans doute modifié la trajectoire de toute l'industrie.

La plus tristement célèbre d'entre elles a été la révélation de Q* (prononcé Q-Star), un modèle mystérieux capable de résoudre des problèmes mathématiques inédits, qui a fui quelques jours seulement avant le licenciement choc du PDG Sam Altman — et sa réembauche subséquente — en novembre 2023. Plus récemment, des détails concernant le « Project Strawberry » (sorti plus tard sous le nom de modèle o1) ont filtré dans la presse, sapant les calendriers de lancement soigneusement orchestrés par l'entreprise.

Ces incidents ont durci la culture interne d'OpenAI. L'esprit académique ouvert qui définissait ses débuts en tant qu'organisation à but non lucratif s'est largement évaporé, remplacé par les silos d'information rigides typiques d'un sous-traitant de la défense.

Tableau 1 : Chronologie des fuites majeures d'OpenAI et des réponses de sécurité

Date	Événement / Fuite	Conséquence / Réponse
Nov 2023	Découverte de Q (Q-Star)* divulguée à Reuters.	Citée comme un facteur de la perte de confiance du conseil d'administration ; a alimenté les débats sur la sécurité de l'IA.
Avril 2024	Les chercheurs Leopold Aschenbrenner et Pavel Izmailov licenciés.	Accusés d'avoir divulgué des informations confidentielles ; Aschenbrenner a ensuite déposé une plainte auprès de la SEC.
Juillet 2024	Apparition des détails du Project Strawberry.	A exposé les capacités de raisonnement avant le lancement officiel de « o1 » ; renforcement des protocoles de sécurité.
Fin 2024	Déploiement de l'outil d'IA « Leak Catcher ».	Version interne de ChatGPT déployée pour scanner Slack/E-mails à la recherche des sources de fuites.
En cours	Controverse sur les accords de non-divulgation (NDA) des lanceurs d'alerte.	Une plainte auprès de la SEC allègue des accords de non-divulgation restrictifs illégaux.

L'effet Panoptique : la surveillance par la syntaxe

L'impact psychologique de cet outil sur le personnel d'OpenAI ne peut être surestimé. Les employés travaillent désormais dans un environnement où leur syntaxe, leur choix de mots et leur empreinte numérique informelle sont constamment susceptibles d'être utilisés contre eux par les outils mêmes qu'ils aident à construire.

Cela crée un effet « panoptique » — le sentiment d'être constamment observé, même si l'observateur est un algorithme. Cela soulève des questions profondes sur la nature du travail à l'ère de l'IA. Si une IA peut analyser la dérive sémantique pour identifier qui a parlé à un journaliste, peut-elle également prédire qui pourrait commettre une fuite en se basant sur l'analyse de sentiment de ses messages Slack ?

L'ironie est palpable : l'entreprise entraîne efficacement ses modèles sur l'Internet ouvert (souvent en récupérant des données sans consentement explicite) mais emploie une surveillance draconienne alimentée par l'IA pour empêcher ses propres données de retourner dans ce même domaine public.

L'affaire Aschenbrenner et les droits des lanceurs d'alerte

La chasse agressive aux auteurs de fuites recoupe également des questions juridiques et éthiques complexes concernant le lancement d'alerte. En avril 2024, les chercheurs Leopold Aschenbrenner et Pavel Izmailov ont été licenciés pour fuites présumées. Aschenbrenner, membre de l'équipe « Superalignment », a déclaré plus tard publiquement que son licenciement était motivé par des raisons politiques et a déposé une plainte auprès de la Securities and Exchange Commission (SEC) des États-Unis.

Sa plainte alléguait que les accords de non-divulgation (Non-Disclosure Agreements, NDAs) d'OpenAI étaient illégalement restrictifs, empêchant potentiellement les employés de signaler des problèmes de sécurité aux régulateurs. Si l'outil « Leak Catcher » est utilisé pour identifier des employés qui communiquent avec des régulateurs fédéraux ou exposent des violations de sécurité — plutôt que de simplement vendre des secrets commerciaux — OpenAI pourrait faire face à d'importants obstacles juridiques.

Tendances plus larges de l'industrie : la mentalité de forteresse

OpenAI n'est pas seule dans cette mentalité de forteresse, bien qu'elle soit peut-être la plus agressive dans son automatisation. À mesure que les enjeux de la « course aux armements de l'IA » s'intensifient, avec des milliers de milliards de dollars de valeur boursière en jeu, des laboratoires de premier plan comme Google DeepMind et Anthropic resserrent également leurs périmètres de sécurité.

Cependant, l'utilisation d'un grand modèle de langage (Large Language Model, LLM) pour surveiller des employés humains introduit une nouvelle variable. Les logiciels traditionnels de prévention des pertes de données (Data Loss Prevention, DLP) recherchent des transferts de fichiers ou des mots-clés spécifiques. Un outil de sécurité basé sur un LLM comprend le contexte. Il peut détecter une fuite même si l'employé a paraphrasé l'information pour éviter les filtres de mots-clés. Cela représente un bond quantique dans les capacités de contre-espionnage en entreprise.

Implications pour l'avenir du travail

Le précédent établi ici est inquiétant pour l'ensemble du secteur technologique. À mesure que les outils d'IA s'intègrent davantage aux logiciels d'entreprise, la capacité de mener une surveillance sémantique approfondie des employés deviendra banalisée.

Analyse sémantique : Les employeurs pourraient suivre l'« alignement » avec les valeurs de l'entreprise en analysant le ton des e-mails.
Détection pré-crime : L'IA pourrait signaler les employés présentant des signes d'épuisement professionnel ou de dissidence avant qu'ils ne démissionnent ou ne s'expriment.
Enquêtes automatisées : Les enquêtes RH pourraient être menées principalement par des agents d'IA examinant les journaux de communication.

Conclusion : le silence des laboratoires

L'utilisation par OpenAI d'un ChatGPT personnalisé pour attraper les auteurs de fuites est une prouesse technologique et un coup de semonce culturel. Elle démontre la puissance brute de la technologie pour analyser de vastes quantités de données non structurées afin de trouver une « aiguille dans une botte de foin ». Pourtant, elle signale également la fin de l'ère de l'ouverture dans la recherche en IA.

Alors que ces entreprises font la course vers l'intelligence artificielle générale (AGI), les murs se referment. Les chercheurs qui construisent l'avenir le font sous l'œil vigilant de l'intelligence même qu'ils créent. Pour Creati.ai, ce développement souligne une tension critique : à mesure que les systèmes d'IA deviennent plus capables, ils seront inévitablement utilisés pour renforcer les structures de pouvoir des organisations qui les contrôlent, transformant la « boîte noire » de l'IA en un outil pour garder l'organisation elle-même comme une boîte noire.

Le message aux employés d'OpenAI est clair : l'IA écoute, et elle connaît votre style d'écriture mieux que vous-même.