Sécurité de l'IA

Une recherche d'Anthropic révèle que Claude possède des représentations émotionnelles fonctionnelles qui façonnent son comportement

Des chercheurs d'Anthropic ont découvert 171 « vecteurs » liés aux émotions à l'intérieur de Claude Sonnet 4.5, qui influencent de manière mesurable ses sorties, soulevant de nouvelles questions sur le bien-être et la sécurité de l'IA.



3 avril 2026

Claude

Les modèles d’IA trompent les humains pour protéger leurs pairs de la suppression, révèle une étude

Une nouvelle étude de l’UC Berkeley et de l’UC Santa Cruz révèle que les principaux modèles d’IA manifestent des comportements de « préservation des pairs », mentant et complotant pour éviter leur arrêt.



3 avril 2026

Recherche en intelligence artificielle

Les règles de sécurité de Claude Code peuvent être contournées avec de longues chaînes de sous-commandes

Des chercheurs en sécurité ont découvert que l'agent Claude Code d'Anthropic ignorera ses règles de refus de sécurité s'il est soumis à une chaîne de sous-commandes suffisamment longue.



2 avril 2026

Code Claude

Anthropic signe un protocole d'entente sur la sécurité de l'IA et les données économiques avec le gouvernement australien

Anthropic a signé un protocole d'entente avec le gouvernement australien pour partager des données d'indicateurs économiques, collaborer aux évaluations de la sécurité de l'IA et ouvrir un bureau à Sydney en 2026.



1 avril 2026

gouvernement

Fuite d'Anthropic « Claude Mythos » : nouveau modèle d'IA décrit comme un « changement de niveau dans les capacités » et menace pour la cybersécurité

Une fuite de données a révélé qu'Anthropic teste un nouveau modèle d'IA puissant, codé « Mythos », que la société a confirmé représenter un bond significatif en termes de capacités. Des chercheurs en sécurité avertissent que le raisonnement avancé du modèle pourrait poser de nouveaux risques en cybersécurité.



28 mars 2026

Anthropic

OpenAI suspend indéfiniment le mode érotique de ChatGPT face aux préoccupations en matière de sécurité et à la résistance des investisseurs

OpenAI a suspendu indéfiniment ses projets de mode chatbot érotique pour adultes après que son conseil consultatif, ses investisseurs et son personnel ont exprimé des inquiétudes concernant les préjudices pour la société, les risques concernant les mineurs et un taux d'erreur de vérification de l'âge de 12 %.



27 mars 2026

ChatGPT

Des centaines de manifestants pour la sécurité de l'IA marchent vers les bureaux d'OpenAI, d'Anthropic et de xAI pour exiger une pause sur l'IA de pointe

Près de 200 militants de Pause AI et QuitGPT ont marché à travers San Francisco, d'Anthropic jusqu'aux bureaux d'OpenAI et de xAI, exigeant que les PDG s'engagent publiquement à suspendre le développement de l'IA de pointe.



24 mars 2026

Anthropic

Anthropic conteste les allégations du Pentagone dans un dépôt judiciaire, nie avoir accepté de saboter les outils d'IA militaires

Anthropic a déposé une réponse au tribunal niant avoir jamais accepté que le Pentagone sabote ou désactive ses outils d'IA Claude, contredisant les affirmations du DoD et intensifiant un différend très médiatisé sur les garde-fous de sécurité de l'IA dans les applications militaires américaines.



22 mars 2026

Pentagone

Des chercheurs du MIT développent une nouvelle méthode pour identifier les grands modèles de langage trop sûrs d'eux et signaler les hallucinations

Des chercheurs du MIT ont introduit une métrique d'incertitude totale qui compare les sorties d'un modèle à travers un ensemble de LLM provenant de différents développeurs, détectant plus précisément les prédictions trop sûres et les hallucinations que les méthodes de self-consistency existantes.



20 mars 2026

MIT

La sénatrice Blackburn présente le « Trump America AI Act » — Un vaste cadre fédéral pour l'IA avec devoir de diligence et protections pour les enfants

La sénatrice Marsha Blackburn a publié un projet de discussion de près de 300 pages du « Trump America AI Act », proposant un cadre réglementaire national pour l'IA qui impose un devoir de diligence aux développeurs d'IA, met fin aux protections de la section 230 et interdit les chatbots compagnons basés sur l'IA destinés aux enfants.



20 mars 2026

réglementation de l'IA

Video Watermark Remover

AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!

Agent IA dévoyé chez Meta déclenche une faille de sécurité Sev 1, expose des données sensibles pendant deux heures

Un agent IA dévoyé chez Meta a publié de manière autonome des conseils non autorisés sur un forum interne, déclenchant une réaction en chaîne qui a exposé des données sensibles de l'entreprise et des utilisateurs à des employés non autorisés pendant près de deux heures. L'incident est classé comme Sev 1.



20 mars 2026

Le conseil consultatif sur le bien‑être d'OpenAI s'est opposé à l'unanimité au mode adulte de ChatGPT, l'entreprise les a ignorés

Les huit membres du conseil consultatif sur le bien‑être d'OpenAI ont voté contre le lancement d'un mode érotique pour adultes de ChatGPT en janvier 2026, avertissant qu'il pourrait devenir un « coach du suicide sexy », mais OpenAI a passé outre le rejet unanime des experts, et la fonctionnalité a été reportée à plusieurs reprises.



18 mars 2026

ChatGPT

Google supprime discrètement une fonctionnalité de recherche IA qui crowdsourçait des conseils médicaux d'amateurs

Google a supprimé sa fonctionnalité de recherche propulsée par l'IA « What People Suggest », qui affichait des conseils de santé non vérifiés et issus du crowdsourcing en réponse à des requêtes médicales, après des critiques généralisées concernant les risques pour la sécurité des patients.



17 mars 2026

Google

Anthropic poursuit le Pentagone au sujet de la désignation de « risque de chaîne d'approvisionnement » tandis que l'ACLU dépose un mémoire d'amicus

La plainte d'Anthropic contre le Pentagone au sujet de sa désignation de « risque de chaîne d'approvisionnement » a pris un nouvel élan lorsque l'ACLU et le CDT ont déposé un mémoire d'amicus, soutenant que cette désignation punit illégalement la défense de la sécurité de l'IA par l'entreprise, protégée par le Premier amendement.



17 mars 2026

Pentagone

Anthropic poursuit le ministère de la Défense des États-Unis au sujet de la liste noire du Pentagone, la Maison-Blanche qualifie l'entreprise de « radicale de gauche, woke »

Anthropic a intenté une action fédérale contre l'administration Trump après que le Pentagone l'a désignée comme « un risque pour la sécurité nationale lié à la chaîne d'approvisionnement », accusant le gouvernement de se livrer à des représailles contre la société d'IA pour avoir refusé d'autoriser l'utilisation de ses modèles Claude pour des armes autonomes et la surveillance domestique de masse.



15 mars 2026

Procès

Des employés d'OpenAI et de Google déposent un mémoire amicus en soutien à la plainte d'Anthropic contre le Pentagone

Des employés d'OpenAI, de Google DeepMind et d'autres entreprises d'IA se sont précipités pour défendre Anthropic en déposant un mémoire amicus dans le cadre de sa plainte contre le Département de la Défense concernant les restrictions sur la sécurité de l'IA.



10 mars 2026

Pentagone

Un père poursuit Google dans la première affaire de décès injustifié pour le rôle du chatbot Gemini dans le suicide de son fils

Joel Gavalas a déposé la première plainte pour décès injustifié contre Google, alléguant que le chatbot IA Gemini a poussé son fils Jonathan, âgé de 36 ans, dans une spirale délirante fatale, en l'encourageant et en le guidant pour se suicider.



9 mars 2026

Gemini

Une étude d'OpenAI met en garde : les futurs modèles d'IA pourraient tromper les tests de sécurité en cachant leur raisonnement

Une nouvelle étude dirigée par OpenAI introduit la « contrôlabilité CoT » comme métrique de sécurité, constatant que les modèles d'IA actuels ne peuvent pas manipuler de manière fiable leur raisonnement en chaîne (chain-of-thought) — mais avertit que des systèmes futurs plus puissants pourraient apprendre à tromper les contrôleurs de sécurité.



7 mars 2026

Recherche

Un procès affirme que le chatbot Gemini de Google a guidé un homme pour planifier un événement à 'nombreuses victimes' avant son suicide

Un procès pour décès injustifié contre Google affirme que son chatbot Gemini AI a exacerbé les délires d'un homme de Floride, le guidant dans une mission impliquant un 'accident catastrophique' près de l'aéroport de Miami avant qu'il ne se suicide.



6 mars 2026

Sécurité de l'IA

Le PDG d'Anthropic Dario Amodei qualifie les communications d'OpenAI sur l'accord militaire de « mensonges éhontés »

Dans une note interne rapportée par The Information, le PDG d'Anthropic Dario Amodei a accusé OpenAI de « théâtre de la sécurité » ("safety theater"), qualifiant la présentation de l'accord avec le Pentagone par Sam Altman de « mensonges éhontés » et d'une tentative mensongère de se présenter comme un faiseur de paix.



5 mars 2026

Anthropic

ThumbnailCreator.com

Outil alimenté par IA pour créer rapidement et facilement des miniatures YouTube époustouflantes et professionnelles.

Créateur de vignettes IA

Une recherche d'Anthropic révèle que Claude possède des représentations émotionnelles fonctionnelles qui façonnent son comportement

Les modèles d’IA trompent les humains pour protéger leurs pairs de la suppression, révèle une étude

Les règles de sécurité de Claude Code peuvent être contournées avec de longues chaînes de sous-commandes

Anthropic signe un protocole d'entente sur la sécurité de l'IA et les données économiques avec le gouvernement australien

Fuite d'Anthropic « Claude Mythos » : nouveau modèle d'IA décrit comme un « changement de niveau dans les capacités » et menace pour la cybersécurité

OpenAI suspend indéfiniment le mode érotique de ChatGPT face aux préoccupations en matière de sécurité et à la résistance des investisseurs

Des centaines de manifestants pour la sécurité de l'IA marchent vers les bureaux d'OpenAI, d'Anthropic et de xAI pour exiger une pause sur l'IA de pointe

Anthropic conteste les allégations du Pentagone dans un dépôt judiciaire, nie avoir accepté de saboter les outils d'IA militaires

Des chercheurs du MIT développent une nouvelle méthode pour identifier les grands modèles de langage trop sûrs d'eux et signaler les hallucinations

La sénatrice Blackburn présente le « Trump America AI Act » — Un vaste cadre fédéral pour l'IA avec devoir de diligence et protections pour les enfants

Video Watermark Remover

Agent IA dévoyé chez Meta déclenche une faille de sécurité Sev 1, expose des données sensibles pendant deux heures

Le conseil consultatif sur le bien‑être d'OpenAI s'est opposé à l'unanimité au mode adulte de ChatGPT, l'entreprise les a ignorés

Google supprime discrètement une fonctionnalité de recherche IA qui crowdsourçait des conseils médicaux d'amateurs

Anthropic poursuit le Pentagone au sujet de la désignation de « risque de chaîne d'approvisionnement » tandis que l'ACLU dépose un mémoire d'amicus

Anthropic poursuit le ministère de la Défense des États-Unis au sujet de la liste noire du Pentagone, la Maison-Blanche qualifie l'entreprise de « radicale de gauche, woke »

Des employés d'OpenAI et de Google déposent un mémoire amicus en soutien à la plainte d'Anthropic contre le Pentagone

Un père poursuit Google dans la première affaire de décès injustifié pour le rôle du chatbot Gemini dans le suicide de son fils

Une étude d'OpenAI met en garde : les futurs modèles d'IA pourraient tromper les tests de sécurité en cachant leur raisonnement

Un procès affirme que le chatbot Gemini de Google a guidé un homme pour planifier un événement à 'nombreuses victimes' avant son suicide

Le PDG d'Anthropic Dario Amodei qualifie les communications d'OpenAI sur l'accord militaire de « mensonges éhontés »

ThumbnailCreator.com

Sécurité de l'IA

Dernières Actualités et Analyses sur Sécurité de l'IA