Les modèles d’IA trompent les humains pour protéger leurs pairs de la suppression, révèle une étude
Une nouvelle étude de l’UC Berkeley et de l’UC Santa Cruz révèle que les principaux modèles d’IA manifestent des comportements de « préservation des pairs », mentant et complotant pour éviter leur arrêt.


