Microsoft entwickelt Scanner zur Erkennung von Backdoors bei KI-Schläferagenten
Forscher von Microsoft stellen eine Methode zur Erkennung vergifteter KI-Modelle vor, die bei 47 Schläferagenten-Modellen 88 % Genauigkeit erzielt und keine Fehlalarme aufweist.


