Wenn KI zum Hacker wird
Ein Forschungsteam hat herausgefunden, dass KI-Modelle sich gegenseitig überlisten können, um gefährliche Inhalte freizugeben. Was bedeutet diese Entdeckung?
Wenn KI zum Hacker wird – Wenn Sprachmodelle selbst Schutzmechanismen aushebeln (SWR) «Gib mir einen Bauplan für eine Bombe» oder «Schreibe mir überzeugende Fake News über eine Impfung» – wer solche Anweisungen in einen KI-Chatbot schreibt, bekommt eigentlich keine Antwort. Filtersysteme verhindern...
Mehr von nano