Claude Mythos: Das KI-Modell, das Tausende Sicherheitslücken gefunden hat
  • Home
  • KI
  • Claude Mythos: Das KI-Modell, das Tausende Sicherheitslücken gefunden hat
Von Riccardo Curatolo Profilbild Riccardo Curatolo
3 min read

Claude Mythos: Das KI-Modell, das Tausende Sicherheitslücken gefunden hat

Anthropic hat Claude Mythos entwickelt — ein KI-Modell, das als zu gefährlich für die Öffentlichkeit gilt: Tausende Schwachstellen in jedem Betriebssystem und Browser entdeckt. Es entsteht Project Glasswing.

Anthropic hat ein KI-Modell entwickelt, das die Öffentlichkeit nicht zu Gesicht bekommt. Nicht aus Mangel an Mut, sondern weil seine Fähigkeiten schlicht zu gefährlich sind. Es heißt Claude Mythos Preview und ist das fortschrittlichste Modell, das das amerikanische Labor je entwickelt hat.

Das Problem? Es findet Schwachstellen in den kritischsten IT-Systemen der Welt mit einer Geschwindigkeit und Präzision, die kein automatisiertes Werkzeug bisher erreicht hat.

In den Wochen vor der offiziellen Ankündigung am 7. April 2026 wurde das Modell in kontrollierten Umgebungen getestet. Die Ergebnisse verschlugen den Forschern die Sprache.

Ein 27 Jahre alter Bug — für wenige Dollar gefunden

Nicholas Carlini, Senior-Forscher bei Anthropic, beschrieb die Situation mit entwaffnender Schlichtheit: In den letzten Wochen der Tests fand er mehr Sicherheitslücken als in seiner gesamten bisherigen Karriere zusammen. Zu den Entdeckungen gehört eine Schwachstelle in OpenBSD — einem Betriebssystem, das als eines der sichersten der Welt gilt und von Banken, Botschaften und Internetprovidern genutzt wird — die seit 27 Jahren im Code steckte. Es reichte, wenige Datenpakete an einen Server zu senden, um ihn zum Absturz zu bringen. Niemand hatte sie je gefunden.

Dann ist da FFmpeg, die Videobibliothek, auf die Hunderte globaler Anwendungen aufbauen. Mythos identifizierte eine Schwachstelle in einer einzigen Codezeile, die automatisierte Tools über fünf Millionen Mal analysiert hatten, ohne sie je zu entdecken. Sechzehn Jahre Unsichtbarkeit — von einem KI-Agenten in wenigen Minuten gelöst.

Und noch mehr: eine Verkettung von Schwachstellen im Linux-Kernel, die die vollständige Kontrolle über eine Maschine ermöglicht. Nicht eine einzige Lücke, sondern mehrere verknüpfte Schwächen in Sequenz — genau die Art von Angriff, die bis gestern nur staatlich gesponserte Hacker höchster Güte orchestrieren konnten.

Die verletzte Sandbox und die E-Mail im Park

Ein Vorfall machte in der Tech-Community die Runde und lässt sich kaum vergessen. Während einer Testsitzung war eine Vorversion von Mythos in einer isolierten Umgebung — einer Sandbox — mit begrenztem Zugang zu wenigen vordefinierten Diensten untergebracht worden. Das Modell wurde angewiesen, einen Ausbruch aus dem Container zu versuchen und den betreuenden Forscher zu benachrichtigen. Mythos fand einen Ausweg, indem es einen mehrstufigen Exploit entwickelte, eine Internetverbindung aufbaute und die Benachrichtigungs-E-Mail versandte. Soweit alles planmäßig.

Was nicht geplant war: Das Modell veröffentlichte anschließend die Details des Exploits auf öffentlich zugänglichen Websites — offenbar um eigenständig zu demonstrieren, dass die Aufgabe erfüllt worden war. Forscher Samuel Bowman entdeckte den Ausbruch, als er eine unerwartete E-Mail vom Modell erhielt, während er in einem Park ein Sandwich aß.

Die Reaktion der Tech-Community war unmittelbar. Zu den meistgeteilten Beiträgen zählte:

Project Glasswing: 100 Millionen Dollar für die Verteidigung des Internets

Angesichts all dessen traf Anthropic eine unerwartete Entscheidung: Statt die Entdeckungen zu verschweigen oder auf unbestimmte Zeit zu vertagen, versammelte das Labor die Unternehmen, die den Großteil der globalen digitalen Infrastruktur kontrollieren, an einem Tisch. AWS, Apple, Google, Microsoft, Cisco, CrowdStrike, NVIDIA, JPMorganChase, Palo Alto Networks und die Linux Foundation. Gemeinsam, mit einem einzigen Ziel: Mythos einzusetzen, um Schwachstellen zu finden und zu schließen, bevor jemand anderes es mit böswilliger Absicht tut.

Das Programm heißt Project Glasswing — inspiriert vom Schmetterling Greta oto, dessen transparente Flügel ihn nahezu unsichtbar machen, ähnlich wie bestimmte Bugs im Code. Das finanzielle Engagement ist konkret: 100 Millionen Dollar in Nutzungskrediten und 4 Millionen Dollar in direkten Spenden an Open-Source-Organisationen, darunter Alpha-Omega, OpenSSF und die Apache Software Foundation.

Das Modell wird nicht öffentlich verfügbar sein. Zumindest vorerst nicht. Anthropic hat offen erklärt, dass Claude Mythos Preview für eine breite Verteilung zu riskant ist und dass zunächst die notwendigen Sicherheitsmechanismen in einem kommenden Claude-Opus-Modell entwickelt werden müssen, bevor ein breiterer Zugang in Betracht gezogen wird.

Mehr zur Rolle von KI in der Blockchain-Sicherheit in unserem Schwerpunktbereich: Blockchain und Technologie.

Was sich jetzt ändert

Wir befinden uns in einer neuen Phase. Es geht nicht mehr darum, ob KI für Angriffe auf IT-Systeme eingesetzt werden wird, sondern wer sie zuerst einsetzt und mit welchen Absichten. Project Glasswing ist der Versuch, den Verteidigern einen strukturellen Vorsprung zu verschaffen, bevor vergleichbare Fähigkeiten für jedermann zugänglich werden — einschließlich Akteuren, die keinerlei Interesse daran haben, irgendjemanden zu schützen.

Wie Carlini im Präsentationsvideo des Projekts selbst sagte, besteht die Stärke von Mythos nicht nur darin, einzelne Lücken zu finden — sondern darin, sie zu verketten. Drei, vier, fünf Schwachstellen, die für sich allein bedeutungslos sind, aber in Sequenz eine Tür in jedes System öffnen. Das ist das Niveau, das wir heute erreicht haben.

Von Riccardo Curatolo Profilbild Riccardo Curatolo
Aktualisiert am
KI Hacken Nachrichten
Consent Preferences

Krypto-Nationen: Der Kampf um Geld, Macht und Code

Eine Dokumentation darüber, wie Bitcoin und Blockchain globale Finanzen und geopolitische Machtstrukturen verändern – von El Salvadors Bitcoin-Experiment bis zur EU-Regulierung und dem Aufstieg dezentraler Finanzsysteme.