Research·Europe

Neuer Benchmark zeigt: Claude Mythos und GPT-5.5 können echte Browser-Exploits selbstständig entwickeln

Global AI Watch · Editorial Team·16 May 2026·4 min read

Redaktionelle Einschätzung

ExploitBench may catalyze new cybersecurity regulations, similar to ImageNet's impact on AI vision standards.

Kernpunkte

1Forscher der Carnegie Mellon University haben mit ExploitBench einen neuen Benchmark vorgestellt, der misst, wie weit KI-Agenten bei der Ausnutzung realer Sicherheitslücken in Googles V8-Engine kommen.
2Mythos liegt deutlich vor GPT-5.5, aber das kostet.
3Der Artikel Neuer Benchmark zeigt: Claude Mythos und GPT-5.5 können echte Browser-Exploits selbstständig entwickeln erschien zuerst auf The Decoder.

Forscher der Carnegie Mellon University haben mit ExploitBench einen neuen Benchmark vorgestellt, der misst, wie weit KI-Agenten bei der Ausnutzung realer Sicherheitslücken in Googles V8-Engine kommen. Mythos liegt deutlich vor GPT-5.5, aber das kostet. Der Artikel Neuer Benchmark zeigt: Claude Mythos und GPT-5.5 können echte Browser-Exploits selbstständig entwickeln erschien zuerst auf The Decoder.

Free Daily Briefing

Top AI intelligence stories delivered each morning.

Subscribe Free →

Analyse

Watch-Score90/100

Disruptionsindex7/10

Souveräne Relevanz6/10

Auswirkungswert6/10

StimmungWarnung

DringlichkeitHoch

Gewinner

Carnegie Mellon University

Claude Mythos

Cybersecurity firms

Verlierer

GPT-5.5 developers

Historischer Kontext

Similar to the release of ImageNet in 2012, which transformed AI image capabilities. Unlike that case, ExploitBench focuses on security vulnerabilities.

Vergleichsanalyse

Compared to ImageNet, ExploitBench differs in focusing on security vulnerabilities instead of image data.

Redaktionelle Prognose

Based on increased cybersecurity threats, expect regulatory focus on AI exploitation by Q1 2027.

Redaktionelle Analyse — keine Finanz- oder Rechtsberatung

Themen

AI security benchmarking V8 engine cybersecurity

Wichtige Akteure

Carnegie Mellon UniversityClaude MythosGoogle