Research·Europe

Neuer Benchmark prüft KI-Videogeneratoren wie Physiklehrer – und gibt schlechte Noten

Global AI Watch · Editorial Team··5 min read
Neuer Benchmark prüft KI-Videogeneratoren wie Physiklehrer – und gibt schlechte Noten
Redaktionelle Einschätzung

WorldReasonBench will reshape video AI norms, potentially raising the bar for industry-wide AI capabilities by 2027.

Kernpunkte

  • 1Eine neue Benchmark namens WorldReasonBench prüft Videogeneratoren nicht an Bildqualität, sondern an physikalischer und logischer Plausibilität.
  • 2ByteDances Seedance 2.0 führt das Feld vor Veo 3.1 und Sora 2, kommerzielle Modelle scoren dabei rund doppelt so hoch wie Open-Source-Alternativen.
  • 3Logisches Schlussfolgern bleibt für alle Modelle die mit Abstand schwerste Disziplin.
  • 4Der Sprung vom Pixelgenerator zum echten Weltmodell bleibt aus.
  • 5Der Artikel Neuer Benchmark prüft KI-Videogeneratoren wie Physiklehrer – und gibt schlechte Noten erschien zuerst auf The Decoder.

Eine neue Benchmark namens WorldReasonBench prüft Videogeneratoren nicht an Bildqualität, sondern an physikalischer und logischer Plausibilität. ByteDances Seedance 2.0 führt das Feld vor Veo 3.1 und Sora 2, kommerzielle Modelle scoren dabei rund doppelt so hoch wie Open-Source-Alternativen. Logisches Schlussfolgern bleibt für alle Modelle die mit Abstand schwerste Disziplin. Der Sprung vom Pixelgenerator zum echten Weltmodell bleibt aus. Der Artikel Neuer Benchmark prüft KI-Videogeneratoren wie Physiklehrer – und gibt schlechte Noten erschien zuerst auf The Decoder.

Free Daily Briefing

Top AI intelligence stories delivered each morning.

Subscribe Free →

Explore Trackers