Tuesday, November 25, 2025

¡La IA que rompió récords ya está aquí!

Opus 4.5 es el primer modelo en romper la barrera del 80% en SWE-Bench verificado, el estándar de oro para medir capacidades reales de codificación. Para que se entienda: este benchmark no evalúa teoría, evalúa si el modelo puede resolver problemas reales de GitHub.

No comments:

Post a Comment

runway gen 45 avances en generacin de video por ia

Runway no solo aumentó la cantidad de datos, optimizaron cómo el modelo aprende y cómo procesa la información física del mundo real. El re...