Anthropic Lanza Opus 4.5: Más Potente, Eficiente y con Mejoras en la Experiencia |

Anthropic ha presentado Opus 4.5, su modelo insignia, que incorpora mejoras significativas en el rendimiento de codificación y optimizaciones en la experiencia del usuario. Estas actualizaciones buscan posicionar a Opus 4.5 como un competidor más sólido frente a los modelos más recientes de OpenAI.

Mejoras en la Experiencia del Usuario

Una de las mejoras más notables para los usuarios es la reducción de interrupciones abruptas en las conversaciones dentro de las aplicaciones (web, móvil y escritorio). Anteriormente, Claude podía detener las conversaciones de manera inesperada debido a limitaciones de longitud. Esta mejora en la gestión de la memoria dentro de una conversación se aplica a todos los modelos Claude actuales en las aplicaciones.

Los usuarios que experimentaban estos finales abruptos, a pesar de tener capacidad restante en su sesión y presupuesto de uso semanal, estaban alcanzando un límite estricto en la ventana de contexto (200,000 tokens). A diferencia de otras implementaciones de modelos de lenguaje grandes que simplemente eliminan los mensajes más antiguos del contexto al superar el máximo de la ventana, Claude optaba por finalizar la conversación para evitar que el usuario experimentara una conversación incoherente donde el modelo comenzaría a olvidar información relevante.

*Imagen referencial generada por IA.

Ahora, Claude implementará un proceso interno para resumir los puntos clave de las primeras partes de la conversación, descartando lo que considere superfluo y conservando lo esencial.

Los desarrolladores que utilizan la API de Anthropic pueden aplicar los mismos principios a través de la gestión y compactación del contexto.

Rendimiento de Opus 4.5

Opus 4.5 es el primer modelo en superar una puntuación de precisión del 80 por ciento, alcanzando un 80.9 por ciento en el benchmark SWE-Bench Verified. Esto lo sitúa por delante de GPT-5.1-Codex-Max de OpenAI (77.9 por ciento) y Gemini 3 Pro de Google (76.2 por ciento). El modelo destaca especialmente en tareas de codificación y uso de herramientas, aunque aún se encuentra por detrás de GPT-5.1 en razonamiento visual (MMMU).

Anthropic también afirma que Opus 4.5 es mucho menos susceptible a ataques de inyección de prompts en comparación con modelos Claude anteriores y otros modelos competidores como GPT-5.1 y Gemini 3 Pro. Sin embargo, la compañía advierte que ninguno de estos modelos ofrece un rendimiento perfecto en este aspecto.

Si bien las mejoras en el rendimiento son significativas, la optimización en el uso de tokens es una de las características más destacadas de Opus 4.5. Según la publicación del blog de Anthropic, Opus 4.5 iguala el mejor puntaje de Sonnet 4.5 en SWE-bench Verified con un nivel de esfuerzo medio, pero utilizando un 76% menos de tokens de salida. Con el nivel de esfuerzo más alto, Opus 4.5 supera el rendimiento de Sonnet 4.5 en 4.3 puntos porcentuales, utilizando un 48% menos de tokens.

Otras Actualizaciones

El lanzamiento de Opus 4.5 viene acompañado de nuevas funcionalidades para desarrolladores y usuarios.

La plataforma para desarrolladores ahora incluye un nuevo parámetro de “esfuerzo”, que permite a los desarrolladores ajustar con mayor precisión el equilibrio entre eficacia y uso de tokens.

Además, Claude Code ahora está disponible en las aplicaciones de escritorio de Claude. Anteriormente, solo se podía acceder a través de la línea de comandos, extensiones de IDE y la web. La interfaz de escritorio de Claude ahora cuenta con pestañas para alternar entre la experiencia de chat tradicional y la experiencia de Claude Code.

Finalmente, se ha realizado un cambio significativo en los precios de la API para Opus 4.5. El costo ahora es de $5 (entrada) / $25 (salida) por millón de tokens, una reducción considerable con respecto a los $15/$75 anteriores.

Contexto

El campo de la inteligencia artificial está en constante evolución, con empresas compitiendo para desarrollar modelos de lenguaje cada vez más potentes y eficientes. El lanzamiento de Opus 4.5 por parte de Anthropic se inscribe en esta carrera, buscando ofrecer una alternativa competitiva a los modelos líderes del mercado. Estas mejoras no solo impactan a los desarrolladores, sino que también prometen una experiencia más fluida y productiva para los usuarios finales.

La optimización del uso de tokens y la mejora en la gestión de conversaciones son aspectos cruciales para la adopción generalizada de estos modelos. Un menor costo y una mayor estabilidad en las interacciones pueden abrir nuevas posibilidades para la aplicación de la IA en diversos campos.

Claves y próximos pasos

Mejoras en la gestión de la memoria conversacional para evitar interrupciones.
Optimización en el uso de tokens, reduciendo costos para los usuarios.
Nuevas funcionalidades para desarrolladores, como el parámetro de “esfuerzo”.
Observar la respuesta de la comunidad de desarrolladores y usuarios a las nuevas funcionalidades.
Analizar cómo se compara Opus 4.5 con otros modelos en escenarios de uso real.
Estar atento a las futuras actualizaciones y mejoras de Anthropic y sus competidores.

FAQ

¿Cómo me afecta? Si usas Claude, la experiencia debería ser más fluida y estable. Si eres desarrollador, tendrás nuevas herramientas para optimizar tus aplicaciones.

¿Qué mirar a partir de ahora? La adopción de Opus 4.5 por parte de la comunidad y su rendimiento en diferentes casos de uso.

Fuente original: ver aquí