Claude Opus 4.8: qué trae el modelo nuevo y cómo sacarle jugo sin quemar tu plan
Anthropic sacó Opus 4.8 el 28 de mayo. Es más honesto, aguanta tareas largas sin que lo estés correteando y trae tres controles nuevos: effort, fast mode y dynamic workflows. Aquí está todo lo que cambió y cómo configurarlo, en español simple y al mismo precio que 4.7.
De un vistazo
Qué cambió respecto a 4.7
El slider de effort, la config estrella
Fast mode: 2.5× más rápido, 3× más barato
Dynamic workflows: cientos de subagentes
qué cambió · effort · fast mode · dynamic workflows · honestidad · los números · ficha técnica · dónde usarlo · prompts · para devs
Del modelo nuevo a sacarle jugo sin quemar tu plan, en una sentada
Primero lo que de verdad cambió respecto a 4.7, sin marketing: juicio más afilado, más honestidad y aguante para tareas largas. Luego los tres controles nuevos, uno por uno: el slider de effort (la config que más vas a usar, con el ángulo de cuándo subirlo y cuándo bajarlo para no quemar tu plan), el fast mode (2.5× más rápido y 3× más barato) y los dynamic workflows (cientos de subagentes en paralelo). Cerramos con por qué la honestidad es la mejora estrella, los números clave sin abrumar, una ficha técnica de referencia, dónde está disponible y cómo migrar de 4.7, prompts copia-pega para exprimirlo y una tarjeta corta para quien usa la API.
01 qué cambió
Qué es Opus 4.8 y qué cambió respecto a 4.7
El 28 de mayo de 2026 Anthropic sacó Claude Opus 4.8, el modelo insignia nuevo. No es un salto de números para impresionar: es una mejora directa sobre Opus 4.7 (que salió apenas unas semanas antes) en lo que de verdad importa cuando lo pones a trabajar. Lo resumieron como un “major quality-of-life update”: más rápido, más fácil de colaborar con él y mejor cargando contexto y estilo en sesiones largas.
Juicio más afilado
Toma mejores decisiones solo: elige el camino correcto con menos pasos en falso y menos idas y vueltas contigo.
Más honesto
La mejora estrella. Es ~4× menos probable que deje pasar fallas en su propio código sin avisarte, y marca lo que no está seguro en vez de inventarlo.
Aguanta tareas largas
Trabaja más tiempo solo, sin estarte pidiendo permiso a cada paso. Le mandas una feature o un barrido de bugs y avanza como un ingeniero con experiencia.
Atrapa sus propios errores
Se revisa antes de reportarte y te frena cuando tu plan no cuadra, en lugar de seguirte la corriente y romperse después.
Y aquí está la mejor parte: todo esto llega al mismo precio que 4.7 ($5 por millón de tokens de entrada y $25 de salida). Más capacidad sin pagar más. Por eso, para casi todos, actualizar a 4.8 es una decisión fácil. En las siguientes secciones vemos los tres controles nuevos que estrena y cómo configurarlos sin quemar tu plan.
02 la config estrella
Effort control: el slider que decide cuánto piensa
Esta es la configuración que más vas a tocar. Effort control es una perilla nueva que aparece junto al selector de modelo en claude.ai y Cowork (en Claude Code se ajusta con /effort). Subes el effort y Claude piensa más seguido y más profundo, así que responde mejor. Lo bajas y responde más rápido y consume tu límite más despacio. Sencillo: más esfuerzo = mejor respuesta pero más gasto; menos esfuerzo = más rápido y más barato.
Piensa lo mínimo. Para lo simple y para gastar poco de tu límite.
Un poco más de razonamiento sin tardarse de más.
El balance que eligió Anthropic: buena calidad sin pasarse de gasto.
Piensa más seguido y más profundo. Para problemas que lo ameritan.
El máximo esfuerzo. Más lento y más caro, pero la mejor respuesta.
Por defecto viene en High, y eso ya es buena noticia: en tareas de código, High gasta más o menos los mismos tokens que el 4.7 de antes, pero con mejor resultado. O sea, no tienes que tocar nada para estar bien. El truco —el ángulo de la casa— es saber cuándo subirlo y cuándo bajarlo:
↑ Súbelo (Extra o Max) cuando…
- Un problema gordo o código que toca varias piezas a la vez.
- Una decisión de arquitectura o algo que, si sale mal, cuesta caro deshacer.
- Debugging difícil donde necesitas que razone a fondo, no que adivine.
- Tareas largas y autónomas que quieres que avance solo y bien.
↓ Bájalo (Low o Medium) cuando…
- Tareas simples y repetitivas: renombrar, formatear, un texto corto.
- Preguntas directas que no necesitan que piense mucho.
- Quieres la respuesta ya, rápida.
- Vas corto de límite y no quieres quemar tu plan del mes.
La regla simple: deja High para el día a día, sube a Max cuando el problema lo amerite, y baja a Low en lo tonto y repetitivo. Así le sacas lo bueno sin tronarte el plan en tareas que no lo necesitaban. En Claude Code, además, los planes traen límites más altos para trabajo largo.
03 más rápido y más barato
Fast mode: el mismo modelo, 2.5× más veloz
Fast mode es el mismo Opus 4.8 pero soltando la respuesta 2.5× más rápido. No es un modelo más chico ni más tonto: es el mismo cerebro, solo que escupe el resultado más veloz. Y la novedad grande de esta versión es el precio: para Opus 4.8 el fast mode quedó 3× más barato que antes ($10 por millón de entrada y $50 de salida).
Prenderlo es de un clic. En Claude Code lo activas con el comando /fast (y lo apagas con el mismo). En la API se manda con el parámetro speed: "fast". Sigue siendo research preview: para la API quizá tengas que entrar a la lista de espera o hablarlo con tu account manager.
Prender (o apagar) fast mode en Claude Code
/fastCuándo te conviene:
- Iterar rápido: probar una idea, ver el resultado, ajustar, repetir.
- Tareas grandes donde la velocidad de salida se nota (mucho texto o código).
- Cuando estás en flow y no quieres esperar entre respuesta y respuesta.
04 a otra escala
Dynamic workflows: cientos de subagentes en paralelo
Esta es la función más espectacular, y la que estrena Opus 4.8 en Claude Code. Los dynamic workflows sirven para tareas gigantes que un solo Claude trabajando en línea recta tardaría una eternidad en hacer. La idea es simple de explicar aunque por dentro sea potente:
- 01
Hace un plan
Claude descompone la tarea enorme en muchos pedazos que se pueden atacar en paralelo.
- 02
Lanza cientos de subagentes
Abre cientos de ayudantes que trabajan al mismo tiempo, cada uno en su pedazo, dentro de una sola sesión.
- 03
Verifica antes de reportar
Revisa el resultado de todos (apoyándose en tus tests) y solo entonces te entrega el trabajo terminado.
Piénsalo como pasar de un trabajador a un equipo entero coordinado por un jefe que revisa todo al final. Y como 4.8 aguanta más tiempo solo, cada subagente puede correr más largo sin desbarrancarse. Para qué sirve de verdad:
- Migraciones de código enormes: cientos de miles de líneas, de arranque hasta el merge.
- Auditorías completas: revisar todo un proyecto buscando un patrón o un problema.
- Barridos de bugs por muchos archivos a la vez.
Letra chica: es research preview y está disponible en los planes Enterprise, Team y Max de Claude Code. Si estás en Pro, todavía no te toca, pero el resto de Opus 4.8 (incluido el effort control) sí lo tienes.
05 la mejora estrella
Más honesto: por qué esto importa más que cualquier benchmark
Anthropic lo dijo claro: una de las mejoras más prominentes de Opus 4.8 es su honestidad. Suena suave, pero es lo que más cambia tu día a día. Un modelo que te dice la verdad sobre su propio trabajo vale más que uno que saca un punto extra en una prueba y luego te miente con cara seria.
Marca sus propias fallas
~4× menos probable que deje pasar un error en el código que él mismo escribió sin decírtelo.
Avisa cuando no está seguro
En vez de afirmar algo dudoso con tono confiado, te dice “esto no lo puedo verificar”.
No inventa para quedar bien
Menos respuestas bonitas por fuera y huecas por dentro. Menos afirmaciones sin sustento.
Te frena planes flojos
Empuja de vuelta cuando tu enfoque no cuadra, en lugar de seguirte la corriente.
En las evaluaciones de alineación también marcó nuevos máximos en rasgos prosociales (apoyar tu autonomía y actuar en tu mejor interés) y bajó los comportamientos desalineados respecto a 4.7. ¿Por qué te importa en la práctica? Porque puedes confiarle tareas largas sin revisarle cada línea: si algo le quedó dudoso, te lo va a decir. En la sección de prompts hay uno para encender esa honestidad a propósito.
06 los números
Lo que mejoró, en números (sin abrumar)
Si los benchmarks te marean, quédate con esto: Opus 4.8 manda en agentes de código, razonamiento, uso de la computadora y trabajo profesional. Estos son los cuatro datos que de verdad importan, en lenguaje de a pie:
84%
Online-Mind2Web
Navegar y usar la compu como un humano. El más alto de todos los probados.
69.2%
SWE-Bench Pro
Coding agéntico. Subió desde 64.3% en 4.7.
1.º
Legal Agent
Primer modelo en romper el 10% en el estándar all-pass.
100%
Super-Agent
Único en completar todos los casos de punta a punta, al mismo costo.
Hay un dato más que vale oro para quien paga por token: en las pruebas de Databricks (Genie), 4.8 dio un salto de razonamiento 61% más barato en tokens que 4.7. Mejor y más eficiente a la vez. Los cientos de evals completas viven en el System Card oficial.
07 de referencia
Ficha técnica: los números del modelo de un vistazo
Para tenerlo a la mano cuando lo necesites. Nada que memorizar: es la tabla de referencia de Opus 4.8.
Model ID (API)
claude-opus-4-8
Ventana de contexto
1.000.000 tokens (200.000 en Microsoft Foundry)
Salida máxima
128.000 tokens
Precio estándar
$5 entrada · $25 salida (por millón de tokens)
Fast mode
$10 entrada · $50 salida — 2.5× más rápido
Caché mínimo
1.024 tokens (bajó desde 4.7)
Razonamiento (thinking)
Adaptativo: decide solo cuánto pensar en cada turno
Effort por defecto
"high" en todas las superficies, incluido Claude Code
Salió
28 de mayo de 2026
Dato útil: el contexto de 1 millón de tokens significa que le puedes pasar proyectos enteros o documentos larguísimos sin que pierda el hilo. Y el razonamiento adaptativo decide solo cuánto pensar en cada turno, así que no desperdicia tokens pensando de más cuando la pregunta es simple.
08 dónde y cómo
Dónde está disponible y cómo migrar de 4.7
La buena: salió disponible en todos lados el mismo día. No tienes que esperar a que llegue a tu plataforma. Estos son los lugares donde ya lo tienes:
claude.ai
Pro, Max, Team y Enterprise. El effort control aparece en todas.
Claude Code
Soporte completo. Dynamic workflows en Enterprise, Team y Max.
Claude API
Con el model string claude-opus-4-8, disponible de inmediato.
Nubes
Amazon Bedrock (en vivo), Google Vertex AI y Microsoft Foundry.
GitHub Copilot
Pro+, Business y Enterprise.
Otros
Cursor, OpenRouter y más, prendidos en o cerca del lanzamiento.
¿Y migrar desde 4.7? Es de las migraciones más tranquilas que vas a ver: sin breaking changes para casi todo el código existente.
- 01
Cambia el nombre del modelo a claude-opus-4-8. Para la mayoría del código, no hay nada más que tocar.
- 02
Revisa el effort: ahora viene en high por defecto. Bájalo donde quieras ahorrar.
- 03
Si usas la API en agentes, aprovecha el caché más bajo (1.024 tokens) y los mensajes de sistema a mitad de conversación.
09 listos para copiar
Prompts para exprimir lo nuevo de 4.8
Saber que es más honesto y aguanta más no sirve de nada si no se lo pides bien. Estos cuatro prompts encienden a propósito sus mejoras: su honestidad, su juicio para frenarte y su aguante para tareas largas. Cópialos, rellena las {llaves} con tu caso y pégaselos en Claude Code, Cowork o claude.ai.
01 · Aprovecha la honestidad: que te marque sus dudas
La mejora estrella de 4.8 es que es ~4× menos probable que deje pasar fallas en su propio trabajo. Este prompt la enciende a propósito: antes de cerrar, te lista lo que no le quedó claro y lo que él mismo marcaría como flojo.
Antes de darme esto por terminado, sé honesto conmigo: 1. Lista todo lo que NO te quedó claro o donde tuviste que suponer algo. 2. Marca las partes de tu propio resultado que tú mismo señalarías como flojas, riesgosas o sin probar. 3. Si hay algo que no puedes verificar, dímelo en vez de afirmarlo como si fuera seguro. No quiero una respuesta que se vea bien y por dentro tenga huecos. Prefiero saber dónde están los huecos.
02 · Que te frene si tu plan no cuadra
Opus 4.8 tiene mejor juicio y empuja de vuelta cuando el plan no cierra. Úsalo de copiloto crítico antes de invertir horas: que cuestione tu enfoque en lugar de seguirte la corriente.
Te voy a explicar lo que quiero hacer y cómo pienso hacerlo. Antes de ejecutar nada:
1. Dime si el plan tiene sentido o si hay una forma claramente mejor.
2. Señala los supuestos míos que podrían estar mal.
3. Si crees que me voy a meter en un problema, fréname y dime por qué.
No me sigas la corriente solo por complacerme. Prefiero que me corrijas ahora a descubrirlo después.
Mi objetivo: {describe qué quieres lograr}.
Mi plan: {describe cómo pensabas hacerlo}.03 · Mándale una tarea larga sin estarlo correteando
4.8 aguanta sesiones largas sin pedir permiso a cada paso. Este prompt le da el encargo completo, las reglas y dónde parar, para que avance solo y te reporte al final, no cada cinco minutos.
Te voy a encargar una tarea larga. Trabájala de corrido sin pedirme confirmación en cada paso; solo párate si llegas a una decisión que de verdad cambia el rumbo.
La tarea: {describe el encargo completo}.
Reglas:
- Haz un plan corto primero y luego ejecútalo.
- Verifica tu propio trabajo antes de reportarme (corre lo que tengas para correr).
- Al final, dame un resumen de qué hiciste, qué te faltó y qué dudas te quedaron.
Avísame solo cuando termines o cuando estés genuinamente atascado.04 · Bájale el effort a lo simple: nada de sobre-ingeniería
Para tareas chicas no necesitas que piense de más (eso te quema el plan). Díselo explícito: solución directa, sin capas ni abstracciones que no pediste. Y en la app, baja el slider de effort a Low o Medium.
Esta es una tarea simple, no la pienses de más. Dame la solución más directa que funcione:
- Nada de abstracciones, capas ni librerías que no te pedí.
- Nada de "por si en el futuro": resuelve lo que estoy pidiendo hoy.
- Si la respuesta cabe en pocas líneas, que quepa en pocas líneas.
La tarea: {describe la tarea simple}.10 para quien usa la API
La tarjeta para devs: los cambios de API en corto
Si no programas con la API, esta sección te la puedes saltar sin perderte nada. Si sí, aquí está lo que cambió, sin rodeos:
{
"model": "claude-opus-4-8",
"speed": "fast", // opcional: fast mode
"effort": "high", // default; "low" | "medium" | "high" | "xhigh" | "max"
"thinking": { "type": "adaptive" }
}model: "claude-opus-4-8"El string nuevo. Cambiarlo es el 99% de la migración.
speed: "fast"Activa el fast mode (2.5× más rápido).
effort: "high"Por defecto en todas las superficies. Bájalo a "low" o "medium" para ahorrar.
thinking: { type: "adaptive" }Único modo. Decide solo cuánto pensar por turno.
- Mensajes de sistema a mitad de conversación: ahora puedes meter un role: "system" después de turnos del usuario sin romper el prompt cache. Gran ahorro en loops largos de agentes.
- El caché mínimo bajó a 1.024 tokens (antes era más alto), así que cacheas trozos más chicos.
- Los parámetros de sampling deben quedarse en sus defaults: si mandas valores no estándar, devuelve error 400.
- Las categorías de rechazo (refusal) ahora vienen documentadas, para que enrutes mejor cuando se niega.
Qué viene después
Anthropic ya dejó ver la siguiente parada: Claude Mythos, una clase de modelo de inteligencia todavía más alta. Hoy está en preview con un puñado de organizaciones (enfoque en ciberseguridad, vía Project Glasswing) y, con más salvaguardas en camino, esperan abrirlo a todos los clientes en las próximas semanas. Mientras tanto, Opus 4.8 es lo más capaz que tienes a la mano —al mismo precio de siempre—.
Fuentes oficiales
Anuncio oficial de Opus 4.8
La fuente de verdad de Anthropic: qué mejoró, effort control, fast mode y dynamic workflows, en sus propias palabras.
What's new in Claude Opus 4.8 (docs)
La doc técnica para la API: model string, parámetros, caché mínimo de 1.024 tokens y los mensajes de sistema a mitad de conversación.
Dynamic Workflows en Claude Code
El blog donde explican cómo Claude planea, lanza cientos de subagentes en paralelo y verifica su trabajo antes de reportar.
Guía de Opus 4.7
El modelo anterior: cuándo sí y cuándo no
Comandos de Claude Code
Dónde vive /fast y el resto del arsenal
Escalar tu app
Prepárala antes de lanzar, con prompts listos
¿Por dónde empezar hoy?
Si nada más quieres lo nuevo de un jalón: abre claude.ai o Claude Code, confirma que estás en Opus 4.8 y juega con el slider de effort (déjalo en High y bájalo en lo simple). Para sentir la mejora de honestidad, pégale el primer prompt en tu próxima tarea. Esta guía vive en la bóveda de tododeia.