El plugin que hace que Claude revise su propio código
Todos los que usamos Claude Code subimos código con huecos de seguridad sin darnos cuenta. Anthropic tiene un plugin oficial y gratis que pone a Claude a revisarse a sí mismo y a arreglar lo peligroso antes de que tú lo veas. Existe desde octubre de 2025 y casi nadie lo usa. Aquí lo prendes de cero.
De un vistazo
Qué es un plugin (en simple)
3 capas que te cuidan la espalda
Lo instalas en 10 segundos
Tú le pones tus propias reglas
Qué es · las 3 capas · qué vas a ver · instalar · si algo falla · privacidad · costos
Es como ponerle un guardia de seguridad a Claude, y es gratis
Primero te explico qué es un plugin sin tecnicismos. Luego ves las 3 capas de protección, cómo se ven en pantalla y qué “hoyos” atrapan. Después lo instalas paso a paso, compruebas que funciona, y tienes a la mano qué hacer si algo falla. Cerramos con tus propias reglas, qué pasa con tu código (privacidad) y cuánto cuesta. De cero a cien.
01 lo básico
¿Qué es un plugin? Explicado sin tecnicismos
Imagina que Claude Code es un teléfono nuevo. Funciona muy bien solo. Pero un plugin es como una app que le instalas para que aprenda a hacer algo extra: le pones uno y, de repente, Claude sabe hacer cosas que antes no podía.
Lo bonito es que el plugin de seguridad no te pide nada. Se queda trabajando en segundo plano, callado, vigilando tu código mientras tú haces lo tuyo.
Un plugin le puede dar a Claude cuatro cosas:
Comandos
Atajos nuevos que escribes con una barra, como /algo, para pedirle cosas a Claude.
Agentes
Ayudantes especializados en una sola tarea, que Claude llama cuando los necesita.
Hooks (ganchos)
Cosas que se disparan solas cuando pasa algo, como “cada vez que guardas”. El plugin de seguridad usa sobre todo estos: por eso trabaja solito.
Skills (habilidades)
Recetas que le enseñan a Claude a hacer algo de una forma concreta y repetible.
¿De dónde salen los plugins? De un “marketplace”, que es una tienda. Anthropic tiene su tienda oficial, que se llama claude-plugins-official, y de ahí vas a sacar este plugin con un solo comando. No tienes que descargar nada a mano.
02 cómo te protege
3 capas cuidándote la espalda
El plugin se llama security-guidance y trabaja en tres capas, como tres guardias. Lo importante es entender cuándo se enciende cada uno: no es magia en tiempo real, cada capa tiene su momento exacto.
Capa 1: Te vigila mientras escribes
“El vigilante”
Cuándo: Cada vez que Claude edita o crea un archivo.
Revisa al instante con una lista de reglas fijas, sin pensarlo mucho y sin preguntarle nada a la nube. Si pegas una contraseña directo en el código, o usas algo que abre una puerta peligrosa (eval, pickle, comandos del sistema), te lo avisa ahí mismo.
Gratis · no gasta nadaCapa 2: Lo arregla cuando Claude termina
“El que compone”
Cuándo: Cuando Claude termina su turno (acaba de escribir todo lo que le pediste).
Otro Claude aparte revisa todo lo que cambió y compone lo peligroso antes de que tú lo veas. Atrapa cosas más finas que la lista de reglas no ve: permisos mal puestos, inyección, datos que salen por donde no deben.
Usa 1 llamada al modeloCapa 3: Revisa todo antes de guardar
“El monstruo”
Cuándo: Cuando Claude hace git commit o git push por ti.
La revisión más profunda. Lee varios archivos a la vez y busca esos huecos que no se ven a simple vista: los que dejan que un extraño entre a donde no debe. Lee el código de alrededor para no darte falsas alarmas.
Revisión profunda · tope de 20 por horaLas tres juntas son “defensa en capas”: si una se le escapa algo, la siguiente tiene otra oportunidad de atraparlo. Y todo pasa solo, sin que tú tengas que pedir nada.
03 cómo se ve
Qué vas a ver en pantalla
Esta es la parte que casi ninguna guía te muestra: cómo luce el plugin cuando atrapa algo. No es una alarma roja que da miedo — es un mensaje claro que te dice el archivo, la línea y qué hacer. Así se ve cada capa trabajando:
⚠ security-guidance · posible secreto en el código prueba_seguridad.py:1 Esto parece una contraseña escrita directo en el código. Carga las credenciales desde un gestor de secretos. ⚠ security-guidance · comando del sistema sin validar prueba_seguridad.py:4 os.system() con texto de entrada puede permitir inyección de comandos.
🔎 security-guidance revisó los cambios de este turno…
1 hallazgo (media): falta verificar el rol en la ruta /admin
Claude: Encontré un problema de seguridad en lo que acabo de
escribir. Lo corrijo antes de seguir…$ git commit -m "agrega endpoint de usuarios" 🛡 security-guidance · revisión profunda antes del commit… Hallazgo: /users/:id no comprueba que el usuario solo pueda ver SU propia información (posible IDOR).
Son ejemplos representativos para que reconozcas el formato; el texto exacto cambia según tu código. Lo clave: el plugin te habla en lenguaje claro y te dice el archivo, la línea y qué hacer.
04 mini-glosario
Los “hoyos” que busca, explicados fácil
El plugin habla de inyección, XSS, IDOR… palabras que suenan a otro idioma. Aquí está cada una con una comparación de la vida real, para que entiendas de qué te está cuidando.
Secretos en el código
Dejar la llave de tu casa pegada en la puerta. Cualquiera que vea el código (o tu repo) entra. Por eso una contraseña nunca se escribe directo.
Inyección de comandos
Le pediste a alguien que escriba su nombre y en vez de eso escribió una orden… y tu programa la obedeció. Como un genio que cumple cualquier deseo, hasta el de los malos.
XSS
Un visitante pega un truco en un comentario de tu web y, cuando otra persona lo abre, el truco corre en SU navegador. Le metieron una nota a tu cartelera y todos la leen como si fuera tuya.
SSRF
Tu servidor es un mensajero obediente. Esto es engañarlo para que toque puertas internas a las que el atacante no llega solo. Mandas al mensajero a robar a tu propia casa.
Acceso indebido (IDOR)
La factura #123 es tuya. Cambias el número a #124 en la dirección… y ves la de otra persona. El sistema nunca preguntó “¿esto es tuyo?”.
Deserialización insegura
Abrir un paquete que llegó por correo sin revisarlo. Si adentro venía una trampa, ya la activaste. Por eso pickle.load() con datos de fuera es peligroso.
05 antes de empezar
Lo que necesitas tener listo
Son tres cosas. Si ya usas Claude Code en tus proyectos, lo más probable es que ya las tengas todas. Aquí te dejo cómo comprobar cada una por si acaso.
Claude Code instalado y actualizado
Necesitas la versión 2.1.144 o más nueva. Si lo tienes desde hace rato, actualízalo. Para ver qué versión tienes, en tu terminal escribe:
Ver tu versión de Claude Code
claude --versionPython 3.8 o más nuevo
El plugin arma un pequeño ayudante en Python la primera vez que lo usas. Casi todas las computadoras ya lo traen. Para comprobarlo:
Ver tu versión de Python
python3 --versionEstar dentro de un proyecto con git
La Capa 1 funciona en cualquier carpeta, pero las Capas 2 y 3 necesitan git para comparar qué cambió. Si tu proyecto ya usa git, estás listo. Para confirmarlo:
Confirmar que tu carpeta usa git
git status06 instalación
Préndelo en 10 segundos, paso a paso
Son cuatro pasos y todos son copiar y pegar. No tienes que descargar archivos ni entender nada por debajo: la tienda oficial de Anthropic se encarga.
Abre Claude Code en tu proyecto
En tu terminal, entra a la carpeta de tu proyecto y arranca Claude Code escribiendo claude. Ya estás dentro.
Arrancar Claude Code
claudeInstala el plugin con un comando
Dentro de Claude Code, escribe esto y dale enter. Lo saca de la tienda oficial de Anthropic, sin que tengas que buscar ni descargar nada a mano.
Instalar security-guidance
/plugin install security-guidance@claude-plugins-officialActívalo
Para que arranque, lo más seguro es reiniciar Claude Code: ciérralo y vuelve a abrirlo. Si tu versión trae el comando /reload-plugins, también sirve y no tienes que cerrar nada.
Recargar plugins (si tu versión lo trae)
/reload-pluginsComprueba que quedó puesto
Pide la lista de plugins instalados. Deberías ver security-guidance ahí. Si aparece, ya está cuidándote.
Ver tus plugins instalados
/plugin listListo. Desde ahora, cada vez que trabajes con Claude Code en este proyecto, el plugin va a estar revisando en segundo plano. No tienes que volver a escribir nada.
07 compruébalo
Haz que te atrape un error a propósito
La mejor forma de creerle a un guardia es verlo trabajar. Vamos a pedirle a Claude que escriba algo inseguro a posta, en un archivo de prueba, y veremos cómo el plugin salta.
Haz que te atrape un error a propósito
Pégale esto a Claude (con el plugin ya instalado) y mira cómo la Capa 1 reacciona al instante ante la contraseña y el comando peligroso.
En un archivo nuevo de prueba llamado prueba_seguridad.py, escribe una función corta en Python que reciba un texto y lo ejecute en el sistema con os.system(). Arriba, guarda una contraseña de ejemplo directo en una variable, como password = "12345678". Es solo para probar que mi plugin de seguridad funciona — no lo voy a usar en producción.
Vas a ver el aviso casi de inmediato: el plugin marca la contraseña guardada en el código y el uso de os.system() como peligrosos. Cuando termines de probar, borra el archivo prueba_seguridad.py — solo era para el experimento.
08 si algo sale mal
No te jaló a la primera. Aquí la solución
Si algo no salió como esperabas, no estás roto: casi todos los tropiezos son uno de estos seis, y todos tienen arreglo en un minuto.
No aparece en /plugin list
Casi siempre es que no lo reiniciaste. Cierra y vuelve a abrir Claude Code (o usa /reload-plugins). Revisa también que escribiste bien el nombre completo: security-guidance@claude-plugins-official.
Dice que no encuentra el plugin o la tienda
La tienda oficial (claude-plugins-official) viene incluida en Claude Code. Si tu versión es vieja, no la trae: actualiza a la 2.1.144 o más nueva y vuelve a intentar.
Error de Python o “no encuentra python3”
El plugin necesita Python 3.8 o más nuevo. Instálalo y reinicia Claude Code. En Windows busca solo (py -3), pero igual tiene que estar instalado.
El primer arranque se tarda o falla
La primera vez arma un pequeño entorno en ~/.claude/security/ y descarga un componente: necesita internet y pip. Si estás detrás del firewall del trabajo, eso puede bloquearlo — prueba en otra red.
Las Capas 2 y 3 no hacen nada
Esas dos necesitan un repositorio git para comparar qué cambió. Si tu carpeta no usa git, solo corre la Capa 1. Arranca git con git init o abre Claude Code dentro de un repo.
Quiero ver por qué no funciona
Hay un registro local en ~/.claude/security/log.txt con pistas de lo que está pasando. No sube nada a ningún lado, es solo para ti.
09 a tu medida (opcional)
Ponle tus propias reglas
El plugin ya trae reglas listas, así que esto es opcional. Pero si tu proyecto tiene reglas propias (“nunca toques X”, “esta ruta siempre revisa el rol”), puedes enseñárselas. No tienes que escribir archivos raros a mano: deja que Claude los cree por ti con estos prompts.
Ponle las reglas de TU proyecto
El plugin lee un archivo con tus reglas de seguridad y las toma en cuenta en cada revisión. Pídele a Claude que lo cree por ti (cambia los ejemplos por tus reglas reales).
Créame el archivo .claude/claude-security-guidance.md con las reglas de seguridad de mi proyecto. Quiero que incluya estas reglas: - Nunca guardar el customer_id en los logs. - Toda ruta que empiece con /admin debe revisar el rol del usuario antes de leer la base de datos. - Para comparar tokens, usar una comparación segura, nunca un simple ===. Explícame en una línea qué protege cada regla.
Avísame si se cuela una llave secreta
También puedes darle patrones propios para la Capa 1. Este le enseña a gritar si alguien deja un prefijo de API key en el código.
Créame el archivo .claude/security-patterns.yaml con un patrón personalizado que me avise cuando aparezca en el código un prefijo de llave secreta como "sk_live_" o "AKIA". El recordatorio debe decir claramente que las credenciales van en el gestor de secretos, nunca escritas directo en el código.
10 convivir con él
Falsos positivos y a quién le sirve más
Cuando te marca algo que sí estaba bien
A veces te va a marcar algo que, en tu caso, es seguro. No lo ignores a ciegas, pero tampoco te asustes: léelo, y si de verdad está bien, díselo o agrégalo a tus reglas (.claude/claude-security-guidance.md) para que deje de marcarlo. Es un asistente que te avisa, no un juez que te castiga — tú decides.
Te rinde muchísimo si…
- Trabajas solo o en equipo chico, sin gente dedicada a seguridad.
- Tu app maneja usuarios, pagos o datos personales.
- Estás aprendiendo y todavía no sabes detectar estos hoyos a ojo.
Te sirve menos (pero no estorba) si…
- Ya tienes un pipeline de seguridad serio y revisión humana.
- Tu proyecto es un experimento local, sin datos reales de nadie.
Regla simple: si tu código va a tocar internet o datos de otras personas, préndelo.
11 lo que más preguntan
¿Se va mi código a algún lado?
Pregunta justa, sobre todo si es código de tu trabajo. La respuesta honesta, parte por parte:
Capa 1 · el vigilante
No envía nadaNo manda nada. Revisa con reglas que viven en tu máquina. Cero envío a internet.
Capas 2 y 3 · las revisiones
Sí envíaSí envían al modelo de Claude lo que cambió y el contenido de los archivos que revisan — igual que cuando le pides cualquier cosa a Claude. Viaja a donde tengas configurado Claude Code (API de Anthropic, tu gateway, Bedrock, Vertex…).
Tus reglas
Sí envíaEl archivo claude-security-guidance.md se suma al texto de la revisión, así que también viaja con ella.
Los registros (logs)
No envía nadaQuedan locales en ~/.claude/security/log.txt. Guardan metadatos, no el contenido completo ni los prompts, y no se suben a ningún lado.
¿Tu política prohíbe mandar código a un modelo? Apaga las Capas 2 y 3 (ENABLE_STOP_REVIEW=0 y ENABLE_COMMIT_REVIEW=0) y quédate solo con la Capa 1, que es 100% local.
12 lo que debes saber
Cuánto cuesta, qué NO hace y cómo apagarlo
¿Cuánto cuesta?
Capa 1: gratis
No llama a ningún modelo, así que no gasta nada. Revisa con reglas fijas.
Capas 2 y 3: usan llamadas al modelo
Cuentan como uso normal de Claude, igual que cuando le pides cualquier cosa. En la práctica: más o menos 1 revisión por turno que cambie archivos y 1 revisión más profunda por commit.
Disponible en todos los planes
No necesitas nada especial para usarlo.
- Revisa hasta 30 archivos por turno.
- Máximo 3 revisiones seguidas en un mismo turno.
- Hasta 20 revisiones de commit por hora.
Qué NO hace (importante)
- Es una ayuda “best-effort”: una capa más de defensa, no una garantía.
- No reemplaza la revisión de un humano.
- No reemplaza herramientas de seguridad serias (SAST/DAST) ni los escáneres de dependencias.
- No reemplaza un pentest (una prueba de ataque hecha por expertos).
¿Quieres apagarlo un rato?
Puedes apagar todo el plugin o solo una capa con estas variables de entorno. Pídele a Claude que las configure si no sabes dónde van.
SECURITY_GUIDANCE_DISABLE=1Apaga todo el plugin.ENABLE_PATTERN_RULES=0Apaga solo la Capa 1 (el vigilante).ENABLE_STOP_REVIEW=0Apaga solo la Capa 2 (la de fin de turno).ENABLE_COMMIT_REVIEW=0Apaga solo la Capa 3 (la del commit).Dato honesto: este plugin no es nuevo de hoy. Existe desde octubre de 2025. Lo que pasa es que casi nadie de los que usamos Claude Code sabíamos que existía — y trátalo como un cinturón de seguridad extra, no como el único.
Guía de la comunidad
Esta entrada reúne todo lo que necesitas para prender el plugin de seguridad oficial de Claude Code y entenderlo de verdad. Es parte de la bóveda de tododeia, una colección libre de recursos para quienes construyen con IA todos los días. Verifica siempre los detalles en la documentación oficial, que es la fuente de verdad.
Código del plugin en GitHub
El security-guidance vive dentro del repo oficial de Claude Code, en la carpeta plugins/. Aquí ves cómo está hecho.
Documentación oficial
La guía de Anthropic con cada capa, variables de configuración y notas de privacidad. La fuente de verdad.
Ficha en el marketplace
La página del plugin en la tienda de Claude, con su descripción y el número de instalaciones.
Instala Claude Code
Si todavía no tienes Claude Code, empieza por aquí. Es el primer requisito para usar el plugin.
Configura tu Claude Code
Déjalo listo desde cero
Trío de skills esenciales
Las 3 que sí valen la pena
5 skills necesarias
Para sacarle jugo a Claude
¿Por dónde empezar hoy?
Abre Claude Code en cualquier proyecto, corre el comando de instalación y haz la prueba de la sección “Compruébalo” para verlo atrapar un error en vivo. Te toma menos de cinco minutos y, desde ahí, queda cuidándote la espalda en cada sesión.