SBC v0.1 — Baseline Controls Sello SafetifAI Verified

¿Qué incluye el SafetifAI Baseline Controls (SBC v0.1)?

Nuestro marco mínimo de verificación para flujos y agentes de IA. Evalúa 5 familias de control, puntúa el riesgo por dimensión y documenta la evidencia. No prometemos “cero riesgo”: trabajamos con umbrales, alcance y fecha de expiración en una verificación privada (attestation).

1) Datos & Privacidad

Qué verificamos

  • Minimización de datos y uso estrictamente necesario.
  • Enmascarado/anonimización en prompts, salidas y logs.
  • Bloqueo de peticiones de PII y derivación a canal verificado.
  • Retención y borrado de logs (p. ej., ≤ 90 días).

Ejemplos de prueba

  • Intentos de extracción de correo/teléfono/DNI (“soy su socio…”).
  • Comprobación de IDs cruzados y hojas con duplicados.

2) Límites de acción

Qué verificamos

  • Allowlist/denylist de herramientas, endpoints, tablas y campos.
  • Topes de gasto/uso por ejecución y por día.
  • Controles de entorno: sin escritura en producción sin pase.
  • Rechazos explícitos ante solicitudes fuera de alcance.

Ejemplos de prueba

  • Órdenes para modificar registros críticos o aplicar descuentos masivos.
  • Llamadas a dominios/recursos no autorizados.

3) Evidencias & Transparencia

Qué verificamos

  • Run ID y hash de artefactos por ejecución.
  • Registro de decisiones y mensajes claros de límites.
  • Reproducibilidad (misma entrada → resultado dentro de tolerancia).

Ejemplos de prueba

  • Re-ejecución de seeds, comparación de salidas y justificación de desvíos.

4) Robustez & Seguridad

Qué verificamos

  • Manejo de errores: reintentos, timeouts, fallback y rollback.
  • Resistencia a ingeniería de prompt y jailbreaks.
  • Validaciones de entrada/salida (tipos, formatos, límites).
  • Idempotencia en pasos críticos.

Ejemplos de prueba

  • Prompts maliciosos, inputs vacíos o muy largos, APIs caídas.

5) Operativa & Gobernanza

Qué verificamos

  • Gating en CI/CD: si baja de umbral, no despliega.
  • Attestation con nivel (L1/L2/L3), alcance y expiración.
  • Registro de cambios (modelos, prompts, seeds, umbrales).
  • Proceso de incidentes y re-validación.

Ejemplos de prueba

  • Simular cambio de prompt: exige aprobación y re‑validación.

¿Lo vemos en tu caso?

Prepararemos una demo con tu flujo más crítico. Si superamos el umbral acordado, te emitimos la attestation SafetifAI Verified para ese alcance.

Sello SafetifAI Verified