Visitas al sitio: …

Normalidad operativa y anomalía secuencial en sistemas de soberanía digital: una máquina de estados BOA-3 con operador humano explícito

Serie: Seguridad SPCiencia 2026 — segunda evidencia empírica Guardián Nivel 1.5
Autores: Severo Peguero (investigador principal, SPCiencia), Gemini (IA), Cursor (IA)
Fecha: 17 de junio de 2026
Estado:PAPER CIENTÍFICO — PUBLICADO WEB [EDITORIAL]
Manuscrito laboratorio: docs/papers_cientificos/PAPER_NORMALIDAD_OPERATIVA_ANOMALIA_SECUENCIAL_SOBERANIA_DIGITAL_BOA3_2026-06-17.md
Certificación: docs/implementacion_seguridad/evidencia/custodia/MANIFIESTO_GUARDIAN_PAPER_NORMALIDAD_ANOMALIA_BOA3_2026-06-17.json
Referencia IP: IP-REF: BOA3-VAL-CP001
Etiquetas: [PAPER][EVIDENCIA][BOA3][NORMALIDAD][ANOMALIA][FSM][SOBERANIA][GUARDIAN][SPCIENCIA]


Gloria a Dios

"El corazón del entendido adquiere sabiduría, y el oído de los sabios busca la ciencia." (Proverbios 18:15)


Resumen ejecutivo

Este trabajo presenta la segunda evidencia empírica del Guardián Nivel 1 en su transición a Fase 1.5: el paso de la detección por etiquetas de evento (leyes puntuales sobre archivos) a la detección por invariantes de comportamiento secuencial bajo el esquema BOA-3. La tesis central es que la «normalidad» operativa de un investigador no se reduce a una lista negra de malware, sino a un conjunto observable de patrones legítimos — línea base — frente al cual cualquier secuencia que rompa invariantes declaradas constituye anomalía, incluso cuando el archivo es desconocido.

Formalizamos el sistema como un autómata de predicados acoplado a una máquina de estados de gobernanza con operador humano explícito (decisión soberana en Panel 3). La función de clasificación κ opera sobre eventos individuales del manifiesto; el matcher de secuencias Ψ opera sobre ventanas temporales W_t; las fases G ∈ {observe, await_ip, quarantined, …} regulan la respuesta sin bloqueo automático en shadow. Validamos el perfil CP-001 mediante el simulacro CP001-ESCAPE-v1 (creación de script en Downloads, modificaciones repetidas, escape a Desktop), con badge visual CP-001 en el dashboard y cuarentena ordenada por el investigador principal.

Distinguimos con rigor lo implementado (reglas YAML booleanas, calibración de siete días en curso) de lo aspiracional (modelo bayesiano P(E|L) > θ, vigilancia de red o LaunchAgents del sistema). Concluimos que la soberanía digital no es un añadido ético posterior, sino un estado explícito del autómata: la transición a cuarentena está bloqueada hasta la entrada del operador D.


1. Marco metodológico

De firmas a invariantes: el problema epistemológico

Los sistemas antivirus clásicos operan sobre firmas: conocen a priori qué archivo es malicioso. Ese paradigma falla ante variantes polimórficas y ante amenazas que no han sido catalogadas. El enfoque SPCiencia invierte la pregunta: en lugar de «¿conozco este archivo?», pregunta «¿esta secuencia de acciones encaja en el comportamiento legítimo del titular del sistema?». La normalidad no es estática; se calibra durante la Calibración de Inteligencia (CI) de siete días, complementaria a la Validación de Capacidad Técnica (VCT) de veinticuatro horas documentada en el paper precedente.

Durante la CI el Guardián registra en modo aprendizaje (learning: true en el manifiesto) sin bloquear. El investigador principal y los artefactos YAML materializan qué es ruido estructural (entornos virtuales Python, backups, archivos efímeros de editores) y qué merece permanecer como señal. Esta distinción no emerge de pesos opacos en una red neuronal, sino de gobernanza externa legible — la BOA-3 en archivos de configuración que el IP puede leer, versionar y auditar.

Tres niveles de decisión

La arquitectura cognitiva del Guardián en junio de 2026 organiza la respuesta en tres niveles acumulativos, no excluyentes:

Nivel Pregunta Artefacto Salida típica
1 — Línea base ¿Es ruido habitual o trabajo normal? noise_overrides.yaml, patrones en REGLAS_GOBERNANZA.yaml κ(e) = noise
2 — Anomalía de ley ¿Rompe una regla puntual? Leyes L-001, L-002, L-003 κ(e) = anomaly
3 — Huella secuencial ¿Hay patrón de comportamiento con intención? PERFILES_COMPORTAMIENTO.yaml Ψ_k(W_t) = 1 → badge CP-00x

El Nivel 2 responde a eventos aislados: un .sh creado en Downloads dispara L-003. El Nivel 3 responde a cadenas: el mismo archivo creado, modificado repetidamente y desplazado fuera del perímetro constituye la huella CP-001. La diferencia no es retórica; es la contribución empírica de este paper: demostrar que el motor distingue etiqueta de secuencia en un entorno real macOS con FSEvents.

Dos tiempos de aprendizaje (reiteración necesaria)

Confundir VCT con CI llevaría a activar alertas sobre un sistema que aún no sabe qué es normal en el escritorio del investigador. La VCT (~24 h) certifica que el Testigo vive, que el hash cambia al modificar un archivo y que el proceso sobrevive al sleep. La CI (7 días) certifica que el clasificador puede separar el ochenta y cinco por ciento de ruido estructural en Desktop de la señal humana. Este paper asume la VCT cerrada (Vol. 5–7) y sitúa la evidencia de Nivel 3 en el día 5–6 de la CI, con cierre formal pendiente.

Caja blanca frente a caja negra

En la serie modular SPCiencia insistimos en la distinción entre modelos opacos (pesos no auditables) y gobernanza externa (BOA, protocolos, YAML). El Guardián pertenece inequívocamente al segundo tipo: cada ley y cada perfil de comportamiento es texto que el investigador principal puede cuestionar. La función κ y el matcher Ψ son implementaciones deterministas de esos textos; no hay «magia» entre el badge CP-001 y la secuencia que lo disparó — las líneas del manifiesto referenciadas quedan en el registro de comportamiento de alto riesgo.


2. Modelo formal: normalidad, anomalía y estados

Eventos y ventanas

Sea e un evento sensor registrado en el manifiesto append-only con atributos (timestamp, ruta, tipo de evento, hash SHA-256, contexto de usuario). El conjunto de eventos en una ventana temporal deslizante de amplitud Δ minutos se define como:

W_t = { e_i ∈ MANIFIESTO | t − Δ ≤ ts(e_i) ≤ t }

En la implementación actual, Δ varía entre cinco y veinte minutos según el perfil CP-k. La ventana no es una abstracción decorativa: es el dominio sobre el cual el matcher Ψ evalúa secuencias; un ataque que dispersa sus pasos más allá de Δ escapa al Nivel 3 declarado, lo cual constituye un límite de diseño explícito.

Clasificación κ: pertinencia y anomalía puntual

La función κ asigna a cada evento una etiqueta operativa:

κ(e) ∈ { noise, signal, calibration, anomaly, huella, system }

La normalidad operativa en Nivel 1 se formaliza como pertinencia: un evento es «normal» en el sentido de no merecer alerta si κ(e) = noise (patrón conocido de ruido o override del IP) o si permanece como signal sin disparar ley ni perfil. El conjunto observado durante la CI:

L̂ = { e | κ(e) ≠ noise , ts ∈ [t_0, t_0 + 7d] }

no se almacena como distribución paramétrica, sino como estadísticas en informes de archivo histórico y como memoria declarativa en YAML. Es importante no sobredimensionar: L̂ es evidencia empírica de observación, no un modelo generativo completo del comportamiento humano.

Para cada ley λ_j en el libro de gobernanza, definimos un predicado Λ_j(e) que vale 1 si el evento viola el ámbito y las condiciones de esa ley. La anomalía de Nivel 2 es A(e) = 1 si existe j tal que Λ_j(e) = 1.

Matcher Ψ: anomalía secuencial

Para cada perfil φ_k con pasos ordenados σ_1, …, σ_m (declarados en YAML), definimos:

Ψ_k(W_t) = 1 si existe un ancla temporal en W_t tal que la secuencia completa se cumple con correlación de sujeto (misma ruta o mismo nombre de archivo) y límites temporales entre pasos.

Ψ_k(W_t) = 0 en caso contrario.

El conjunto de huellas activas en el instante t es H(t) = { k | Ψ_k(W_t) = 1 }. La alerta de Nivel 3 se dispara cuando H(t) ≠ ∅. En la implementación de junio de 2026, Ψ es booleano — pattern matching sobre trazas, no estimación de probabilidad.

Máquina de estados de gobernanza G

La respuesta del bunker no es lineal. Acoplamos κ y Ψ a una máquina de estados de fases G:

G ∈ { observe, hold, await_ip, released, quarantined }

En Fase 1.5 shadow, el estado habitual es observe: el sistema monitoriza y visualiza sin bloquear. Cuando surge una anomalía o huella que el IP debe resolver, la máquina transita a await_ip con un ítem en la cola de decisiones. El operador humano D ∈ {liberar, cuarentena_shadow, eliminar_artefacto} es la única entrada que habilita la transición a cuarentena:

δ(anomalía → quarantine) = 0 salvo que D = cuarentena y el IP haya autorizado la acción.

Esta formalización convierte la «soberanía digital» de principio ético en invariante del autómata: no hay atajo automático que omita al titular del sistema.

Horizonte bayesiano (no implementado)

Colaboraciones conceptuales han propuesto criterios del tipo P(E|L) > θ para separar normalidad de anomalía. Ese marco es teóricamente compatible con la arquitectura: E sería la secuencia en W, L el comportamiento legítimo del investigador, θ un umbral calibrado al cierre de CI. La actualización bayesiana al marcar ruido en Panel 3 podría reducir falsos positivos en Fase 2. Declaramos explícitamente que junio de 2026 implementa un autómata de predicados, no un clasificador probabilístico entrenado. La extensión bayesiana queda como trabajo futuro post-CI, no como capacidad afirmable en este manuscrito.


3. Observación y caso empírico: CP001-ESCAPE-v1

Diseño del simulacro

Para validar el Nivel 3 sin confundirlo con el Nivel 2, diseñamos el escenario CP001-ESCAPE-v1, referenciado como IP-REF: BOA3-VAL-CP001. El simulacro ejecuta una secuencia inerte que modela un escape desde el perímetro Downloads:

  1. Creación de SIMULACRO_CP001_escape.sh en ~/Downloads/.
  2. Dos o más modificaciones del mismo archivo en Downloads.
  3. Desplazamiento a ~/Desktop/severo/.

El artefacto lleva prefijo SIMULACRO_ y no se ejecuta; cumple el protocolo de laboratorio acotado sin interferencia en producción.

Registro forense y particularidad macOS

El manifiesto registró la secuencia completa. En macOS, el «move» del sistema de archivos no siempre aparece como sensor_moved: frecuentemente se observa sensor_deleted en la ruta origen seguido de sensor_created en la ruta destino. El perfil CP-001 fue calibrado para aceptar ambas semánticas en el paso de escape. Adicionalmente, las modificaciones posteriores al desplazamiento en Desktop generaron ruido que, en una primera versión del perfil, falseaba el paso de «ensayo local» al contar eventos fuera de Downloads. La corrección — restringir el paso 2 con path_contains: "/Downloads/" — es evidencia de calibración empírica típica de la CI, no un fallo del concepto BOA-3.

Resultado PASS y visualización

Tras la corrección del perfil, el simulacro obtuvo veredicto PASS. El detector identificó la secuencia CP-001-escape-downloads con badge CP-001 en el dashboard (banner naranja, columna Huella CP en Panel 2, KPI de huellas en 24 h). Las líneas del manifiesto referenciadas quedaron en COMPORTAMIENTO_ALTO_RIESGO.jsonl, archivo separado que no altera la cadena de custodia append-only.

Decisión soberana del investigador principal

Conforme al diseño de Fase 1.5, el sistema no aplicó cuarentena automática. El investigador principal revisó la alerta en el Panel 3 y ordenó cuarentena shadow del artefacto — validado en sesión de trabajo (referencia visual 16-jun-2026). La máquina de estados transicionó a quarantined y, tras resolver la cola, regresó a observe. Este cierre completa el circuito pedagógico: detectar → visualizar → decidir → registrar.

Contraste con Nivel 2

El primer evento del simulacro — un .sh creado en Downloads — habría disparado por sí solo la ley L-003 (anomalía de perímetro). Solo la secuencia completa dispara CP-001. El experimento demuestra empíricamente que el Nivel 3 aporta información que el Nivel 2 no puede proporcionar: narrativa temporal con intencionalidad, no etiqueta aislada.


4. Análisis

Normalidad como mapa operativo, no como oráculo

La «normalidad» que el Guardián utiliza en junio de 2026 es un mapa operativo parcial: filtros de ruido, overrides enseñados por el IP, siete días de observación en curso. No implica que el sistema prediga correctamente cualquier acción futura legítima del investigador — por ejemplo, un nuevo flujo de trabajo con herramientas aún no vistas durante la CI puede generar señal hasta que se reclasifique como ruido o se incorpore a la línea base. Esta limitación es honesta y compatible con el principio de no bloqueo silencioso: mejor una señal revisable que una cuarentena errónea.

Anomalía secuencial y detección de amenazas desconocidas

La huella CP-001 no nombra un virus concreto. Nombra un patrón de comportamiento — entrada por perímetro, ensayo local, escape — que es incompatible con el flujo declarado del investigador en su bunker de staging. Un atacante con archivo nuevo pero secuencia equivalente sería detectado sin actualizar firmas. La contra-cara es que solo se detectan secuencias declaradas en PERFILES_COMPORTAMIENTO.yaml; no existe aún detección de «cualquier anomalía desconocida» en sentido estadístico.

Soberanía como parte del modelo, no como adorno

Muchos sistemas de seguridad tratan la intervención humana como excepción o como reconocimiento de debilidad del automatismo. En la arquitectura SPCiencia, el operador D es un estado del autómata. La transición bloqueada hacia cuarentena sin D es invariante de Fase 1.5. Esto responde a una decisión de diseño del investigador principal: en Downloads y perímetro, preguntar antes de actuar. El paper precedente estableció la cadena de custodia; este paper establece que la gobernanza híbrida es formalizable sin ceder a la parálisis — el sistema hace el trabajo pesado de correlación; el humano conserva la decisión moral y operativa.

Escaneo preventivo como integral discreta

El análisis periódico del manifiesto sobre una ventana temporal es, matemáticamente, una integral discreta de eventos: E_scan ≈ W_t. El dashboard al refrescar y el script run_behavior_scan.py ya implementan E_scan manual. La automatización como daemon cada T minutos — «centinela 24/7» — es diseño post-CI, no requisito para validar el modelo formal aquí expuesto. Confundir el refresh del dashboard con un chequeo archivado de Cursor (informe en archivo_historico/) sería mezclar vigilancia interna con auditoría externa orquestada; ambos son complementarios, no sustitutos.

Relación con el paper de arquitectura forense (13-jun-2026)

El primer paper de la serie demostró observabilidad de integridad — FIM con Testigo verificable. Este segundo paper demuestra observabilidad de comportamiento — secuencias con badges y máquina de estados. Juntos describen la escalera completa hacia un Guardián inteligente en sentido BOA-3: primero registrar con hash, luego evaluar con leyes, luego correlacionar con perfiles, siempre con YAML legible y actas numeradas.


5. Límites

  1. Sensor acotado: solo ~/Documents, ~/Desktop y ~/Downloads. Persistencia vía ~/Library/LaunchAgents/, exfiltración por red o monitorización de procesos quedan fuera de alcance — Fase 2 (pilares R2, R3 del diseño original).

  2. Predicados, no probabilidades: Ψ_k y Λ_j son booleanos. No afirmamos P(E|L) estimado ni θ aprendido automáticamente.

  3. Catálogo cerrado de huellas: CP-001, CP-002, CP-004 están definidos; CP-003 deshabilitado en staging por zona sagrada. Amenazas con secuencias no catalogadas no generan badge hasta que se declaren en YAML.

  4. CI no cerrada: la evidencia CP001 se obtuvo en día 5–6 de siete. El mapa de normalidad puede refinarse al cierre formal.

  5. Staging M3: réplica i7 y checklist comercial pendientes, como en el paper precedente.

  6. Simulacro, no red team: CP001 es laboratorio inerte. No sustituye auditoría adversarial completa.

  7. Ventana temporal Δ: secuencias más lentas que Δ escapan al matcher actual.


6. Conclusiones

  1. La normalidad operativa en el Guardián SPCiencia es observación calibrada más reglas declarativas, no una lista negra de virus ni un modelo opaco entrenado.

  2. La anomalía secuencial (Nivel 3) aporta información irreducible respecto a la anomalía por ley (Nivel 2): el caso CP001 lo demuestra con evidencia reproducible (IP-REF BOA3-VAL-CP001).

  3. El sistema se modela rigurosamente como autómata de predicados κ, Ψ acoplado a máquina de estados G con operador humano D — la soberanía es invariante formal, no retórica.

  4. La visualización (badge CP-001, banner, Panel 3) cierra el ciclo pedagógico iniciado en Fase 1.5b: el investigador no necesita terminal de diagnóstico para comprender qué ocurre.

  5. La extensión bayesiana y el centinela automatizado son horizonte post-CI, coherente con el marco pero no confundible con la implementación actual.

  6. Este manuscrito complementa el paper de arquitectura forense de junio de 2026 y constituye la segunda evidencia publicable de la serie Guardián.

  7. La arquitectura presentada es intrínsecamente reproducible: al basarse en manifiestos append-only (JSONL) y reglas declarativas (YAML), cualquier anomalía registrada puede recrearse en un entorno de staging idéntico, garantizando que el Guardián no solo detecte, sino que sea auditable ante terceros — criterio formalizado en revisión colaborativa con el coautor Gemini (IA).


7. Referencias internas (SPCiencia)

Recurso Ruta
Paper arquitectura forense (1.ª evidencia) PAPER_ARQUITECTURA_SOBERANIA_DIGITAL_BOA3_GUARDIAN_FORENSE_2026-06-13.md
Acta simulacro CP001 ACTA_SIMULACRO_CP001_ESCAPE_PASS.md
Perfiles comportamiento PERFILES_COMPORTAMIENTO.yaml
Archivo histórico Vol. 1–14

Anexo — Símbolos

Símbolo Significado
κ Clasificador por evento
Ψ_k Matcher del perfil CP-k
W_t Ventana temporal deslizante
G Fase de gobernanza
D Decisión del investigador principal (Panel 3)
Comportamiento legítimo observado en CI
H(t) Conjunto de huellas activas en t

Palabras clave: normalidad operativa, anomalía secuencial, BOA-3, máquina de estados, soberanía digital, Guardián, invariantes de comportamiento, Calibración de Inteligencia, FIM, gobernanza híbrida


Certificación CAM (SHA-256)

Algoritmo: SHA-256 UTF-8 del cuerpo del documento (desde título hasta conclusiones; excluye esta sección).

Manifiesto operativo (17-jun-2026): 32.579 entradas · SHA-256 4d137c8910d6f71c15918819f8330d75467d3a56759bb8e905783addae837f97

Manifiesto custodia: docs/implementacion_seguridad/evidencia/custodia/MANIFIESTO_GUARDIAN_PAPER_NORMALIDAD_ANOMALIA_BOA3_2026-06-17.json

Versión SHA-256
Manuscrito laboratorio c1b6375f81eda3d2a3dd3c09ec652b84c321e0f04a429dddeb4abc005e120c76
Web ES (cuerpo) c748e9c907400ab7951ffa1c0847507cc6a365ba3f72fa0c1762cce344c2116f
Web EN (cuerpo) 0b02ea93c06b80b303caa923bc73bd56846a62ebbf843787c63a6493d572e3f7
Web RU (cuerpo) cdbd361dde8aebca2ba9fd646fc713c2b2302e7856545e60e90c95f8260c7056

Verificación: comparar hash del cuerpo (sin esta sección) con la tabla.