Base de conocimiento/Fundamentos

Qué es la monitorización de infraestructura

La monitorización de infraestructura es la recopilación continua de indicadores de servidores, contenedores, bases de datos y la red, su almacenamiento, visualización y alertas cuando algo se sale de los límites. El objetivo es detectar un problema antes que los usuarios y encontrar la causa más rápido.

Qué se rastrea exactamente

Hosts: CPU, memoria, disco (espacio e I/O), red, load average.
Contenedores y orquestación: reinicios de pods, límites de CPU/memoria, OOM kills.
Bases de datos: conexiones, consultas lentas, lag de replicación.
Servicios y aplicaciones: tasa de errores, latencia (p50/p95/p99), colas.

De qué se compone

Recopilación — un agente o exporter recoge métricas y las envía al almacenamiento.
Almacenamiento — una base de series temporales (TSDB) guarda las series de puntos.
Visualización — dashboards con gráficos.
Alerting — reglas que envían una notificación a Slack/Telegram/on-call cuando una métrica cruza un umbral.

Push frente a pull

En el modelo pull el servidor va a buscar las métricas él mismo (como Prometheus). En el modelo push el agente envía los datos él mismo. Unimoni usa push sobre mTLS — no necesitas abrir puertos entrantes en tus servidores.

Por dónde empezar

Captura las métricas básicas de los hosts (USE: Utilization, Saturation, Errors), configura unas pocas alertas accionables (host caído, poco espacio en disco, errores en aumento) y no generes ruido — una alerta sin acción solo embota la atención.

Qué es la observabilidad, en palabras sencillas

Qué es una base de datos de series temporales (TSDB)

SLO, SLI y SLA: la diferencia