Qué es la monitorización de infraestructura
La monitorización de infraestructura es la recopilación continua de indicadores de servidores, contenedores, bases de datos y la red, su almacenamiento, visualización y alertas cuando algo se sale de los límites. El objetivo es detectar un problema antes que los usuarios y encontrar la causa más rápido.
Qué se rastrea exactamente
- Hosts: CPU, memoria, disco (espacio e I/O), red, load average.
- Contenedores y orquestación: reinicios de pods, límites de CPU/memoria, OOM kills.
- Bases de datos: conexiones, consultas lentas, lag de replicación.
- Servicios y aplicaciones: tasa de errores, latencia (p50/p95/p99), colas.
De qué se compone
- Recopilación — un agente o exporter recoge métricas y las envía al almacenamiento.
- Almacenamiento — una base de series temporales (TSDB) guarda las series de puntos.
- Visualización — dashboards con gráficos.
- Alerting — reglas que envían una notificación a Slack/Telegram/on-call cuando una métrica cruza un umbral.
Push frente a pull
En el modelo pull el servidor va a buscar las métricas él mismo (como Prometheus). En el modelo push el agente envía los datos él mismo. Unimoni usa push sobre mTLS — no necesitas abrir puertos entrantes en tus servidores.
Por dónde empezar
Captura las métricas básicas de los hosts (USE: Utilization, Saturation, Errors), configura unas pocas alertas accionables (host caído, poco espacio en disco, errores en aumento) y no generes ruido — una alerta sin acción solo embota la atención.