Qué es la monitorización de infraestructura

La monitorización de infraestructura es la recopilación continua de indicadores de servidores, contenedores, bases de datos y la red, su almacenamiento, visualización y alertas cuando algo se sale de los límites. El objetivo es detectar un problema antes que los usuarios y encontrar la causa más rápido.

Qué se rastrea exactamente

  • Hosts: CPU, memoria, disco (espacio e I/O), red, load average.
  • Contenedores y orquestación: reinicios de pods, límites de CPU/memoria, OOM kills.
  • Bases de datos: conexiones, consultas lentas, lag de replicación.
  • Servicios y aplicaciones: tasa de errores, latencia (p50/p95/p99), colas.

De qué se compone

  1. Recopilación — un agente o exporter recoge métricas y las envía al almacenamiento.
  2. Almacenamiento — una base de series temporales (TSDB) guarda las series de puntos.
  3. Visualización — dashboards con gráficos.
  4. Alerting — reglas que envían una notificación a Slack/Telegram/on-call cuando una métrica cruza un umbral.

Push frente a pull

En el modelo pull el servidor va a buscar las métricas él mismo (como Prometheus). En el modelo push el agente envía los datos él mismo. Unimoni usa push sobre mTLS — no necesitas abrir puertos entrantes en tus servidores.

Por dónde empezar

Captura las métricas básicas de los hosts (USE: Utilization, Saturation, Errors), configura unas pocas alertas accionables (host caído, poco espacio en disco, errores en aumento) y no generes ruido — una alerta sin acción solo embota la atención.