“Es un error teorizar antes de poseer datos, uno comienza a deformar los hechos para hacerlos encajar en las teorías, en vez de ...” --Sherlock Holmes
¿Que?
¿Para Quien?
¿Cómo?
Herramientas y procesos para medir y manejar sistemas
Traducción entre valor y métricas generadas por los sistemas
¿Qué falla y por qué?
Negocio
IT
Checklists
Scripts simples
Solo lo que ha fallado antes, se soluciona como antes
Enfoque solo en minimizar downtime
Automático con algúnos rastros manuales
Alertas con límites simples
Consolas mostrando estado
Enfoque en Disponibilida(Infraestructura))
Actualizacions reactivas
Nuevas mediciones último paso del despliegue
Nucleo operación
Automatico génerado por manejo de la configuración
Las aplicaciónes tienen instrumentación incluida
Métricas comportamiento applicación y negocio (En contraste con CPU y Disco)
Calidad del Servicio y Experiencia de Usuario
Los productos no se consideran completos si no tienen monitoreo
Estado
y
Rendimiento
a traves de:
Eventos, Metricas y Logs
¿Cómo?
Anlisis Logs( ELK, Cloudwatch metrics, mtail)
Instrumentación( Java, Netflix Spectator, JMX, Heartbeat, Heartbeat2 )