Underworld Tribe Lead
Monolito => Microservicios
Falacias de los Sistemas Distribuidos
Iron Age => Cloud Age
Hardware comóditi
Iron Age => Cloud Age
Monolito => Microservicios
+
= Muchas eventos fuera de control
2010
Netflix créa Chaos Monkey
2011
Netflix evoluciona hacia Simian Army
2012
Netflix libera el código de Chaos Monkey en Github
2014
Netflix crea un nuevo rol
Chaos Engineer
Modelo de gestión de incidentes
Monitoreo
Medir el impacto de la indisponibilidad
Negocio/Cliente
Sistema
1) Encontrar un estado de estabilidad
2) Definir la hipótesis de que el estado se mantiene en un grupo experimental y en uno de control
3) Introducir variables que reflejen escenarios reales en el grupo de experimentación
4a) Refutar la hipótesis de que ambos grupos se mantienen estables
Experimento
4b) Refutar la hipótesis de que ambos grupos se mantienen estables
Experimento exitoso
Conocido
Desconocido
Conocidos
Desconocidos
Somos conscientes y entendemos
Somos conscientes y no entendemos
Entendemos pero no somos conscientes
No sabemos ni somos conscientes
Clientes
Un servicios sin indisponibilidad
Negocio
Sin perdidas de ingresos ni costos de mantención
Técnicos
Pueden ocupar su tiempo libre sin preocupaciones
Tengo
Tengo una infraestructura dinámica
Soy de uso masivo o tengo expectativas de serlo
Tengo resuelto todos los requisitos
https://github.com/netflix/chaosmonkey
https://principlesofchaos.org/
https://www.gremlin.com/community
https://github.com/dastergon/awesome-chaos-engineering