- Знать что нас аффектит
- Уметь быстро восстанавливаться
- Посмотреть, как мы можем минимизировать влияние
- Рассмотрены гипотезы по кэшированию
- Подробно рассмотрен крайний чёрный сбой - мы выдержали нагрузку x4 на входе и не сломались
- Внедрён и отключён circuit breaker
- Заведены задачи
- Документ с анализом + запись
- Толкбот очень сильно зависит от интеграций и сбой на одной системе отражается на нашей доступности, obviously
-
- Сделать disaster recovery plan
- Написать пару премортемов
- Довнедрить circuit breaker
Made with Slides.com