Итоги месяца

Анализ чёрных сбоев

Зачем

  • Знать что нас аффектит
  • Уметь быстро восстанавливаться
  • Посмотреть, как мы можем минимизировать влияние

Что было сделано

  • Рассмотрены гипотезы по кэшированию
  • Подробно рассмотрен крайний чёрный сбой - мы выдержали нагрузку x4 на входе и не сломались
  • Внедрён и отключён circuit breaker
  • Заведены задачи
  • Документ с анализом + запись

Задачи и выводы

  • Толкбот очень сильно зависит от интеграций и сбой на одной системе отражается на нашей доступности, obviously
  •  
  • Сделать disaster recovery plan
  • Написать пару премортемов

 

 

  • Довнедрить circuit breaker

Итоги месяца

By tempestmon

Итоги месяца

  • 84