У нас вы можете посмотреть бесплатно Tanat Lokejaroenlarb - Observability to Resolution: The Journey Through a Production K8s Incident или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
In this talk, I'll share the lessons from a month-long journey into a production-scaled incident that degraded the quality of service in a large-scale multi-tenant, multi-region, multi-cluster Kubernetes cluster. We'll start with a seemingly innocent error and delve deeper into a series of unexpected issues affecting application performance. We'll explore the importance of Service Level Indicators (SLIs) and Service Level Objectives (SLOs) and their role in incident management. Then, I'll discuss how to leverage data, employ observability tools, and iterate on feedback loops to navigate complex issues. This talk will highlight the significance of structured incident management and a data-driven approach to ensuring system reliability.