Cloudflare пояснила причину масштабного збою
Компанія Cloudflare пояснила, що масштабний збій 18 листопада, який вплинув на роботу деяких сайтів, виник через проблему з базою даних ClickHouse. Помилковий запит у базі даних викликав генерацію багато дублікатів даних, що перевищило ліміти пам’яті і вивело з ладу проксі-систему, яка обробляє трафік клієнтів. Це призвело до блокування реального трафіку на деяких сайтах. Cloudflare визначила кроки для запобігання подібним проблемам у майбутньому, такі як посилення обробки конфігураційних файлів та розширення кількості “kill switch” для функцій. Компанія оцінює, що близько 20% інтернет-трафіку проходить через їхню мережу, тому будь-яка помилка може мати глобальний вплив.