Da próxima vez que você cometer um erro, faça como a Cloudflare!

Não sei se todos aqui conhecem a Cloudflare, um service provider gigantesco, que provê serviços de Content Delivery (CDN), firewall as a service, DNS (1.1.1.1 e, agora, 1.1.1.2 – com filtros de malware – e 1.1.1.3 – com filtros de malware e conteúdo adulto), registro de domínios e muito mais.

Talvez você nunca tenha ouvido falar da empresa. Mas ela opera uma das maiores redes globais na Internet. Um grande percentual do tráfego diário da Internet atravessa a rede da empresa. Assim, não é surpresa que, quando uma falha grave ocorre na Cloudflare, os números de empresas e indivíduos afetados são astronômicos.

Em 2019, devido a uma falha na configuração de seus Application Firewalls (WAF), a maior parte do tráfego que cruza a rede da empresa foi afetado de alguma forma. A rede global da empresa ficou fora por 27 minutos. Uma eternidade em termos de network outage. Milhões de usuários foram afetados, incluindo gigantes como Amazon, Google, Facebook e outros.

O que, normalmente, as empresas fazem quando falhas como estas ocorrem? A maior parte delas tenta ocultar a natureza do problema do público. Notas descrevendo de forma BEM resumida (tipo: “Houve um problema de rede”) o que houve são liberadas à imprensa, e a discussão termina aí.

Não a Cloudflare. Desde a sua fundação, a empresa SEMPRE foi bastante detalhista na descrição não apenas dos problemas, mas também das ações tomadas para mitigá-los.

E por que isso é legal?

Primeiro pela transparência. Segundo, porque é possível aprender MUITO com os relatos postados por eles.

Sugiro que dêem uma lida no último (ocorrido na semana passada), que foi bem sério. A causa: Uma atualização incorreta do BGP feita pela equipe de engenharia de redes em um roteador Juniper de um dos pontos de presença da empresa.  Leia mais aqui: https://blog.cloudflare.com/cloudflare-outage-on-july-17-2020/

O detalhamento é tão grande que até os comandos executados no roteador são descritos.

Outro que vale a pena ler é o post sobre a falha de 2019 (com os WAFs) – leia aqui: https://blog.cloudflare.com/details-of-the-cloudflare-outage-on-july-2-2019/

Eu aconselho a qualquer um que seja apaixonado por redes que acompanhe o blog dos caras. Tem sempre muita coisa boa. Vale seguir.

Da próxima vez que você errar, não esconda ou tente disfarçar… faça como a Cloudflare: Admita o erro, detalhe o problema e aprenda com ele para que não ocorra novamente 🙂

Abs

Marco



Comente usando o Facebook!

Deixe uma resposta