
Ontem, dia 30 de março de 2025, por volta de 12h32, o Brasil Internet Exchange (IX.br) reportou que o data center SP4 da Equinix estava sofrendo com a indisponibilidade dos serviços.
O que é o Equinix SP4
Para que a internet que nós conhecemos funcione, ela demanda infraestruturas físicas gigantescas e hiperconectadas. Nesse cenário, o Equinix SP4 é dos maiores e mais tradicionais data centers do país e o mais interconectado da América Latina.
Ele também faz parte do PTT de São Paulo, que é o maior Ponto de Troca de Trafego de rede do mundo. E o Equinix SP4 está no topo da lista, sendo o data center com maior trafego dentro do PTT de São Paulo, com um trafego médio de 6,2 terabits por segundo (entrada + saída) no último ano.
O que aconteceu
Por volta das 12h32, o IX.br reportou um incidente de indisponibilidade total do Equinix SP4 com o PTT de São Paulo, mas que a equipe responsável já havia sido acionada.

Em seguida, às 12h34, a Equinix enviou um aviso de incidente operacional para seus clientes, o mesmo foi publicado pelo Thiago Ayub no Threads. No aviso a empresa informa que o data center teve o seu alarme de incêndio acionado, dando início ao incidente número INC0080088.

Por volta das 14h, a empresa enviou uma atualização sobre o incidente, que também foi publicado pelo Thiago Ayub no Threads. Nessa atualização a empresa informa que o incidente ocorreu na área de colocation, onde ficam hospedados os equipamentos de outras empresas, como servidores, sistemas de armazenamento e outros ativos de rede.

A atualização também informa que foi necessário desligar duas RPP (Remote Power Panel), que são painéis de distribuição de energia instalados em áreas dedicadas e que tem o papel de fornecer energia para diversos equipamentos e racks dentro do data center.
Além disso, algumas unidades CRAH (Computer Room Air Handler), que são os equipamentos responsáveis por fazer o tratamento e condicionamento de ar dentro do data center, também precisaram ser desligadas por causa da fumaça, o que também elevou a temperatura do ambiente para fora dos níveis de serviço acordado (SLA) com os clientes.
Às 07h da segunda-feira, dia 31 de março, o IX.br anunciou que o problema havia sido solucionado e que a situação ainda estava sendo monitorada para garantir a estabilidade do ambiente.

Consequências no trafego de rede
A primeira consequência do incidente foi a indisponibilidade total dos serviços hospedados no Equinix SP4 dentro do PTT, e isso mexeu bastante com o trafego de rede a nível nacional, como podemos ver nos gráficos a seguir:

Fonte: IX.br

Fonte: IX.br

Fonte: IX.br
Também é possível notar que com a indisponibilidade dos serviços no PTT de São Paulo, os outros PTTs tiveram um aumento no seu trafego, permitindo que os clientes que não estavam conseguissem acessar serviços que não estavam disponíveis em São Paulo, mas estavam disponíveis nesses outros PTTs, como é o caso de grandes serviços, como Google, Meta e Netflix.
Em alguns PTTs, esse comportamento ficou mais visível, então eu separei o gráfico do trafego de alguns PTTs para podermos ver esse aumento de trafego.

Fonte: IX.br

Fonte: IX.br

Fonte: IX.br
Também foi possível notar um aumento no trafego de rede em IPv6 no PTT de São Paulo, levando a crer que os provedores passaram a utilizar serviços de contingência que utilizam o IPv6, por ser mais moderno e resiliente a falhas que o IPv4.

Fonte: IX.br
Serviços com problemas
A indisponibilidade desse data center também causou problemas em diversos serviços, como a Starlink, que teve uma grande instabilidade nacional devido ao incidente, como mostra o gráfico a seguir.

Fonte: Downdetector
Conclusão
Esse incidente destacou a fragilidade e a importância crítica de infraestruturas hiperconectadas para o funcionamento da internet, e afetou diretamente o maior ponto de troca de trafego do mundo (PTT de São Paulo), causando a indisponibilidade total e parcial de diversos serviços e gerando instabilidades em escala nacional.
A rápida atuação da Equinix, com o desligamento de RPPs (painéis de distribuição de energia) e unidades CRAH (sistemas de refrigeração) evitou danos maiores, mas expôs desafios operacionais, como o desvio do SLA de temperatura devido à fumaça.
A resiliência da rede brasileira também foi evidenciada pelo aumento imediato do tráfego em outros PTTs regionais, como Palmas, Belém e Cuiabá, que absorveram parte da demanda redirecionada de serviços globais como Google, Meta e Netflix. O que reforça a excelente gestão dos PTTs por parte do NIC.br e também a importância de suas inciativas para uma internet mais resiliente, eficiente e distribuída, como é o caso da iniciativa OpenCDN.
O episódio reforça a necessidade de investimentos em redundância, sistemas de contingência e protocolos de segurança mais robustos para data centers estratégicos. Em um cenário de dependência crescente de serviços em nuvem e conectividade, a proteção de infraestruturas físicas e a transparência em comunicações de crise tornam-se pilares essenciais para minimizar impactos em cadeia.
Deixe um comentário