Grande interrupção da internet ao vivo: como a interrupção da AWS da Amazon derrubou a web
Está com problemas para acessar alguns dos seus sites e serviços favoritos hoje? Você não está sozinho, pois uma grande parte da internet tem enfrentado problemas com interrupções relatadas em diversos sites.
O serviço AWS da Amazon é o culpado, pois sofreu uma grave interrupção, o que teve um enorme impacto em centenas, senão milhares de serviços. Os próprios serviços da Amazon, como Alexa, Ring e Prime Video, estavam enfrentando problemas, assim como grandes nomes da internet.
A interrupção do serviço AWS da Amazon já dura mais de oito horas, e a Amazon ainda está investigando os problemas.
A boa notícia é que a Amazon disse que "identificou uma possível causa raiz para as taxas de erro" e está vendo "sinais significativos de recuperação", o que, espera-se, significa que uma correção está sendo implementada.
Falha na internet da AWS: a história até agora
- 10h03 PDT : “Continuamos aplicando medidas de mitigação para a integridade do balanceador de carga da rede e recuperando a conectividade para a maioria dos serviços da AWS.” Essa interrupção já dura mais de 10 horas.
- 09h13 PDT : Amazon diz que está “observando conectividade e recuperação de API para serviços AWS”
- 08h48 PDT : Boas notícias! A Amazon "reduziu a origem dos problemas de conectividade de rede que impactaram os serviços da AWS".
- 08h04 PDT : Mais investigações são necessárias pela Amazon, pois ela analisa problemas de conectividade
- 07h29 PDT : Amazon confirma problemas de conectividade para usuários.
- 07:14 PDT : Nossa! As coisas parecem estar piorando . "Podemos confirmar erros significativos de API e problemas de conectividade em vários serviços na região US-EAST-1."
- 06h42 PDT : A Amazon confirma que “ainda está enfrentando erros elevados para novos lançamentos de instâncias do EC2”.
- 05h48 PDT : A Amazon diz que está “fazendo progresso na resolução do problema com novos lançamentos de instâncias do EC2 na região US-EAST-1”.
- 05h10 PDT : Mais ações bem-sucedidas enquanto a Amazon continua trabalhando no processo de recuperação.
- 04h48 PDT : A Amazon confirma que muitos serviços ainda estão afetados enquanto continua a corrigir o problema.
- 04h08 PDT : Amazon diz que “continua trabalhando para uma recuperação total”
- 03:35 AM PDT : “O problema subjacente de DNS foi totalmente mitigado e a maioria das operações do serviço AWS estão funcionando normalmente agora”
- 03:03 PDT : Os serviços continuam a se recuperar enquanto a Amazon continua “a trabalhar para uma resolução completa”
- 02h27 PDT : “Estamos vendo sinais significativos de recuperação”, observa a Amazon. Graças a Deus.
- 02h22 PDT : A Amazon diz que está “observando os primeiros sinais de recuperação de alguns serviços da AWS impactados”
- 02:01 AM PDT : A Amazon diz que “identificou uma potencial causa raiz para as taxas de erro”
- 01:26 AM PDT : A Amazon diz que “pode confirmar taxas de erro significativas para solicitações feitas ao endpoint do DynamoDB na região US-EAST-1”
- 00h51 PDT : Amazon confirma “aumento nas taxas de erro e latências para vários serviços da AWS na região US-EAST-1”
- 00h11 PDT : A Amazon confirma que está “investigando o aumento das taxas de erro e latências para vários serviços da AWS na região US-EAST-1”
Quanto tempo durará a interrupção da AWS?
Essa é a pergunta de um milhão de dólares, e a resposta curta é: não sabemos. Até agora, os problemas de hoje estão acontecendo há mais de 10 horas, tornando-se a maior indisponibilidade da AWS na Amazon em uma década.
De acordo com nossa pesquisa sobre interrupções anteriores da AWS, a interrupção mais longa dos últimos 10 anos ocorreu em agosto de 2019, quando os serviços ficaram inativos por oito horas.
Mas há luz no fim do túnel, com a Amazon afirmando que está recuperando os serviços. A situação ainda não está perfeita, e os problemas persistem em toda a internet.

