Grande interrupção da internet ao vivo: como a interrupção da AWS da Amazon derrubou a web

Está com problemas para acessar alguns dos seus sites e serviços favoritos hoje? Você não está sozinho, pois uma grande parte da internet tem enfrentado problemas com interrupções relatadas em diversos sites.

O serviço AWS da Amazon é o culpado, pois sofreu uma grave interrupção, o que teve um enorme impacto em centenas, senão milhares de serviços. Os próprios serviços da Amazon, como Alexa, Ring e Prime Video, estavam enfrentando problemas, assim como grandes nomes da internet.

A interrupção do serviço AWS da Amazon já dura mais de oito horas, e a Amazon ainda está investigando os problemas.

A boa notícia é que a Amazon disse que "identificou uma possível causa raiz para as taxas de erro" e está vendo "sinais significativos de recuperação", o que, espera-se, significa que uma correção está sendo implementada.

Falha na internet da AWS: a história até agora

  • 10h03 PDT : “Continuamos aplicando medidas de mitigação para a integridade do balanceador de carga da rede e recuperando a conectividade para a maioria dos serviços da AWS.” Essa interrupção já dura mais de 10 horas.
  • 09h13 PDT : Amazon diz que está “observando conectividade e recuperação de API para serviços AWS”
  • 08h48 PDT : Boas notícias! A Amazon "reduziu a origem dos problemas de conectividade de rede que impactaram os serviços da AWS".
  • 08h04 PDT : Mais investigações são necessárias pela Amazon, pois ela analisa problemas de conectividade
  • 07h29 PDT : Amazon confirma problemas de conectividade para usuários.
  • 07:14 PDT : Nossa! As coisas parecem estar piorando . "Podemos confirmar erros significativos de API e problemas de conectividade em vários serviços na região US-EAST-1."
  • 06h42 PDT : A Amazon confirma que “ainda está enfrentando erros elevados para novos lançamentos de instâncias do EC2”.
  • 05h48 PDT : A Amazon diz que está “fazendo progresso na resolução do problema com novos lançamentos de instâncias do EC2 na região US-EAST-1”.
  • 05h10 PDT : Mais ações bem-sucedidas enquanto a Amazon continua trabalhando no processo de recuperação.
  • 04h48 PDT : A Amazon confirma que muitos serviços ainda estão afetados enquanto continua a corrigir o problema.
  • 04h08 PDT : Amazon diz que “continua trabalhando para uma recuperação total”
  • 03:35 AM PDT : “O problema subjacente de DNS foi totalmente mitigado e a maioria das operações do serviço AWS estão funcionando normalmente agora”
  • 03:03 PDT : Os serviços continuam a se recuperar enquanto a Amazon continua “a trabalhar para uma resolução completa”
  • 02h27 PDT : “Estamos vendo sinais significativos de recuperação”, observa a Amazon. Graças a Deus.
  • 02h22 PDT : A Amazon diz que está “observando os primeiros sinais de recuperação de alguns serviços da AWS impactados”
  • 02:01 AM PDT : A Amazon diz que “identificou uma potencial causa raiz para as taxas de erro”
  • 01:26 AM PDT : A Amazon diz que “pode confirmar taxas de erro significativas para solicitações feitas ao endpoint do DynamoDB na região US-EAST-1”
  • 00h51 PDT : Amazon confirma “aumento nas taxas de erro e latências para vários serviços da AWS na região US-EAST-1”
  • 00h11 PDT : A Amazon confirma que está “investigando o aumento das taxas de erro e latências para vários serviços da AWS na região US-EAST-1”

Quanto tempo durará a interrupção da AWS?

Essa é a pergunta de um milhão de dólares, e a resposta curta é: não sabemos. Até agora, os problemas de hoje estão acontecendo há mais de 10 horas, tornando-se a maior indisponibilidade da AWS na Amazon em uma década.

De acordo com nossa pesquisa sobre interrupções anteriores da AWS, a interrupção mais longa dos últimos 10 anos ocorreu em agosto de 2019, quando os serviços ficaram inativos por oito horas.

Mas há luz no fim do túnel, com a Amazon afirmando que está recuperando os serviços. A situação ainda não está perfeita, e os problemas persistem em toda a internet.

Blog ao vivo sobre interrupção da Internet na AWS