Falha massiva da AWS deixa Amazon, Snapchat e Venmo offline

Falha massiva da AWS deixa Amazon, Snapchat e Venmo offline

out, 20 2025

Quando Amazon Web Services (AWS) começou a apresentar erros críticos às 01:53 UTC de 20 de outubro de 2025, usuários de todo o mundo perceberam que seus aplicativos favoritos estavam sumindo da tela. O problema começou no cluster de data centers de North Virginia, região US‑EAST‑1, e rapidamente se espalhou para 21 serviços da própria AWS, dentre eles o DynamoDB. O efeito dominó acabou derrubando plataformas como Snap Inc. (Snapchat), Robinhood Markets Inc., PayPal Holdings Inc. (Venmo) e até o serviço de jogos da Epic Games Inc.. A interrupção, anotada como AWS outageUS‑EAST‑1 (North Virginia), ainda não tem hora de solução prevista.

Contexto técnico: o que falhou?

O ponto de partida foi um aumento inesperado nas taxas de erro do DynamoDB, um banco NoSQL totalmente gerenciado que alimenta milhões de aplicações. Dados começaram a ser descartados ou redirecionados incorretamente, acentuando a latência para níveis críticos. Em termos simples, era como se o caminho das cartas em um baralho fosse desordenado a cada jogada.

Segundo o AWS Health Dashboard, o incidente elevou a gravidade para “Severity 1” às 08:19 UTC, acionando o time de Adam Selipsky, Senior Vice President de Infraestrutura de Engenharia da AWS. Não foram divulgados comentários diretos, mas a escalada indica que recursos de backup foram mobilizados imediatamente.

Impacto nas empresas afetadas

Até 08:09 UTC, o site de monitoramento Downdetector registrava mais de 15 000 incidentes apenas na plataforma de comércio da Amazon.com, Inc.. O app móvel foi o mais golpeado, com latências que deixaram usuários em espera por minutos. Já o Snapchat viu mensagens não entregues e filtros quebrados; a Robinhood Markets Inc. teve atrasos nas ordens de compra e venda, gerando preocupação entre investidores.

O PayPal Holdings Inc., por meio do Venmo, emitiu aviso aos usuários de que “os fundos estão seguros”, apesar da indisponibilidade temporária do serviço. Coinbase Global Inc. também garantiu a integridade das carteiras, mas admitiu que algumas funcionalidades estavam offline.

Reações e esclarecimentos das partes

Os CEOs das empresas não falaram diretamente, mas suas equipes de comunicação deram posições rápidas nas redes sociais. A mensagem padrão de Epic Games Inc. foi: "Estamos trabalhando com a AWS para restaurar o Epic Games Store o mais rápido possível".

Enquanto isso, analistas de mercado apontam que a dependência de um único ponto — o US‑EAST‑1 — deixa a arquitetura vulnerável. "É como confiar todo o tráfego de um país a uma única ponte", explicou Maria Santos, especialista em infraestrutura de nuvem da IDC Brasil. Ela acrescentou que muitas empresas ainda não implementaram estratégias de failover multi‑região.

Custos estimados e repercussões econômicas

Custos estimados e repercussões econômicas

Com base nos modelos de perda de receita da Gartner, uma paralisação como essa pode gerar mais de US$ 150 milhão por hora para o ecossistema afetado. Para a Amazon Web Services, que registrou receita de US$ 101,48 bilhão em 2024, o impacto financeiro imediato pode ultrapassar a casa dos bilhões ao considerar multas contratuais e danos à reputação.

Empresas de capital aberto viram queda temporária nas ações: a ação da Snap Inc. recuou 3,2 % nas primeiras horas de negociação, enquanto o índice Nasdaq‑100 refletiu a turbulência com perda de 0,8 %.

O que esperar nos próximos dias

Especialistas sugerem que a AWS deve publicar um relatório detalhado dentro de uma semana, destacando as causas raiz e as lições aprendidas. Enquanto isso, empresas que dependem do US‑EAST‑1 são aconselhadas a migrar cargas críticas para regiões alternativas (por exemplo, US‑WEST‑2 ou EU‑CENTRAL‑1) e a revisar seus planos de recuperação de desastres.

Para os usuários finais, a recomendação é manter aplicativos atualizados e monitorar os canais oficiais da AWS. A saúde da nuvem foi testada, e embora o serviço esteja se restabelecendo gradualmente, a experiência servirá de alerta para todo o setor tecnológico.

Resumo dos principais fatos

Resumo dos principais fatos

  • Início da falha: 01:53 UTC, 20/10/2025, data center de North Virginia (US‑EAST‑1).
  • Serviços afetados: DynamoDB + 20 outros, impactando Amazon, Snapchat, Robinhood, Venmo, Epic Games, Lyft, Coinbase, entre outros.
  • Incidentes reportados na Amazon: >15 000 até 08:09 UTC.
  • Perda estimada: >US$ 150 mi/hora para o ecossistema afetado.
  • Responsável na AWS: equipe de Infraestrutura de Engenharia liderada por Adam Selipsky.

Perguntas Frequentes

Qual foi a causa principal da interrupção da AWS?

A falha começou em um cluster de servidores do DynamoDB na região US‑EAST‑1, gerando aumento de erros e latência que se propagou a outros 20 serviços da AWS, provocando o colapso em cadeia.

Quais aplicativos populares foram afetados?

Snapchat, Robinhood, Venmo, Epic Games Store, Lyft, Pokémon GO, Roblox e a própria loja da Amazon sofreram interrupções ou desempenho degradado durante a falha.

Quando a AWS deve restaurar os serviços?

Até o momento não há cronograma oficial. A equipe de Infraestrutura, liderada por Adam Selipsky, está trabalhando para estabilizar o ambiente e fará um comunicado detalhado em até uma semana.

Quais lições as empresas devem tirar desse incidente?

A principal lição é diversificar regiões de implantação. Contar com múltiplas zonas ou regiões da nuvem reduz a exposição a falhas localizadas como a de North Virginia.

Os dados dos usuários estavam em risco?

Nenhuma violação de segurança foi reportada. Serviços como Venmo e Coinbase afirmaram que os fundos e informações dos usuários permaneceram seguros, apesar da indisponibilidade temporária.

1 Comment

  • Image placeholder

    Camila A. S. Vargas

    outubro 20, 2025 AT 22:53

    É sensato reconhecer que falhas de infraestrutura, embora raras, são inerentes aos sistemas complexos. A AWS tem demonstrado, ao longo dos últimos anos, um compromisso notável com a resiliência, e incidentes como este servem como oportunidades de aprendizado. A transparência adotada no comunicado oficial reforça a confiança dos clientes, ainda que o impacto imediato seja considerável. É imprescindível que as empresas revisem seus planos de contingência, adotando estratégias multi‑região que reduzam a dependência de um único ponto de falha. A cooperação entre equipes de engenharia e suporte pode acelerar a restauração dos serviços, minimizando prejuízos operacionais. Além disso, a adoção de práticas de monitoramento proativo pode detectar anomalias antes que se tornem catastróficas. Recomendo que os profissionais de TI aproveitem esse episódio para fortalecer sua postura de governança de risco. Em suma, embora o contratempo seja lamentável, ele fornece subsídios valiosos para aprimorar a robustez do ecossistema cloud.

Escreva um comentário