As interrupções do serviço em nuvem não são nenhuma novidade. No entanto, a mudança de 2020 para trabalhar em casa expôs toneladas de vulnerabilidades, à medida que operadoras, empresas de cabo e fibra e todos os aplicativos populares sob o sol experimentaram algum colapso catastrófico temporário. Colocou uma carga sem precedentes nos sistemas de infraestrutura em nuvem que suportam seus sites favoritos de streaming e produtividade. Essas interrupções foram uma consequência inevitável.
Você teria esperado que 2021 apresentasse uma melhora significativa. Em vez disso, provou que a Internet é um baralho de cartas pronto para entrar em colapso se a peça fundamental errada dobrar. Seja devido à frugalidade ou ao planejamento deficiente, muitos sites colocam todos os seus dados e ovos de tráfego em uma cesta de nuvem; apenas uma falha de nó pode eliminar alguns dos sites de maior tráfego, quando esperávamos que esses sites tivessem contingências muito melhores no local.
Vimos nossos aplicativos de mensagens favoritos, casas inteligentes, redes de jogos, suítes de produtividade e sites de mídia social entrarem em colapso em um ponto ou outro este ano. Além disso, as interrupções do Amazon Web Services (AWS) e do Facebook provaram o quanto de nossas vidas diárias depende da nuvem, desde a tecnologia de casa inteligente até a entrega de pacotes.
Olhando para as piores interrupções de 2021, só podemos esperar que as coisas melhorem em 2022. Mas não há razão para supor que isso acontecerá, a menos que as empresas de infraestrutura de nuvem e redes de entrega de conteúdo (CDNs) mudem a forma como fazem as coisas – e a menos que as empresas comecem a adicionar offline funcionalidade para tecnologia dependente da nuvem.
1. Interrupção da AWS para entregas, câmeras e alimentadores de gatos
A recente interrupção da AWS em dezembro provavelmente ainda está fresca em sua mente. Amazon Web Services supostamente funciona sobre 33% dos serviços de infraestrutura em nuvem, então, quando a AWS desmoronou em 7 de dezembro, pode ter levado cerca de um terço dos serviços em nuvem.
De acordo com Equipe AWS, a rede interna da AWS para monitoramento, DNS interno e serviços de autorização de alguma forma desencadeou um “grande surto de atividade de conexão que sobrecarregou os dispositivos de rede entre a rede interna e a rede principal da AWS, resultando em atrasos na comunicação entre essas redes.” Como essa rede interna está conectada aos servidores globais da AWS, ela causou atrasos no tráfego ou desligamentos diretos do site internacionalmente por cerca de 7 horas até que os desenvolvedores pudessem consertar a rede interna.
Durante as compras de fim de ano, os aplicativos dos motoristas de entrega da Amazon com rotas e endereços caíram, impedindo-os de concluir as entregas. Os consumidores também não podem fazer novos pedidos da Amazon, o que significa que as empresas perderam quase um dia de receita. Os serviços originais da Amazon – Alexa, câmeras Ring, Prime Video e Música – todos caíram, o que significa que suas campainhas de vídeo e monitores de bebê inteligentes tornaram-se temporariamente inúteis. E aplicativos populares de terceiros como Disney +, Venmo e iRobot quebraram graças à escolha do provedor de nuvem.
De acordo com CNBC, os efeitos da interrupção da AWS até mesmo se propagaram para atrapalhar os exames finais nas faculdades, já que alguns serviços de exame dependiam da nuvem para funcionar. Até mesmo alguns alimentadores automáticos “inteligentes” de gatos pararam de alimentar seus gatos durante o dia.
Após essa interrupção, os leitores do Android Central disseram que estavam mais cautelosos do que antes sobre a tecnologia de casa inteligente dependente da nuvem. E embora os especialistas pensem que a Amazon precisa incorporar controles offline em sua tecnologia doméstica inteligente, eles também acham que é improvável. Novamente, isso ocorre porque a nuvem permite que eles vendam tecnologia barata e de baixa potência que não teriam a capacidade de funcionar sem ela.
2. O metaverso se desfaz
Se estamos falando das interrupções mais confusas de 2021, temos que mencionar o Facebook. Pouco antes de sua mudança de nome Meta, o Facebook desligou acidentalmente seus próprios serviços em nuvem devido a “alterações de configuração nos roteadores de backbone que coordenam o tráfego de rede entre nossos data centers”, que espalharam e derrubaram todos os seus serviços online. Isso garantiu que ninguém pudesse acessar os serviços da Meta em todo o mundo, incluindo seus próprios funcionários.
Mesmo que os servidores em nuvem da Meta só forneçam energia para seus próprios negócios, como Facebook, Instagram e Whatsapp, essa interrupção ainda afetou outras empresas. Todos os sites que dependem de logins do Facebook se tornam inacessíveis para seus usuários, enquanto outros sites de compras ou jogos que dependem dos servidores ou tokens da Meta também são encerrados.
Além disso, é claro, essa interrupção do Facebook prejudicou seus próprios periféricos movidos a nuvem. Os proprietários do Quest 2 não podiam mais acessar sua biblioteca de jogos devido ao requisito de conta no Facebook, enquanto os smartglasses Ray-Ban Stories perderam a inteligência. Na época, comentamos que o Facebook precisa adicionar suporte offline para sua tecnologia no futuro.
Acima de tudo, a queda de 6 horas do Whatsapp provou ser o pior fiasco para a empresa. Para os milhões que usam o aplicativo como sua principal forma de se comunicar com a família, mesmo um único dia sem ele era um dia a mais. Após a interrupção, o Telegram teria obtido 70 milhões de novos membros. Isso não significa necessariamente Whatsapp perdido tantos usuários, mas definitivamente viu um êxodo significativo que nunca poderia reconquistar.
Whatsapp, Facebook e Instagram tiveram uma interrupção semelhante em abril de 2021, embora tenha durado apenas 45 minutos.
3. Retira rapidamente a Internet
Quando algo funciona, você não presta atenção. Portanto, muitas pessoas nunca tinham ouvido falar da rede de distribuição de conteúdo (CDN) do Fastly até que ela quebrou em junho, arrastando alguns dos sites mais populares com ela.
Um CDN ajuda a armazenar conteúdo em cache para tempos de carregamento mais rápidos e carga de largura de banda reduzida em servidores de hospedagem, razão pela qual tantas empresas confiam neles. Eles entregam dados em alta velocidade em todo o mundo, garantindo que os dados sejam transferidos para diferentes locais ao redor do mundo para manter o tempo de carregamento baixo, independentemente de onde o usuário mora.
Mas no caso de Fastly, um configuração de serviço defeituosa “provocou interrupções em nossos POPs globalmente”, o que prejudicou os sites que dependiam de sua computação de ponta. Especificamente, sites como Amazon, Twitter, Reddit, Google, CNN, The Guardian e The New York Times foram todos abertos ao mesmo tempo no início de junho. Restaurou rapidamente “95%” dos seus serviços em 49 minutos, tornando esta uma interrupção ampla, mas de duração relativamente curta, em comparação com o resto.
4. Quatro interrupções de PSN causadas por um ano complicado de PS5
Supondo que você conseguiu comprar um PS5 este ano, provavelmente você teve problemas para acessar sua biblioteca ou para jogar jogos multijogador em algum momento de 2021. Sony e CDN Akamai Technologies enfrentaram várias interrupções ao longo do ano.
A pior e mais prolongada interrupção do PSN ocorreu do final de fevereiro ao início de março, garantindo que alguns jogadores do PS5 e PS4 não pudessem acessar suas bibliotecas de jogos esporadicamente por vários dias.
No entanto, mais três interrupções nos meses subsequentes indicaram que a Sony tinha problemas de rede fundamentais para resolver. Em cada caso, jogadores de todo o mundo encontrariam mensagens de erro sobre manutenção ao acessar os serviços online, com interrupções que duravam de 1 a 5 horas.
Entre os melhores jogos PS5, muitos requerem conexões online constantes ou giram em torno do modo multijogador. Se a Sony não conseguir manter seu serviço PSN funcional por dias a fio também em 2022, isso deixará seus fãs leais infelizes.
5. O Google não pode ajudar seus clientes domésticos inteligentes
Nossa primeira grande interrupção em 2021 ocorreu em fevereiro, graças ao súbito surto de amnésia do Google Assistente. Se você tentar fazer uma pergunta ao seu alto-falante Nest ou Google Home, será informado de que “o dispositivo ainda não está configurado”, apesar de todas as evidências em contrário. Isso impossibilitou a conexão com os dispositivos Google Home associados à sua conta, desde luzes inteligentes até tecnologia de segurança Nest. Além disso, o app Google Assistente para Android também teve problemas para responder a perguntas.
Isso pareceu impactar todos os usuários do Google Home naquela noite, com os usuários acessando o Reddit e os fóruns de suporte para obter ajuda. O Google corrigiu o problema naquela noite, algumas horas depois que o problema se tornou amplamente conhecido, embora não esteja claro quando exatamente começou.
6. A casa inteligente de Wink pisca os olhos
A maioria das piores interrupções de 2021 afetaram uma ampla variedade de locais por um período relativamente curto. O prêmio para o verdadeiro pior a interrupção do ano, no entanto, vai para Wink Hubs, que fechou por 10 dias. Devido à sua nova dependência dos serviços em nuvem para funcionar, esses hubs não podiam mais controlar os produtos Zigbee ou Z-Wave, tornando-os praticamente inúteis.
A Wink ofereceu um desconto de 25% sobre os custos da assinatura como um desculpa mas, pelo que sabemos, nunca realmente expliquei o que causou o problema – apenas declarar que iria “otimizar o Wink Backend e nossa API agora que está de volta”. Muitos clientes viram essa interrupção como um sinal de que era hora de abandonar o Wink para sempre.
7. O sistema de notificações de exposição do Android entra em colapso
Quando se trata de rastreamento de contato e prevenção da exposição a COVID-19, qualquer atraso em saber sua condição pode levar a uma maior disseminação e adoecimento. Então, quando o aplicativo NHS COVID-19 apresentou problemas devido a problemas com o Sistema de Notificações de Exposição do Android no back-end do Google, essa não foi uma boa aparência para o Google.
Pessoas que queriam verificar seu status encontraram uma tela “Carregando” indefinida. O Google anunciou que investigaria o problema após cerca de 12 horas de relatórios de bug e, em seguida, levaria mais 5 a 6 horas para resolver o bug. Adicionar no falha assustadora de “notificação fantasma” a partir de 2020 – notificações incorretas de que usuários foram expostos ao COVID-19 apareceriam e desapareceriam antes que você pudesse tocar nele – e as pessoas tinham muitos motivos para desconfiar do aplicativo a essa altura.
8. Redux de interrupção de AWS
Após a grande interrupção da AWS em 7 de dezembro, vimos uma segunda interrupção da AWS em 15 de dezembro, causada por problemas nas instalações da Amazon no Oregon e no norte da Califórnia Amazon Web Services. Desta vez, tirou Twitch, DoorDash, Xbox Live, PSN, Ring, Disney + e T-Mobile.
Então, vimos uma terceira interrupção do AWS em 22 de dezembro, que desligou Fortnite, Hulu, Quora, Slack e Imgur. Nesse caso, uma queda de energia em uma instalação da costa leste causou o problema. Isso causou três interrupções em três semanas. As duas últimas interrupções duraram apenas uma hora ou mais, embora isso certamente seja tempo suficiente para causar problemas.
O problema de interrupção diminuirá ou aumentará em 2022?
Esses vários eventos destacam o quão frágil nosso sistema atual dependente da nuvem pode ser. Com tanto do nosso uso da Internet concentrado em alguns aplicativos e serviços – a maioria dos quais usa alguns grandes provedores de infraestrutura em nuvem – uma única crise pode prejudicar nossa produtividade ou tornar inútil nossa cara tecnologia.
Então, podemos esperar menos contratempos no próximo ano?
Para ver menos interrupções, precisaríamos ver mais investimentos em infraestrutura de nuvem. O recente conta de infraestrutura tem bilhões alocados para melhorar o acesso à banda larga rural de alta velocidade e a segurança cibernética civil, mas a maioria das piores interrupções de 2021 vieram de erros da empresa, não de atores hostis. Portanto, podemos ter que contar (ou pressionar) as empresas a investirem mais na infraestrutura de nuvem.
Do jeito que está, Gartner prevê que as empresas gastarão US $ 482 bilhões em serviços em nuvem em 2022, um aumento de 21,7%. Isso deve ser um passo na direção certa, pelo menos.
É importante observar que muitas das piores interrupções resultaram de empresas interno redes de monitoramento ou de CDNs de terceiros, não dos servidores principais. Os próprios sistemas destinados a supervisionar e prevenir interrupções podem derrubar todo o sistema nas circunstâncias erradas, onde o erro humano pode ter consequências desproporcionais. E embora os CDNs sejam vitais para fornecer o tráfego mais rápido possível, eles adicionam mais uma etapa potencial onde algo pode dar errado.
Quando um único nó, servidor ou data center pode derrubar o sistema, não importa quanto você investe. Para que as grandes interrupções diminuam em 2022, precisamos que as empresas estruturem melhor seus dados, para que os backups possam ser iniciados rapidamente até que o nó problemático seja corrigido. Estamos em muito melhor forma do que há dois anos, mas ainda temos um longo caminho a percorrer até que as interrupções se tornem menos persistentes.
Podemos ganhar uma comissão por compras usando nossos links. Saber mais.