Quem viveu na virada de 1999 para 2000 ouviu muito falar do famoso e temível “Bug do milênio”. Muitos países e empresas tinham medo de que, à meia-noite, uma falha global pudesse afetar todos os sistemas e redes do mundo todo, especialmente em bancos, setores de energia, telefonia e aviação, que poderiam colapsar. Mas por que esse medo? Naquela época, os sistemas de computadores usavam apenas os dois últimos dígitos para simbolizar cada ano, para economizar espaço de memória. Ou seja, em 1999, o ano era representado apenas pelo número 99. Agora, o que aconteceria quando chegasse o ano 2000? O computador armazenaria a informação como 00, mas ele entenderia que estávamos em 2000 ou em 1900? Um dos primeiros cientistas da computação a apresentar esse problema foi Bob Bemer, um programador que trabalhou na IBM entre 1950 e 1960 e que foi um dos criadores do código ASCII. Ainda na década de 70, Bemer alertou que o “Bug do Milênio” poderia causar “o fim do mundo”.
Você pode estar pensando: como isso poderia ser um grande problema? Se o computador “pensar” que é 1900 em vez de 2000, só ver os dois últimos dígitos não faria tanta diferença. Mas imagine que você inicia uma ligação telefônica no dia 31 de dezembro de 1999 às 23:59hs e termina a ligação em 01 de janeiro de 1900. Em teoria, duas coisas poderiam acontecer: primeiro, sua conta de telefone poderia vir com um saldo positivo de quase 99 anos, pois haveria horas negativas de uso. Outra possibilidade seria todos os sistemas de cobrança da operadora travarem por não conseguirem trabalhar com horas negativas. Imagine isso em um banco, onde você deixou dinheiro na poupança, e o banco retrocede seus ganhos, retirando valores por trabalhar com tempo negativo. Na computação, o tempo é usado para muitas coisas dentro dos programas. Se um computador não sabe se o tempo está avançando ou retrocedendo, isso realmente poderia causar um colapso nos sistemas.
Mas, se você viveu essa época, deve se lembrar de que não tivemos grandes problemas na virada do ano, e isso ocorreu porque foram gastos milhões de dólares em medidas preventivas, como atualizações de softwares para comportar os quatro dígitos, entre outras melhorias e soluções. Com isso, pensamos que a computação não poderia sofrer por um “Bug” que afetaria todos os sistemas de forma global.
Porém, na sexta-feira, 19 de julho de 2024, vimos o que poderia ter acontecido na prática, se o “Bug do Milênio” tivesse realmente ocorrido. A famosa e icônica tela azul do Windows pôde ser vista em vários telões pelo mundo. A falha global afetou inúmeras empresas ao redor do mundo, sendo os setores aéreo, financeiro e de saúde os mais prejudicados. Vimos cenas inusitadas, como a da empresa aérea IndiGo, uma das maiores companhias aéreas da Índia, que realizou a emissão dos cartões de embarque de forma manual, preenchidos à mão, para minimizar os prejuízos e tentar manter suas operações funcionando. No Reino Unido e na Austrália, algumas das principais redes de televisão ficaram fora do ar. Na Alemanha, cirurgias eletivas foram canceladas em dois hospitais, e os mercados de ações, commodities e câmbio em todo o mundo foram afetados. Para se ter uma ideia, a estimativa menos pessimista inicial de perdas financeiras para as empresas ultrapassa US$ 1 bilhão. Todos esses acontecimentos e perdas mostram o que teria sido o “Bug do Milênio”. O próprio bilionário Elon Musk escreveu no X (antigo Twitter): “É a maior falha de TI de todos os tempos”.
É claro que o problema ocorrido nesse dia não é o mesmo da época do “Bug do Milênio”, que envolvia problemas com datas. No entanto, a comparação em termos de estragos globais é válida. E, apesar de parecer que a maior culpada desse desastre foi a Microsoft, pois apenas os servidores com Windows foram afetados, na verdade, ela foi uma das maiores vítimas. A responsável possui um nome bem menos conhecido pelo público em geral: “Crowdstrike”, dona do software chamado “Falcon”, que causou essa pane mundial após uma atualização.
Vamos então entender quem é a “Crowdstrike”. Trata-se de uma empresa norte-americana de cibersegurança, fundada em 2012 no Texas por George Kurtz e Dmitri Alperovitch, ambos ex-funcionários da rival McAfee. A empresa é focada em criar ferramentas para proteger empresas de ataques cibernéticos. Ela se destacou no mercado por usar uma tecnologia que permite que falhas de segurança sejam implementadas e monitoradas continuamente, sem a supervisão constante de uma equipe de pessoas. Tudo é feito de forma remota através da “nuvem”, ao contrário das rivais dessa área que, até então, faziam implementações manuais nos servidores dos clientes. Para você ter uma ideia de como isso foi inovador na época, os produtos da Crowdstrike atraíram vários clientes, sendo os principais listados na “Fortune 500”, uma lista publicada anualmente pela revista Fortune que classifica as 500 maiores empresas dos EUA, usando a receita de cada empresa como critério. Se você acompanha de perto a política americana, já deve ter ouvido falar dessa empresa muitas vezes, pois ela foi contratada pelo Comitê Democrata Nacional (DNC, na sigla em inglês) para investigar um vazamento de dados do partido americano. Reportado pelo FBI em 2015, o vazamento foi investigado pela CrowdStrike em junho de 2016. A empresa concluiu na época que os sistemas foram violados por dois hackers russos, reforçando alegações iniciais do FBI, que não tem poder para conduzir essas investigações. Na época, esse vazamento expôs mais de 20 mil e-mails de servidores do Partido Democrata. Os conteúdos revelaram a vida privada de políticos e da burocracia do partido, incluindo a então pré-candidata Hillary Clinton. Devido a isso, a CrowdStrike teve um papel crucial nas eleições presidenciais dos Estados Unidos em 2016, quando o então candidato republicano Donald Trump derrotou a democrata Hillary Clinton.
Agora que conhecemos um pouco melhor essa empresa, o que efetivamente causou esse problema global? E por que os sistemas e serviços da Microsoft foram os mais prejudicados?
Segundo o próprio relatório da Crowdstrike, “o problema foi iniciado por uma atualização do mecanismo de proteção dinâmica chamado ‘Falcon’, com impacto direto em máquinas que utilizam o sistema operacional Windows. A partir das 7h09 da sexta-feira (horário de Brasília), a empresa liberou uma atualização de configuração de conteúdo ‘como parte das operações regulares’ da plataforma Falcon, desenvolvida para proteger endpoints (ou pontos de extremidade, como computadores ou telefones) contra ameaças cibernéticas. A atualização serviria para coletar dados sobre possíveis novas técnicas de ameaça. O resultado, no entanto, foi diferente do esperado”. Este é apenas um trecho do relatório explicando o problema, o documento é bem mais extenso e técnico, porém, traduzindo para uma linguagem mais simples, lembra que, quando apresentei a empresa Crowdstrike, mencionei que “A empresa se destacou no mercado por usar uma tecnologia que permite que falhas de segurança sejam implementadas e monitoradas continuamente, sem a supervisão constante de uma equipe de pessoas. Tudo é feito de forma remota através da nuvem”. Essa atualização remota e automática, sem a supervisão de pessoas, ao ser instalada, começou a causar travamentos nos servidores que possuíam a ferramenta Falcon com Windows instalado. Outros sistemas operacionais não foram afetados por essa atualização. Segundo a Microsoft, ao todo, “8,5 milhões de aparelhos com Windows foram afetados pelo bug”. Esse número é menos de 1% de todas as máquinas que usam o sistema operacional Windows, pois vale lembrar que o Falcon é vendido apenas para o mercado corporativo. Por isso, máquinas de uso pessoal que têm o Windows instalado não foram diretamente afetadas.
Agora você pode estar pensando, mas Lilian, se apenas 1% das máquinas no mundo foram afetadas, como tivemos todos esses problemas em escala global? Acredito que há dois motivos principais para isso ter ocorrido: primeiro, lembra que a maioria dos clientes da Crowdstrike estão listados na “Fortune 500”? A própria Microsoft é cliente deles e usa a plataforma Falcon nos servidores da própria empresa, incluindo sua plataforma de computação em nuvem chamada Azure. Isso prejudicou o funcionamento dos serviços da empresa, que pararam de funcionar, afinal, a Microsoft só possui servidores com Windows e a maioria com a plataforma Falcon instalada para garantir a segurança dos dados. O segundo motivo é que, apesar de apenas 1% dos computadores com Windows terem sido afetados, não são bem computadores que sofreram esse “bug”, mas sim os servidores dessas grandes empresas, que possuíam a plataforma Falcon instalada com o sistema operacional Windows, ou que usavam os serviços da Microsoft. Os servidores são responsáveis por armazenar todos os dados de forma global, como, por exemplo, o sistema que faz o check-in das empresas aéreas ou os servidores usados para transmitir conteúdo de uma TV.
Isso me faz refletir que, desde o surgimento da internet e cada vez mais dos serviços em nuvem e inteligências artificiais, começamos a nos acostumar a ter acesso às informações na hora que quisermos e onde estivermos. Filmes, séries, livros, notícias estão a um clique ou um toque nos nossos smartphones. Porém, esse “apagão global” mostra que esse controle que tínhamos é apenas uma ilusão, pois apenas um pequeno “bug” em uma empresa pode tomar proporções globais. Esse acontecimento me fez lembrar de um trecho da música: “As aventuras de Raul Seixas na cidade de Thor”. Vou deixar abaixo para refletir:
“A civilização se tornou complicada
Que ficou tão frágil como um computador
Que se uma criança descobrir
O calcanhar de Aquiles
Com um só palito para o motor”
Raul Seixas
Aproveite e junte-se ao nosso canal no WhatsApp para receber conteúdos exclusivos em primeira mão. Clique aqui para participar. Startupi | Jornalismo para quem lidera inovação!