A Microsoft e a Warner Bros. colaboraram para armazenar e recuperar com sucesso todo o icônico filme ‘Superman’ de 1978 em um pedaço de vidro do tamanho de aproximadamente um porta-copo quadrado de 7,5 cm por 7,5 cm e 2 mm de espessura.

Foi a primeira prova de conceito do Project Silica, um projeto da Microsoft Research que utiliza descobertas recentes em laser ultrarrápido óptico e inteligência artificial para armazenar dados em vidro de quartzo. Um laser codifica os dados no vidro criando camadas de grades tridimensionais em nanoescala e deformações em várias profundidades e ângulos. Os algoritmos de aprendizado de máquina leem os dados novamente decodificando imagens e padrões criados à medida que a luz polarizada brilha através do vidro.

O vidro de sílica dura pode suportar ser fervido em água quente, assado no forno, colocado no microondas, inundado, polido, desmagnetizado e outras ameaças ambientais que podem destruir arquivos históricos ou tesouros culturais de valor inestimável, se as coisas derem errado.

Representa um investimento do Microsoft Azure para desenvolver tecnologias de armazenamento criadas especificamente para padrões de computação em nuvem, em vez de depender da mídia de armazenamento projetada para funcionar em computadores ou outros cenários. É apenas uma das muitas maneiras pelas quais o Azure conta com a experiência em pesquisa da Microsoft para resolver desafios de curto e longo prazo – dos testes do data center subaquático do Project Natick ao poder de processamento do FPGA do Project Brainwave e à emergente pesquisa Optics for the Cloud.

“Armazenar todo o filme ‘Superman’ em vidro e poder lê-lo com sucesso é um marco importante”, disse Mark Russinovich, diretor de tecnologia do Azure. “Não estou dizendo que todas as perguntas foram totalmente respondidas, mas parece que agora estamos em uma fase de trabalhar no aperfeiçoamento e na experimentação, em vez de fazer a pergunta ‘podemos fazer isso?’”

A Warner Bros., que entrou em contato com a Microsoft após conhecer a pesquisa, está sempre em busca de novas tecnologias para proteger sua vasta biblioteca de ativos: tesouros históricos como ‘Casablanca’, programas de rádio da década de 1940, curtas-metragens animados, filmes teatrais captados digitalmente, seriados de televisão, diários dos sets de filmagem. Durante anos, eles procuraram por uma tecnologia de armazenamento que pudesse durar centenas de anos, resistir a inundações ou erupções solares e que não exigisse manutenção a uma certa temperatura ou precisasse de atualização constante.

“Essa sempre foi a nossa esperança para o que acreditávamos ser possível um dia; portanto, quando soubemos que a Microsoft havia desenvolvido essa tecnologia baseada em vidro, queríamos provar isso”, disse Vicky Colf, diretora de tecnologia da Warner Bros.

Reduzindo os custos de armazenamento a longo prazo

A maioria das pessoas pensa na “nuvem” como uma maneira de armazenar tudo, desde milhares de fotos de família a milhões de e-mails sem ocupar espaço no telefone ou no computador. Mas todas essas informações estão sendo fisicamente armazenadas no hardware em um local remoto, permitindo que você as acesse a partir de vários dispositivos.

A quantidade de dados que a humanidade está procurando armazenar – desde registros médicos a vídeos engraçados de gatos até imagens tiradas por naves espaciais – está explodindo ao mesmo tempo em que a capacidade das tecnologias de armazenamento existentes diminui.

Os custos de armazenamento a longo prazo aumentam pela necessidade de transferir dados repetidamente para mídias mais novas antes que as informações sejam perdidas. As unidades de disco rígido podem se desgastar após três a cinco anos. A fita magnética pode durar apenas de cinco a sete. Os formatos de arquivo ficam obsoletos e as atualizações são caras. Em seus próprios arquivos digitais, por exemplo, a Warner Bros. migra proativamente o conteúdo a cada três anos para ficar à frente dos problemas de degradação.

O armazenamento em vidro pode se tornar uma opção de baixo custo, porque você grava os dados no vidro uma única vez. Os lasers de femtossegundos – aqueles que emitem pulsos ópticos ultracurtos e que são comumente usados na cirurgia de olhos LASIK – alteram permanentemente a estrutura do vidro, para que os dados possam ser preservados por séculos.

O vidro de quartzo também não precisa de ar-condicionado com uso intensivo de energia para manter o material a uma temperatura constante ou sistemas que removem a umidade do ar – o que pode reduzir o impacto ambiental do armazenamento de dados em larga escala.

“Não estamos tentando construir coisas que você coloca em sua casa ou que reproduzem filmes. Estamos construindo armazenamento que opera em escala de nuvem”, disse Ant Rowstron, diretor adjunto do laboratório da Microsoft Research em Cambridge, no Reino Unido, que colaborou com a Universidade de Southampton para desenvolver o Project Silica.

“Uma coisa importante que queríamos eliminar é esse ciclo caro de mover e reescrever dados para a próxima geração. Nós realmente queremos algo que você possa colocar na prateleira por 50, 100 ou 1.000 anos e esquecer até precisar”, disse Rowstron.

O Project Silica visa armazenar o que é conhecido como dados “frios” – dados de arquivo que podem ter um valor tremendo ou que as empresas precisam manter – mas que não precisam ser acessados com frequência. Isso pode incluir dados médicos que devem ser mantidos durante toda a vida do paciente, dados de regulamentação financeira, contratos legais, informações geológicas referentes à exploração de energia e planos de construção que as cidades precisam manter.

A Warner Bros. estava muito interessada em ajudar a Microsoft a testar soluções que pudessem aliviar os custos e ineficiências associados ao armazenamento de dados nesses horizontes de longo prazo, disse Colf.

“Com a maior biblioteca de conteúdo do setor de mídia e entretenimento, de muitas maneiras, nossos desafios são únicos em sua escala, mas certamente não são únicos em termos do problema que estamos tentando resolver”, disse ela.

Transformando dados digitais em artefatos físicos

Com quase 100 anos de história no cinema e na televisão, a Warner Bros. é dona de uma das bibliotecas de entretenimento mais profundas e significativas do mundo. Relançar filmes antigos em novos formatos ou para novos públicos é uma parte importante dos negócios. Também é uma tremenda responsabilidade cultural preservar perpetuamente algumas das histórias mais queridas do mundo, disse Colf.

“Imagine se um título como o ‘Mágico de Oz’ ou um programa como ‘Friends’ não estivesse disponível para geração após geração para apreciar, ver e entender”, disse ela. “Achamos que isso é inimaginável, e é por isso que assumimos o trabalho de preservar e arquivar nosso conteúdo com muita seriedade.”

A empresa possui planos de redundância para lidar com vários aspectos de cenários ruins: um terremoto ou furacão que atinge uma das costas, um incêndio onde os sistemas de supressão não entram em ação ou uma falha no controle climático que permita que a umidade se acumule e arruíne estoque de filme.

O objetivo é ter três cópias de arquivo de cada ativo armazenadas em locais diferentes ao redor do mundo: duas cópias digitalizadas separadas, juntamente com a cópia física original em qualquer meio em que um episódio de filme ou televisão ou desenho animado foi criado.

Felizmente, os negativos originais do filme durarão séculos se armazenados nas condições certas. Mas para alguns programas de televisão mais antigos – pense em episódios de ‘Alice’ gravados na década de 1970 – a cópia física original tem uma vida útil limitada que requer migração para novos formatos. E para os filmes e programas de televisão atuais gravados digitalmente, a terceira cópia com qualidade de arquivo possui um ciclo de migração muito curto de três a cinco anos, o que é um desafio para gerenciar.

“Digamos que um programa de TV esteja entrando diretamente em nossos arquivos digitais; não há nada físico”, disse Steven Anastasi, vice-presidente da Warner Bros. para arquivos de mídia global e serviços de preservação. “O arquivo digital está entrando, mas não tenho algo que eu possa colocar em um cofre ou em uma mina de sal ou qualquer coisa física entrando no edifício.”

A Warner Bros. está olhando para o Project Silica para potencialmente criar um ativo físico permanente para armazenar conteúdo digital importante e fornecer cópias de backup duráveis. No momento, para lançamentos teatrais gravados digitalmente, a empresa cria uma terceira cópia arquivada, convertendo-a novamente em filme analógico. A gravação final é dividida em três componentes de cores – ciano, magenta e amarelo –, cada um transferido para negativos de filme em preto-e-branco que não desaparecem como o filme colorido.

Esses negativos são colocados em um arquivo de armazenamento a frio. Nesses cofres altamente gerenciados, a temperatura e a umidade são rigorosamente controladas, e os aspiradores de ar procuram sinais de decomposição química que possam sinalizar problemas. Se eles precisam do filme de volta, eles devem reverter essas etapas complicadas.

Esse processo é caro, e há apenas um punhado de laboratórios de filmes no mundo que podem fazê-lo. E o processo não é ideal do ponto de vista qualitativo, disse Brad Collar, vice-presidente sênior de arquivos e engenharia de mídia da Warner Bros.

“Quando filmamos algo digitalmente – com zeros e uns que representam os pixels na tela – e imprimimos isso em um meio analógico chamado filme, destruímos os valores originais dos pixels. E, com certeza, parece muito bom, mas não é reversível”, disse Collar.

“Se pudermos pegar a representação digital desses pixels, colocá-la em uma mídia como sílica e lê-la exatamente como era quando saiu da câmera, fizemos nosso trabalho de preservação da melhor maneira possível. É o que eu amo nisso”, disse ele.

Não é econômico criar arquivos de negativos de filmes para todos os episódios de televisão digitalizados na biblioteca da Warner Bros. A empresa espera que o Project Silica possa ser uma alternativa mais barata e de qualidade superior para criar arquivos físicos de conteúdo digital.

Há muito mais trabalho pela frente para alcançar essa escala – os pesquisadores da Microsoft precisariam aumentar significativamente a velocidade com que os dados podem ser gravados e lidos, além da densidade. A Warner Bros. visualiza sua própria infraestrutura para ler dados dos arquivos de vidro. Mas os dois parceiros veem a promessa de quão longe chegaram.

“Se a solução de armazenamento do Project Silica for a mais econômica e escalável possível – e todos reconhecemos que ainda é cedo – é algo que gostaríamos de ver adotado por outros estúdios, nossos pares e outras indústrias”, Colf disse.

“Se funcionar para nós, acreditamos firmemente que isso será um benefício para quem quiser preservar e arquivar conteúdo”, disse ela.

Projetando armazenamento para a nuvem

É impossível saber quanta informação foi perdida porque ninguém percebeu seu valor na época – desde filmes mudos que ninguém imaginava que jamais seriam vistos fora de um teatro a dados históricos dos quais as ferramentas analíticas modernas e a IA poderiam obter novas ideias.

Um objetivo da pesquisa de armazenamento de próxima geração da Microsoft, que inclui esforços paralelos para armazenar dados no DNA, é desenvolver soluções que sejam baratas o suficiente e sem grande esforço para que você não precise escolher entre armazenar seus dados ou não, diz a empresa.

Os pesquisadores da Microsoft passaram anos tentando chegar lá com as tecnologias atualmente usadas nos data centers. Mas o tamanho, a forma e as restrições de coisas como fita em carretel e discos giratórios – todos inventados para outros fins muito antes da existência da nuvem – simplesmente não conseguiam os ganhos que eles desejavam.

“Nós apenas pensamos ‘podemos construir algo do zero para a nuvem que não precise fazer mais nada?’”, disse Rowstron.

Em colaboração com o Centro de Pesquisa Optoeletrônica da Universidade de Southampton, os pesquisadores demonstraram originalmente como armazenar dados em vidro com lasers de femtossegundos. Com o investimento do Azure, o laboratório da Microsoft em Cambridge, Reino Unido, montou uma equipe interdisciplinar de físicos, especialistas em óptica, engenheiros elétricos e pesquisadores com experiência em armazenamento para impulsionar ainda mais a tecnologia.

Desde então, a equipe da Microsoft Research alcançou avanços dramáticos em velocidade e precisão. Eles também trabalharam em estreita colaboração com seus colegas do Azure para projetar o Project Silica com os desafios e requisitos diários do armazenamento em nuvem comercial em mente.

“Colocar todas as informações e pensar no projeto a partir do primeiro dia significa que, no final, geraremos algo realmente útil para eles”, disse Rowstron sobre o relacionamento com a equipe de produtos do Azure.

Os lasers infravermelhos do Project Silica codificam dados em ‘voxels’, o equivalente tridimensional dos pixels que compõem uma imagem plana. Diferente de outras mídias de armazenamento óptico que gravam dados na superfície de algo, o Project Silica armazena dados dentro do próprio vidro. Um pedaço de vidro com 2 mm de espessura, por exemplo, pode conter mais de 100 camadas de voxels.

Os dados são codificados em cada voxel, alterando a força e a orientação de pulsos de laser intensos que deformam fisicamente o vidro. É como criar icebergs de cabeça para baixo em nível de nanoescala, com diferentes profundidades, tamanhos e ranhuras que os tornam únicos.

Para ler os dados de volta, os algoritmos de aprendizado de máquina decodificam os padrões criados quando a luz polarizada brilha através do vidro. Diferentemente do armazenamento em fita – que leva tempo para chegar ao local que você deseja ler de volta – os algoritmos podem se concentrar rapidamente em qualquer ponto do quadrado de vidro, reduzindo potencialmente o tempo de espera para recuperar informações.

“Se você tem idade suficiente para lembrar de como era rebobinar e encaminhar músicas em fitas cassete, pode demorar um pouco para chegar à parte desejada”, disse Richard Black, principal engenheiro de software de pesquisa da Microsoft. “Por outro lado, é muito rápido ler de volta o vidro, porque você pode se mover simultaneamente dentro do eixo x, y ou z.”

Ao contrário de copos de vinho frágeis ou lâmpadas, os quadrados de vidro de quartzo usados para armazenamento de dados são surpreendentemente difíceis de destruir. No início, a equipe de pesquisa tentou assar um no forno a 500 graus, microondas, fervê-lo e esfregá-lo com palha de aço. E quando eles leram os dados, tudo ainda estava lá.

Isso fez todo o sentido para os arquivistas da Warner Bros., que anos atrás descobriram caixas de séries de rádio do Superman gravadas na década de 1940 em pedaços de vidro de tamanho recorde.

“Na verdade, encontramos aparelhos nos quais poderíamos reproduzir essas coisas novamente, e elas eram muito boas porque estavam armazenadas em vidro. E conseguimos digitalizar e salvar essas maravilhosas partes do conteúdo”, disse Collar.

“Então, agora um dos nossos ativos mais antigos em nosso cofre é o vidro e uma das mais recentes tecnologias em nosso mesmo cofre é o vidro. E os dois são Superman. Então, nós realmente fizemos um círculo completo ”, disse ele.