Algumas abordagens sobre Big Data me trazem à memória a história de um amigo que representava uma empresa na época de ouro do EDI (Electronic Data Interchange). Em uma visita comercial a uma cliente da indústria farmacêutica, ele esperou ser recebido por quase duas horas. Quando enfim foi convidado a entrar na sala de reunião, o cliente se desculpou e disse que ele teria apenas 10 minutos.
Então, à frente de um grupo de executivos e potenciais compradores, disse que nem queria se sentar dado à restrição de tempo. Iniciou sua exposição dizendo: “Tenho em meu bolso um disquete (sim, isso já existiu!), quanto os senhores pagariam por ele?”. Os executivos se entreolharam e rindo ofereceram 1 ou 2 reais. Esse meu amigo então disse: “E agora se eu disser que nesse disquete tem uma lista de contato de médicos de São Paulo”. Os executivos dessa vez, ainda sorrindo, disseram talvez pagar 100 ou 200 reais. Disse agora esse amigo: “Mas se eu disser que essa lista de contatos de médicos, são cardiologistas dos principais hospitais e clínicas que atendem às classes A e B de São Paulo, incluindo informações de nomes e horários de suas secretárias, quanto os senhores pagariam?”. Dessa vez os executivos, sorrindo, disseram ser completamente diferente e pagariam muito mais. Meu amigo guardou de volta seu disquete no bolso e disse apenas: “Quando os senhores tiverem tempo para negociar, estarei à disposição”.
Bem, o fim da história foi claro, um grande contrato e uma bela comissão para esse amigo. Saber distinguir e esclarecer a diferença entre armazenamento, dado e informação é essencial quando o que se busca é transformar dados em valor para negócio.
Em uma sociedade digital e de compartilhamento como a de hoje, quase tudo é registrado e partilhado, seja digitando, fotografando ou filmando, de forma manual ou instrumentada (humanos-humanos-máquinas-máquinas-empresas-empresas), parados ou se movendo, de forma estruturada ou desestruturada. Duplicar a quantidade de informação a cada dois anos é fácil, como prova recente pesquisa do IDC. No Brasil se estima haver mais que 200 exabytes armazenados, e chegará em cinco anos a mais que 1.500 exabytes. Segundo estudo da FGV já são 136 milhões de computadores, ou seja, dois computadores para cada três brasileiros, e em dois anos estima-se que o número de computadores será igual a população – 200 milhões. E claro, esses dados precisam transitar do ponto de origem até o seu destino, Big Data precisa de Big Trafic. No Brasil estima-se algo em torno de dois Exabytes por mês e deverá chegar em torno de 3,5 exabytes até 2017.
É inegável que as corporações hoje estão determinadas a fazer uso sistêmico das inúmeras tecnologias envolvidas nessa onda. Segundo o Gartner, 42% das empresas irão investir em Big Data em uma janela de um ano. Portanto, independente se seguir pela opção on-premises (nuvem instalada no local do cliente) ou off-premises (nuvem com estrutura compartilhada), é crítica a seleção de parceiros tecnológicos e de negócios com capacidade e estrutura para investir e evoluir nesse universo. O sucesso de uma parceria está em encontrar empresas que entreguem serviços seguros de transmissão com qualidade e desempenho, com oferta de capacidade de armazenamento em grande escala e com flexibilidade, além de poder computacional em modalidade física ou virtual, privada ou pública, sem esquecer dos serviços profissionais capazes de lidar com ambientes heterogêneos e extremamente dinâmicos.
O desafio não será fácil, mas tudo começa com a clareza da história que lembro do meu amigo que discerne muito bem o que é um simples repositório, o dado em si e a informação. Parece óbvio, mas disso depende toda a capacidade analítica que beneficiará seu negócio.
*André Magno é diretor de produtos da Level 3