Big data é a tendência que todos apostam, e muitas organizações passam muitas dificuldades para colocar seus dados em uso. Entretanto, apesar da campanha em torno do big data, 92% das organizações ainda estão paradas no “neutro”, planejam iniciar “em algum momento”, ou evitam completamente projetos de big data. Para aqueles 8% que dão o pontapé inicial em projetos de big data, a grande maioria falha — e frequentemente pelas mesmas razões.
Isto não precisa ser desta forma
A chave para obter sucesso com o big data é ter uma abordagem iterativa que depende dos funcionários começar pequenos e aprender frequentemente através de erros prematuros.
Mentalidade de rebanho
Big data é um grande negócio. Segundo o Gartner, 64% das organizações pesquisadas em 2013 já haviam comprado ou estavam planejando investir em sistemas de big data, um leve aumento em comparação aos 58% que deram a mesma resposta na pesquisa de 2012. Mais e mais companhias estão mergulhando em seus dados, tentando colocá-los em uso para minimizar experiências ruins ao cliente e analisar riscos financeiros.
Destes 64%, 30% já havia investido em tecnologias de big data, 19% planejava investir durante o próximo ano, e outros 15% planejavam realizar investimentos dentro dos próximos dois anos. Entretanto, menos de 8% dos 720 entrevistados pelo Gartner havia implantado de fato tecnologias de big data atualmente.
Isso é ruim, mas a razão das falhas em lançar iniciativas é pior: a maioria das companhias simplesmente não sabe o que está fazendo quando utilizam big data.
Não é segredo que muitas companhias estão gastando pequenas fortunas para recrutar e contratar analistas de dados, com salários na faixa de US$ 123 mil.
Oito maneiras de falhar
Como muitas companhias estão voando às cegas com seus dados, elas tropeçam em erros previsíveis (incluindo pensar que analistas de dados irão magicamente resolver seus problemas). Svetlana Sicular, do Gartner, catalogou oito erros que são causas comuns em projetos de big data que falharam:
Resistência ao gerenciamento. Apesar do que os dados podem nos dizer, o Fortune Knowledge Group descobriu que 62% dos líderes executivos tendem a confiar em sua intuição, e 61% afirmou que o conhecimento do mundo real sobrepujam hard analytics quando tomam decisões.
Selecionar as utilizações erradas. Companhias também começam com um projetos excessivamente ambiciosos que elas ainda não estão prontas para enfrentar, ou então tentam resolver problemas de big data usando tecnologias tradicionais de dados. Em ambos os casos, a falha é um resultado comum.
Fazendo os questionamentos errados. A ciência dos dados é uma complexa mistura de domínio do conhecimento (o profundo entendimento sobre bancos, varejo e outras indústrias), expertise em matemática e estatística e experiência em programação. Muitas organizações contratam analistas de dados que podem ser gênios em matemática e programação, mas que não possuem o componente mais importante: o domínio do conhecimento.
Svetlana está certa quando adverte que é melhor procurar por analistas de dados de dentro da organização, pois “aprender Hadoop é mais fácil do que aprender os negócios”.
Falta das habilidades certas. Este erro está relacionado bem de perto com o tópico anterior. Muitos projetos de big data param ou falham devido as habilidades insuficientes daqueles que estão envolvidos neles. Geralmente as pessoas envolvidas vêm da área de TI, e estas não são as pessoas mais qualificadas para fazer as perguntas certas aos dados.
Problemas inesperados além da tecnologia big data. Analisar dados é apenas um componente dos projetos envolvendo big data. Ser capaz de acessar e processar dados é crítico, mas isso pode falhar por motivos além disso como redes congestionadas, treinamento de equipes e por ai vai.
Estratégia empresarial desalinhada. Projetos de big data dão certo quando eles não são projetos isolados em si, mas sim parte do núcleo de como a companhia usa seus dados. O problema é exacerbado se diferentes grupos valorizam mais a nuvem ou outras prioridades estratégicas do que o big data.
Silos de big data. Fornecedores de big data são carinhosos ao falar sobre “data lakes” e “data hubs”, mas a realidade é que muitos executivos tentam construir poços de dados equivalentes, com fortes limites entre os poços de dados de marketing, de manufatura e outros tantos. O big data é mais valioso para uma organização se as paredes entre os grupos forem demolidas e seus dados circulem juntos. Políticas e práticas frequentemente previnem essa promessa.
Revogação de problemas. Algumas vezes nós sabemos ou suspeitamos que os dados irão requerir de nós ações que nós, na verdade, não desejamos ter, como a indústria farmacêutica não operar em analises de sentimentos porque quererem evitar as subsequentes obrigações legais de reportar efeitos adversos para a U.S. Food and Drug Administration.
Ao longo desta lista, um tema comum aparece: por mais que a gente possa querer focar em dados, pessoas continuam entrando no caminho. Por mais que a gente queira ser direcionado pelos dados, as pessoas definitivamente controlam os processos com big data, inclusive fazer as decisões iniciais de qual dado coletar e manter, e quais questões perguntar pra eles.
Inovação através da iteração
Como muitas companhias aparentam estar paralisadas em suas tentativas de começar projetos envolvendo big data, somado à probabilidade de que a maioria dos projetos de big data irão falhar, é imperativo ter uma abordagem repetitiva com o big data.
Em vez de começar com robusto pagamento para uma consultoria ou fornecedor, as organizações deveriam olhar por maneiras de deixar seus próprios funcionários livres para fazer experimentos com os dados.
A abordagem “começar pequeno, falhar rápido” é possivelmente é preparada nas empresas em partes pelo fato de que todas as tecnologias significativa de big data serem open source. Além do mais, muitas plataformas são imediatas e facilmente acessíveis como serviços cloud, mas diminuindo o índice para tentativas e acertos.
Fazer as perguntas certas é tudo para lidar com o big data, por isso é tão importante contar com os funcionários já existentes. Mas mesmo com o domínio do conhecimento superior, organizações ainda irão falhar em coletar os dados certos e fazer as perguntas pertinentes no início. Tais erros devem ser esperados e aceitos.
A chave é utilizar infraestruturas flexíveis de dados abertos que irão permitir ao funcionário de uma organização continuar adotando suas abordagens até que seus esforços resultem em frutos. Deste jeito, as organizações podem perder o medo e usar a frequência em direção ao uso efetivo do big data.