Líder de ciência de dados da companhia explica como os jornalistas têm utilizado ferramentas como machine learning para uma atuação mais eficaz
Os jornalistas da Bloomberg vêm divulgando notícias de negócios desde 1990, mas suas reportagens dependem, cada dia mais, da ciência de dados. Essa mudança levou o chefe da ciência de dados, Gideon Mann, a um papel fundamental na empresa.
O executivo passou sete anos como pesquisador do Google antes de ingressar na Bloomberg, em 2014, e tinha pouca experiência anterior em finanças. Ele ficou surpreso ao ver a influência que os jornalistas exercem sobre os mercados.
“Antes de começar na Bloomberg, eu não entendia a natureza de como as notícias movimentam os mercados. As coisas acontecem no mundo real e geralmente há um jornalista que está escrevendo e falando a respeito e espalhando a palavra, e é assim que essa informação é divulgada (ao público em geral)”, diz.
A equipe de Mann desenvolve ferramentas e técnicas de ciência de dados que ajudam os jornalistas da Bloomberg a analisar notícias, mídias sociais, documentos financeiros e press releases mais rapidamente para descobrir os insights financeiros que formam a base de seus artigos.
Quando a Bloomberg News foi fundada, ela se concentrava em informações econômicas básicas, como precificação de mercado e dados de bolsa de valores, mas, nos últimos anos, dados não estruturados se tornaram um elemento crucial de seus relatórios.
Os novos repórteres
Agora, a publicação confia nos esforços combinados de humanos e máquinas. Tarefas individuais são frequentemente automatizadas, mas há poucos trabalhos sem uma contribuição humana.
“Produzimos notícias automatizadas, mas, mais do que isso, fazemos muitas histórias híbridas entre humanos e computadores. O computador apresenta uma primeira reportagem e, em seguida, um jornalista a analisa e elabora, para colocá-la em contexto e explicar todo o ato narrativo”, explica.
As equipes que estão escrevendo esses programas são uma mistura de jornalistas e cientistas da computação. Os profissionais usam sua decisão editorial para dizer quando algo é de interesse para, em seguida, uma pessoa formatá-lo.
O desenvolvimento da ciência de dados faz com que os jornalistas possam movimentar os mercados com maior rapidez e complexidade, pois sua análise é mais reativa às informações e fornece insights mais profundos.
“Eu realmente acho que o que acontece é que os efeitos das notícias se propagam rapidamente. Eu não acho que isso significa que há um mercado mais caótico, mas que uma informação entra no mercado e ele se adapta muito rapidamente, e esse período de adaptação é muito rápido”, comenta o especialista.
Os números por trás dos gráficos
Um tipo de informação não estruturada que é particularmente difícil de processar são os dados encontrados em gráficos, pois o software existente não consegue identificar os dados em uma representação visual.
Para acabar com o problema, a equipe de Mann desenvolveu um sistema chamado Scatteract, que formata os dados encontrados nos gráficos para revelar as informações que geraram cada ponto.
O sistema usa o reconhecimento óptico de caracteres e técnicas de aprendizado intensivo para obter pontos de dados numéricos da imagem de um gráfico e, em seguida, converter os resultados em tabelas.
A Bloomberg afirma que este é o primeiro sistema que usa machine learning para extrair dados numéricos de gráficos. Ele pode analisar os dados de 78% dos gráficos de dispersão encontrados na Web e, em seguida, usar os resultados para informar uma análise secundária.
Outra grande mudança para os jornalistas da Bloomberg é o surgimento de dados alternativos. Os profissionais têm tradicionalmente confiado em fontes estabelecidas de informação para sua análise, mas agora qualquer pessoa com uma conta de mídia social pode disseminar dados influentes encontrados em lugares surpreendentes.
Mídias sociais
As ferramentas usadas para analisar esses formatos de dados emergentes também estão mudando o relatório de notícias. Uma delas é chamada de Processamento de Linguagem Natural.
Um bom exemplo é: quando um jornalista está monitorando o Twitter, um modelo de machine learning fornece um feed especializado com os tweets mais relevantes para eles.
“O Twitter é um meio em que você pode expressar qualquer tipo de informação material, da mesma forma que um comunicado de imprensa, e assim CEOs e empresas fazem anúncios diretamente no Twitter”, diz Mann.
Elon Musk, por exemplo, anunciou no Twitter que estava considerando deixar a Tesla no mercado privado. Seu tweet fez com que as ações da Tesla subissem 11% até o final do dia e levaram os órgãos reguladores a adotar a medida incomum de suspender as negociações das ações.