Logotipo IT Forum
IT Forum Instituto Itaqui Distrito Itaqui IT Invest
IT Forum - A Comunidade de Tecnologia se Encontra Aqui
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • IA
  • Cibersegurança
  • Plataformas
  • ESG
  • Vídeos
  • Nossas colunas
  • Colunistas
  • Pesquisas
  • Prêmios
Revistas
  • IT Forum Líderes
  • Series
  • Histórias da TI
  • Ver todos
  • Todos os eventos
  • IT Forum Trancoso
  • IT Forum Forte
  • IT Forum Mata
  • Sobre o HIT
  • Todos os materiais
Todas as notícias Negócios Liderança CIO Carreira IA Cibersegurança Plataformas ESG Vídeos
Nossas colunas Colunistas
Pesquisas Prêmios
Revistas
Todos os videocasts E agora, TI? Entre Tech IT Forum Líderes Series
Todos os eventos Trancoso
Todos os materiais Todos os materiais
  1. Home
  2. Notícias
  3. Inteligência Artificial
  4. Corrida da Meta para superar OpenAI: “Precisamos aprender a construir a fronteira e vencer esta corrida”
meta
openai

Corrida da Meta para superar OpenAI: “Precisamos aprender a construir a fronteira e vencer esta corrida”

Documentos recém-divulgados revelam que a Meta planeja usar o site de pirataria de livros LibGen para treinar seus modelos de IA

Publicado:
17/01/2025 às 12:20
Redação
Redação
Leitura
3 minutos
Smartphone exibindo a tela com o texto 'Meta AI' sobre um fundo colorido em tons de azul e rosa. Ao fundo, o logotipo da Meta é parcialmente visível, destacando tecnologias de inteligência artificial desenvolvidas pela empresa (meta ai, whatsapp, meta)
Imagem: Shutterstock

Segundo o The Verge, uma grande ação judicial de direitos autorais contra a Meta revelou uma série de comunicações internas sobre os planos da empresa para desenvolver seus modelos de IA de código aberto, Llama, incluindo discussões sobre como evitar “cobertura da mídia sugerindo que usamos um conjunto de dados que sabemos ser pirateado”.

As mensagens, que fazem parte de uma série de documentos deslacrados por um tribunal da Califórnia, sugerem que a Meta utilizou dados protegidos por direitos autorais no treinamento de seus sistemas de IA e trabalhou para ocultar esse fato enquanto tentava superar concorrentes como OpenAI e Mistral. Trechos dessas mensagens foram revelados pela primeira vez na semana passada.

Em um e-mail de outubro de 2023 para o pesquisador de IA da Meta, Hugo Touvron, Ahmad Al-Dahle, vice-presidente de IA generativa da Meta, afirmou que o objetivo da empresa “precisa ser o GPT-4”, referindo-se ao modelo de linguagem lançado pela OpenAI em março de 2023. Al-Dahle acrescentou que a Meta precisava “aprender a construir a fronteira e vencer essa corrida”. Esses planos aparentemente envolviam o uso do site de pirataria de livros Library Genesis (LibGen) para treinar seus sistemas de IA.

Leia também: World: escaneamento de íris viraliza no TikTok enquanto empresa enfrenta investigação da ANPD

Em um e-mail não datado, o diretor de produto da Meta, Sony Theakanath, enviado à vice-presidente de pesquisa em IA, Joelle Pineau, ponderava se o LibGen deveria ser usado internamente apenas como benchmark ou se deveria ser integrado ao treinamento do modelo. Theakanath mencionou que “a GenAI foi aprovada para usar o LibGen para o Llama3… com uma série de mitigações acordadas”, após escalar a questão para “MZ” — presumivelmente Mark Zuckerberg, CEO da Meta.

Theakanath destacou que “LibGen é essencial para atingir números de ponta (SOTA)” e observou que “é sabido que a OpenAI e a Mistral estão usando a biblioteca em seus modelos (informação não oficial)”. OpenAI e Mistral não confirmaram se utilizam o LibGen.

Os documentos judiciais são parte de uma ação coletiva movida por Richard Kadrey, Sarah Silverman e outros, acusando a Meta de usar conteúdo protegido por direitos autorais de forma ilegal para treinar seus modelos de IA, violando leis de propriedade intelectual. Como outras empresas de IA, a Meta argumenta que o uso de materiais protegidos em dados de treinamento constitui “uso justo”.

Algumas das “mitigações” para o uso do LibGen incluíam remover dados marcados como pirateados e evitar citar externamente o uso de quaisquer dados de treinamento do site. Outras mensagens mostram esforços para mascarar informações de direitos autorais, como remover cabeçalhos de copyright, identificadores de documentos, metadados e até listas de autores para reduzir riscos legais.

No contexto de escassez de dados, líderes de frontier labs, como OpenAI, admitem que há limitações para encontrar novos dados para treinar modelos avançados. Isso levou empresas a buscar métodos alternativos, como pagar criadores digitais por materiais não utilizados.

Com a pressão para avançar rapidamente no desenvolvimento de IA, práticas polêmicas e até mesmo ilegais, como o uso do LibGen, podem se tornar o centro de novos embates judiciais, enquanto empresas como Meta tentam justificar suas estratégias no contexto de uma corrida cada vez mais acirrada.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Seta para cima
Mais lidas
Notícias

Contact center do futuro: 5 investimentos essenciais

6 anos atrás

1
Notícias

Formação de equipes voltadas para valor e inovação é solução para escassez de talentos em TI

13 anos atrás

2
Notícias

Nodes Tecnologia lança aplicação que adiciona camada de proteção às soluções antivírus

7 anos atrás

3
Notícias

TV Digital: tudo o que você precisa saber sobre a migração

9 anos atrás

4
CIO

Como trabalhar (e coinovar) com startups? 5 etapas para garantir o sucesso

6 anos atrás

5
Logo IT Forum
Newsletter
As melhores notícias de tecnologia B2B em primeira mão
Acompanhe todas as novidades diretamente na sua caixa de entrada.
Instagram Linkedin Facebook Tiktok Youtube
1 / 1
meta
openai
Autor
Redação
Redação
LinkedIn

A redação contempla textos de caráter informativo produzidos pela equipe de jornalistas do IT Forum.

Ver publicações deste autor
Notícias relacionadas
Ver mais Seta para direita
Notícias relacionadas
Ver mais Seta para direita
Capital cognitivo híbrido, o próximo capital das organizações
Gestão
Capital cognitivo híbrido, o próximo capital das organizações

Heriton Duarte

2 meses atrás

Dilema da IA está entre escalar produtividade e preservar confiança
Inteligência Artificial
Dilema da IA está entre escalar produtividade e preservar confiança

Déborah Oliveira

2 meses atrás

“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz
Inteligência Artificial
“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz

Pamela Sousa

2 meses atrás

Xerox anuncia nova estrutura global para o mercado da Print
Negócios
Xerox anuncia nova estrutura global para o mercado da Print

Redação

2 meses atrás

Conectando a tecnologia e o futuro dos negócios

Insights e inovações para líderes no IT Forum.

Conteúdos

  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos

Notícias

  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos

IT Forum

  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie
  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos
  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie

Logo do IT Forum
Estr. Dr. Yojiro Takaoka, 4601 - Ingahi, Itapevi - SP, 06696-050
Icone Instagram Icone Linkedin Icone Facebook Icone TikTok Icone YouTube
  • Link Política de privacidade
  • Link Fale conosco
  • Link Termos de uso
  • Link Trabalhe conosco
Copyright © 2026 IT FORUM - Todos os Direitos Reservados