Logotipo IT Forum
IT Forum Instituto Itaqui Distrito Itaqui IT Invest
IT Forum - A Comunidade de Tecnologia se Encontra Aqui
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • IA
  • Cibersegurança
  • Plataformas
  • ESG
  • Vídeos
  • Nossas colunas
  • Colunistas
  • Pesquisas
  • Prêmios
Revistas
  • IT Forum Líderes
  • Series
  • Histórias da TI
  • Ver todos
  • Todos os eventos
  • IT Forum Trancoso
  • IT Forum Forte
  • IT Forum Mata
  • Sobre o HIT
  • Todos os materiais
Todas as notícias Negócios Liderança CIO Carreira IA Cibersegurança Plataformas ESG Vídeos
Nossas colunas Colunistas
Pesquisas Prêmios
Revistas
Todos os videocasts E agora, TI? Entre Tech IT Forum Líderes Series
Todos os eventos Trancoso
Todos os materiais Todos os materiais
  1. Home
  2. Notícias
  3. Dados sintéticos em IA: vantagens, riscos e aplicações, segundo especialista do MIT
dados
dados sintéticos

Dados sintéticos em IA: vantagens, riscos e aplicações, segundo especialista do MIT

Publicado:
08/09/2025 às 09:00
Leitura
3 minutos
Dados sintéticos em IA: vantagens, riscos e aplicações, segundo especialista do MIT

Os dados sintéticos, gerados por algoritmos para replicar estatísticas de dados reais sem expor informações sensíveis, já representam mais de 60% do total usado em aplicações de IA em 2024, segundo estimativas citadas pelo MIT News. A expectativa é de que esse volume continue a crescer em diferentes setores.

Para entender os benefícios e desafios dessa prática, o portal conversou com Kalyan Veeramachaneni, pesquisador principal do Laboratório de Sistemas de Informação e Decisão do MIT e cofundador da DataCebo, responsável pelo Synthetic Data Vault, plataforma de código aberto voltada à geração e avaliação de dados sintéticos.

Veeramachaneni explica que esses dados não se originam de situações reais, mas sim de modelos generativos capazes de capturar regras e padrões presentes em conjuntos originais, a partir de uma pequena amostra inicial. Com isso, é possível produzir volumes ilimitados de dados que preservam características estatísticas dos originais.

Existem quatro modalidades principais de geração: linguagem, imagens/vídeos, áudio e dados tabulares. Enquanto textos e imagens podem ser extraídos de conteúdos públicos disponíveis na internet, informações tabulares, como transações financeiras, normalmente estão protegidas por firewalls corporativos.

Leia também: “Falhe rápido, falhe cedo e falhe com frequência”: a receita Pixar para inovar

Vantagens e aplicações práticas

Um dos usos mais difundidos é em testes de software, que exigem grandes quantidades de dados para validar funcionalidades. Antes, era comum criar dados manualmente, processo caro e limitado. Com modelos generativos, é possível gerar cenários específicos, como transações de clientes em determinada região ou período.

Outro benefício está em testes de desempenho, já que companhias podem simular bilhões de registros para avaliar a robustez de seus sistemas. No campo de machine learning, os dados sintéticos são úteis para lidar com eventos raros, como fraudes bancárias. Ao criar exemplos adicionais, aumentam a precisão de modelos preditivos.

A tecnologia também ajuda quando há restrições de tempo e orçamento para coleta de informações. Pesquisas de intenção de compra, por exemplo, podem ser complementadas com dados sintéticos, evitando que modelos sejam treinados com bases insuficientes.

Riscos e limitações dos dados sintéticos

Apesar das vantagens, o uso exige cautela. O pesquisador aponta que a confiança nos dados depende da avaliação do sistema em que serão aplicados. Embora existam métricas de qualidade e privacidade consolidadas, novos indicadores de eficácia estão surgindo para medir o desempenho em tarefas específicas.

Outro risco é a replicação de vieses já presentes nos dados reais usados no treinamento. Caso não sejam aplicadas técnicas de amostragem balanceada, os modelos podem perpetuar desigualdades.

Para mitigar esses problemas, o MIT desenvolveu a Synthetic Data Metrics Library, ferramenta que ajuda a avaliar a fidelidade e a eficácia dos dados gerados. Segundo Veeramachaneni, é necessário criar fluxos de validação rigorosos, garantindo que conclusões obtidas com dados sintéticos permaneçam válidas em cenários reais.

A previsão do pesquisador é de que a evolução dos modelos generativos mude radicalmente a forma como empresas e cientistas trabalham com dados — seja para construir softwares, responder a perguntas analíticas ou treinar algoritmos. A tendência é que atividades antes inviáveis por limitações de privacidade, custo ou volume de dados se tornem cada vez mais acessíveis.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Seta para cima
Mais lidas
Notícias

Nissan contará com tecnologia totalmente autônoma em 2020

8 anos atrás

1
Notícias

Como estruturar o marketing para aperfeiçoar o atendimento ao cliente

8 anos atrás

2
Notícias

Cibersegurança e futuro do trabalho são destaques do IT Forum Expo 2018

8 anos atrás

3
Carreira

Analista de infraestrutura está entre os cargos mais disputados em TI

9 anos atrás

4
Cibersegurança

Pesquisador da USP cria sistema contra ataques à comunidade científica

10 anos atrás

5
Logo IT Forum
Newsletter
As melhores notícias de tecnologia B2B em primeira mão
Acompanhe todas as novidades diretamente na sua caixa de entrada.
Instagram Linkedin Facebook Tiktok Youtube
1 / 1
dados
dados sintéticos

Nenhum autor cadastrado para este post.

Notícias relacionadas
Ver mais Seta para direita
Notícias relacionadas
Ver mais Seta para direita
Capital cognitivo híbrido, o próximo capital das organizações
Gestão
Capital cognitivo híbrido, o próximo capital das organizações

Heriton Duarte

2 meses atrás

Dilema da IA está entre escalar produtividade e preservar confiança
Inteligência Artificial
Dilema da IA está entre escalar produtividade e preservar confiança

Déborah Oliveira

2 meses atrás

“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz
Inteligência Artificial
“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz

Pamela Sousa

2 meses atrás

Xerox anuncia nova estrutura global para o mercado da Print
Negócios
Xerox anuncia nova estrutura global para o mercado da Print

Redação

2 meses atrás

Conectando a tecnologia e o futuro dos negócios

Insights e inovações para líderes no IT Forum.

Conteúdos

  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos

Notícias

  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos

IT Forum

  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie
  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos
  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie

Logo do IT Forum
Estr. Dr. Yojiro Takaoka, 4601 - Ingahi, Itapevi - SP, 06696-050
Icone Instagram Icone Linkedin Icone Facebook Icone TikTok Icone YouTube
  • Link Política de privacidade
  • Link Fale conosco
  • Link Termos de uso
  • Link Trabalhe conosco
Copyright © 2026 IT FORUM - Todos os Direitos Reservados