Logotipo IT Forum
IT Forum Instituto Itaqui Distrito Itaqui IT Invest
IT Forum - A Comunidade de Tecnologia se Encontra Aqui
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • IA
  • Cibersegurança
  • Plataformas
  • ESG
  • Vídeos
  • Nossas colunas
  • Colunistas
  • Pesquisas
  • Prêmios
Revistas
  • IT Forum Líderes
  • Series
  • Histórias da TI
  • Ver todos
  • Todos os eventos
  • IT Forum Trancoso
  • IT Forum Forte
  • IT Forum Mata
  • Sobre o HIT
  • Todos os materiais
Todas as notícias Negócios Liderança CIO Carreira IA Cibersegurança Plataformas ESG Vídeos
Nossas colunas Colunistas
Pesquisas Prêmios
Revistas
Todos os videocasts E agora, TI? Entre Tech IT Forum Líderes Series
Todos os eventos Trancoso
Todos os materiais Todos os materiais
  1. Home
  2. Notícias
  3. Computerworld Brasil
  4. Como funciona a Camila, IA humanizada da AWS que converte texto em voz

Como funciona a Camila, IA humanizada da AWS que converte texto em voz

Plataforma permite o uso de recursos de voz para trazer mais acessibilidade a sites

Publicado:
29/11/2019 às 13:00
Leitura
4 minutos

Aplicação alia Inteligência Artificial e Machine Learning para garantir maior fluência no texto e melhorar a experiência do usuário

A Amazon Web Services (AWS) anuncia o lançamento da Camila, a primeira voz neural brasileira do Amazon Polly, serviço de conversão de texto em voz que utiliza tecnologia Neural Text to Speech (NTTS), baseada em Inteligência Artificial e Machine Learning. Com o NTTS, a ferramenta apresenta uma voz humanizada, com capacidade de identificar pontuações e oferecer maior fluência aos textos.

Segundo o IBGE, há no Brasil mais de 6,5 milhões de pessoas com deficiência visual, sendo 582 mil cegas e 6 milhões com baixa visão. Além disso, segundo dados do mesmo instituto, cerca de 11,3 milhões de brasileiros são analfabetos.

A legislação brasileira prevê, na Lei n° 13.146, de 6 de julho de 2015, a obrigatoriedade das empresas brasileiras, ou com operações no país, assim como de organizações governamentais, garantir o acesso à informação em seus sites. O modo que as instituições encontraram para garantir esse direito constitucional foi a implantação de conversores de texto em áudio. Porém, de modo geral, essas aplicações possuem um tom de voz robótico por não reconhecer pontuações, dificultando a imersão na mensagem e, consequentemente, seu entendimento.

Além de melhorar a experiência de pessoas que dependem de conversão de texto em voz, o Amazon Polly também está disponível em inglês e espanhol e, em conjunto com outros serviços da AWS, como o Amazon Translate, permite disponibilizar conteúdo online em texto e voz em outros idiomas com apenas um clique.

Como funciona a tecnologia:

Soluções como Text to Speech (TTS – texto para voz, em português) são possíveis graças às tecnologias de Machine Learning (Aprendizado de Máquinas) e Inteligência Artificial. O TTS funciona assim:

1. A inteligência artificial faz a leitura de um texto, sintetizando seu conteúdo e separando sílabas;
2. Depois que são separadas, as sílabas são relacionadas com seus fonemas pela Inteligência Artificial (IA);
3. A IA conecta as partes sintetizadas do texto, para que as frases sejam construídas de forma sonora.

Mesmo sendo avançada, o TTS ainda tem dificuldades para identificar pontuações e variações de tom de voz, o que resulta em um som mais artificial. Isso acontece porque há intervalos entre cada fonema.

Em busca de maior naturalidade e uma experiência melhor para os usuários, a AWS desenvolveu o Neural Text to Speech (NTTS), presente agora no Amazon Polly, permitindo vozes naturais e humanizadas. Esse é o caso da Camila, voz que segue o processo do TTS, mas traz uma camada extra de inteligência artificial. Essa etapa extra de AI reduz os intervalos entre os fonemas e auxilia na identificação de pontuação e timbre do som, criando uma experiência de áudio com mais fluidez e naturalidade.

O Amazon Polly com NTTS está disponível em diversos idiomas, com destaque para Português (Camila), Espanhol (Lupe) e Inglês com duas vozes (Joanna e Matthew). A tecnologia permite que um mesmo conteúdo possa ser lido por NTTS em mais de uma língua.

Existem diversas empresas especializadas em aplicar esta tecnologia, como é o caso da Audima, uma startup brasileira focada em inclusão digital para pessoas com limitações visuais e de leitura.

Com clientes como o Arquivo Nacional do Ministério da Justiça, o Instituto Ronald McDonald e o Portal Minha Vida, os serviços da startup permitem incluir uma ferramenta em sites que transmite em som os conteúdos escritos. Usuários com deficiência visual ainda podem controlar essa funcionalidade com comandos pré-definidos no teclado, para iniciar ou pausar o áudio.

Seta para cima
Mais lidas
Notícias

Nodes Tecnologia lança aplicação que adiciona camada de proteção às soluções antivírus

7 anos atrás

1
Notícias

4 vantagens do Business Intelligence na gestão de supply chain

8 anos atrás

2
Notícias

Red Hat e Amazon Web Services ampliam parceria para nova oferta conjunta

9 anos atrás

3
CIO

10 erros comuns de ERP para evitar a todo custo

5 anos atrás

4
Notícias

LinkedIn, sua nova carta de apresentação

8 anos atrás

5
Logo IT Forum
Newsletter
As melhores notícias de tecnologia B2B em primeira mão
Acompanhe todas as novidades diretamente na sua caixa de entrada.
Instagram Linkedin Facebook Tiktok Youtube
1 / 1

Nenhum autor cadastrado para este post.

Notícias relacionadas
Ver mais Seta para direita
Notícias relacionadas
Ver mais Seta para direita
Capital cognitivo híbrido, o próximo capital das organizações
Gestão
Capital cognitivo híbrido, o próximo capital das organizações

Heriton Duarte

4 meses atrás

Dilema da IA está entre escalar produtividade e preservar confiança
Inteligência Artificial
Dilema da IA está entre escalar produtividade e preservar confiança

Déborah Oliveira

4 meses atrás

“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz
Inteligência Artificial
“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz

Pamela Sousa

4 meses atrás

Xerox anuncia nova estrutura global para o mercado da Print
Negócios
Xerox anuncia nova estrutura global para o mercado da Print

Redação

4 meses atrás

Conectando a tecnologia e o futuro dos negócios

Insights e inovações para líderes no IT Forum.

Conteúdos

  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos

Notícias

  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos

IT Forum

  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie
  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos
  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie

Logo do IT Forum
Estr. Dr. Yojiro Takaoka, 4601 - Ingahi, Itapevi - SP, 06696-050
Icone Instagram Icone Linkedin Icone Facebook Icone TikTok Icone YouTube
  • Link Política de privacidade
  • Link Fale conosco
  • Link Termos de uso
  • Link Trabalhe conosco
Copyright © 2026 IT FORUM - Todos os Direitos Reservados