Logotipo IT Forum
IT Forum Instituto Itaqui Distrito Itaqui IT Invest
IT Forum - A Comunidade de Tecnologia se Encontra Aqui
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • IA
  • Cibersegurança
  • Plataformas
  • ESG
  • Vídeos
  • Nossas colunas
  • Colunistas
  • Pesquisas
  • Prêmios
Revistas
  • IT Forum Líderes
  • Series
  • Histórias da TI
  • Ver todos
  • Todos os eventos
  • IT Forum Trancoso
  • IT Forum Forte
  • IT Forum Mata
  • Sobre o HIT
  • Todos os materiais
Todas as notícias Negócios Liderança CIO Carreira IA Cibersegurança Plataformas ESG Vídeos
Nossas colunas Colunistas
Pesquisas Prêmios
Revistas
Todos os videocasts E agora, TI? Entre Tech IT Forum Líderes Series
Todos os eventos Trancoso
Todos os materiais Todos os materiais
  1. Home
  2. Notícias
  3. Computerworld Brasil
  4. Google Cloud anuncia disponibilidade geral do Text-to-Speech
AI
Google Cloud
text to speech

Google Cloud anuncia disponibilidade geral do Text-to-Speech

No total, ferramenta de conversão de texto para voz agora oferece 56 vozes em 14 idiomas e variantes.

Publicado:
06/09/2018 às 16:30
Leitura
2 minutos

O Google Cloud anunciou recentemente a disponibilidade geral da ferramenta de conversão de texto para voz Text-to-Speech, que foi disponibilizada ao público inicialmente há alguns meses.

Entre outras coisas, a solução ganhou 17 novas vozes, incluindo português, inglês (EUA) e espanhol, que permitem a criação de aplicativos em idiomas variados, como anunciado no evento Cloud Next’ 18, em julho.

No total, a API agora oferece 56 vozes em 14 idiomas e variantes, sendo 30 delas padrão e 26 delas WaveNet (produto da DeepMind), capazes de imitar vozes humanas e sons naturais, o que permite uma melhor experiência aos usuários.

Audio Profiles

O Google Cloud também revelou que o recurso Audio Profiles agora também está disponível. Com a novidade, o usuário pode otimizar a reprodução dos áudios Text-to-Speech nos diferentes tipos de equipamentos, como fones de ouvido, alto-falantes e linhas telefônicas.

“Por exemplo, se o áudio que o seu aplicativo produz é ouvido principalmente em fones de ouvido, você pode criar uma voz sintética a partir da API Cloud Text-to-Speech que seja otimizada especificamente para fones de ouvido”, explica o Google em um post no seu blog sobre as novidades.

Novas funções do Speech-to-Text

Além disso, o Google também anunciou novas atualizações beta para o serviço que transforma voz em texto Speech-to-Text, incluindo reconhecimento multicanal, diarização de alto-falante e detecção automática de idiomas, todas anunciadas durante o Google Cloud Next’ 18.

Entre outras coisas, essas funções possibilitam a transcrição de vários canais de áudio com identificação de vozes, de modo a registrar quais palavras foram ditas por quem.

E nos casos em que as amostras de áudio que não são separadas em canais, como em uma palestra, por exemplo, o Google disponibiliza a chamada diarização. Para usá-la, basta inserir o número de pessoas falantes como parâmetro à API e, por meio de aprendizagem de máquina (Machine Learning), a ferramenta elabora uma categoria de cada palavra com um número e, na transcrição, consegue identificar o falante de maneira assertiva.

Seta para cima
Mais lidas
Notícias

SEIAS moderniza gestão com Sonda Ativas

8 anos atrás

1
Carreira

Coursera: mulheres são apenas 32% dos matriculados em cursos de IA generativa

1 ano atrás

2
Negócios

Qualcomm adquire Ventana Micro Systems e expande domínio em chips RISC-V

3 meses atrás

3
Notícias

Gestão de riscos atrai profissionais que buscam qualificação

9 anos atrás

4
Gestão

Embratel é integrada ao grupo Claro empresas e anuncia reestruturação

12 meses atrás

5
Logo IT Forum
Newsletter
As melhores notícias de tecnologia B2B em primeira mão
Acompanhe todas as novidades diretamente na sua caixa de entrada.
Instagram Linkedin Facebook Tiktok Youtube
1 / 1
AI
Google Cloud
text to speech

Nenhum autor cadastrado para este post.

Notícias relacionadas
Ver mais Seta para direita
Notícias relacionadas
Ver mais Seta para direita
Capital cognitivo híbrido, o próximo capital das organizações
Gestão
Capital cognitivo híbrido, o próximo capital das organizações

Heriton Duarte

1 mês atrás

Dilema da IA está entre escalar produtividade e preservar confiança
Inteligência Artificial
Dilema da IA está entre escalar produtividade e preservar confiança

Déborah Oliveira

1 mês atrás

“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz
Inteligência Artificial
“O varejo não compete mais por canal, mas por capacidade de movimentar produtos”, diz CIO da Motz

Pamela Sousa

1 mês atrás

Xerox anuncia nova estrutura global para o mercado da Print
Negócios
Xerox anuncia nova estrutura global para o mercado da Print

Redação

1 mês atrás

Conectando a tecnologia e o futuro dos negócios

Insights e inovações para líderes no IT Forum.

Conteúdos

  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos

Notícias

  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos

IT Forum

  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie
  • Notícias
  • Colunas
  • Pesquisas
  • Series
  • Revistas
  • Videocasts
  • Eventos
  • Todas as notícias
  • Negócios
  • Liderança
  • CIO
  • Carreira
  • Inteligência Artificial
  • Cibersegurança
  • Plataformas
  • Sustentabilidade
  • Vídeos
  • Sobre nós
  • Envie seu Release
  • Mídia Kit
  • Contato
  • Expediente
  • Cultura
  • Distrito Itaqui
  • Anuncie

Logo do IT Forum
Estr. Dr. Yojiro Takaoka, 4601 - Ingahi, Itapevi - SP, 06696-050
Icone Instagram Icone Linkedin Icone Facebook Icone TikTok Icone YouTube
  • Link Política de privacidade
  • Link Fale conosco
  • Link Termos de uso
  • Link Trabalhe conosco
Copyright © 2026 IT FORUM - Todos os Direitos Reservados