cewitte / gopabx

Go app to generate text-to-speech MP3 using Google Cloud's text-to-speech service.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

gopabx

Um gerador de textos para URAs feito em Go (Golang), que utiliza as APIs de text-to-speech to Google Cloud.

Importante

Para usar esse app, você precisará configurar sua conta no Google Cloud, projeto, credenciais, etc. Eu não poderia explicar melhor do que faz o Google aqui.

A propósito, meu código usa como base o código disponível no Guia de início rápido do artigo linkado acima, com algumas diferenças:

  1. Eu setei a única voz (feminina, baseada em Wavenet) disponível em português do Brasil.

  2. Ao invés de utilizar uma string dentro do próprio código, meu código espera receber um arquivo ssml como argumento na linha de comando, por exemplo:

    go run main.go -ssml=arquivo.ssml

Se o nome é arquivo.ssml, ao terminar o app terá gerado um mp3 de nome arquivo.mp3 no diretório raiz da aplicação.

Sobre o SSML

A linguagem de marcação de síntese de fala (SSML, na sigla em inglês) tem sintaxe similar ao XML e permite controle maior sobre o resultado da voz sintetizada com pausas, formatação de áudio para acrônimos, datas, horas e abreviaturas ou texto a ser censurado.

Você pode ver alguns exemplos na própria raiz do repositório.

O Google tem uma página bem explicativa sobre como formatar o SSML.

Antes de executar - uso da API do Google

Antes de executar o programa, é necessário carregar o arquivo com as credenciais JSON. No meu caso, por exemplo (no meu Linux)

export GOOGLE_APPLICATION_CREDENTIALS="/home/cewitte/GCP/pabx-58f1caa85116.json"

No meu Mac, por exemplo:

export GOOGLE_APPLICATION_CREDENTIALS="/Users/cewitte/GCP/pabx-58f1caa85116.json"

About

Go app to generate text-to-speech MP3 using Google Cloud's text-to-speech service.


Languages

Language:Go 100.0%