mercoledì 5 maggio 2010


Software e applicazioni web per sintesi vocale (Text To Speech)

Come molti di voi sapranno per sintesi vocale si intende l'insieme delle tecniche volte alla riproduzione artificiale della voce umana attraverso la concatenazione di registrazioni di parti vocali memorizzate in un database, spesso sono indicati dall'acronimo TTS (Text To Speech). I sistemi di sintesi vocale sono molto utilizzati nell'ambito dell'accessibilità, soprattutto per persone affette da problemi vocali o di fonazione, ma trovano anche largo impiego in ambiti più ludici come ad esempio la produzione di videogiochi e anime. Oggi volevo parlarvi brevemente, e da un punto di vista dilettantistico, di un paio di applicazioni da usare per poter convertire qualche riga di testo in voce. 


Il "tipo" nella figura è Matteo ed è una delle voci a disposizione per la lingua italiana sul sito oddcast.com. Tra i servizi online che ho avuto modo di provare è in assoluto quello maggiormente degno di menzione per qualità del sistema vocale e degli effetti voce. Contiene una decina di timbri vocali, sia maschili che femminili, e consente di modificare il parlato con effetti come l'echo e il riverbero. Per contro, non vi è alcuna possibilità di salvare il file audio generato, ma potreste comunque ovviare a questo problema con l'aiuto del registratore di suoni (Ubuntu) o attraverso Audacity (per maggiori informazioni contattatemi pure). Vediamo ora un paio di software da utilizzare nei sistemi linux per avere lo stesso effetto.

Su Ubuntu ne ho provati due, il primo, Festival, sembra molto efficace ma ahimè, è utilizzabile solo da terminale, se qualcuno di voi è a conoscenza di una qualche interfaccia grafica mi faccia sapere.

Il secondo, Gespeaker, invece, si presenta con un'interfaccia semplice e ricca di funzionalità attraverso la quale è possibile modulare tonalità, volume, velocità e ritardo con estrema facilità. Per provarlo su Ubuntu basta il seguente comando:
sudo apt-get install gespeaker
La voce italiana di default però risulta un po' troppo "metallica" per i miei gusti. Per ottenere un risultato migliore dovrete installare e integrare in Gespeaker l'algoritmo di sintesi vocale MBROLA:
sudo apt-get install mbrola mbrola-it3 mbrola-it4
Dopo averli installati troverete le relative voci nelle impostazioni del software. Se vi interessa l'argomento della sintesi vocale su wikipedia vi è una pagina dedicata veramente ben fatta. Eccola.

Mi sono avvicinato da poco a questo tipo di software, se conoscete altre soluzioni o applicazioni da propormi non esitate!

Buona serata.



Ti piacerebbe contribuire alla scrittura degli articoli per Pc fai da thè? Qui i dettagli dell'iniziativa!

blog comments powered by Disqus