Bonne solution de texte à parole pour Windows

Je suis en train d'exécuter Windows 7 et je sais qu'il a la possibilité de me lire du texte dans mes applications, mais je cherche un bon utilitaire pour sauvegarder des morceaux de texte en tant que fichier wav ou mp3. Il peut déjà être intégré au système d'exploitation, mais habilement déguisé. Je sais que je peux écrire un programme pour appeler l'API, qui est ma prochaine étape s'il n'y a pas déjà une bonne solution.

J'aime vraiment la qualité du système AT & T , mais il a des restrictions assez raide sur l'utilisation du MP3 produit. J'aimerais les utiliser dans mon podcast.

Web based est également OK, pourvu qu'il produise facilement un Wav, MP3 ou un autre fichier audio standard sans autorisation (Public domain ou Creative Commons). Naturellement, je préfère la source libre ou ouverte sur le marché, mais ce n'est pas une exigence.

J'ai essayé espeak , festival et MaryTTS . Ils génèrent tous des voix compréhensibles pour la plupart, mais ils ne sont pas très naturels. Même avec des téléchargements vocaux supplémentaires pour ces systèmes (p. Ex. Mbrola, CMU Arctic), les voix ne sont pas si bonnes.

Les voix de IVONA sont les meilleures que j'ai entendues jusqu'ici. Ils vous donnent une démonstration gratuite de 30 jours qui est suffisante si vous avez une tâche unique à faire. Après cela, ils sont comme $ 45 / voix. Amazon vient d'acheter l'entreprise afin que vous sachiez qu'elle est solide ( http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/ ).

Ils fonctionnent avec l'interface SAPI de Microsoft, ce qui signifie que les voix sont disponibles pour tout programme prenant en charge cela (par exemple, Adobe Reader). Je les utilise avec le programme Text To Wav qui est agréable pour la conversion en vrac de fichiers texte en fichiers wave.

modifier

En fait, relisez votre question et je pense que pour un usage non personnel (par exemple, les podcasts), le prix est probablement beaucoup plus élevé pour IVONA. Dans ce cas, je dirais vérifier MaryTTS.

ESpeak est gratuit et open source et offre tout ce dont vous avez besoin.

 Il peut s'exécuter en tant que programme de ligne de commande pour parler du texte à partir d'un fichier ou de stdin.
 Une version de bibliothèque partagée est également disponible.

 * Comprend différentes voix, dont les caractéristiques peuvent être modifiées.
 * Peut produire une sortie vocale en tant que fichier WAV.
 * Le SSML (Speech Synthesis Markup Language) est pris en charge (pas complet),
   Et aussi HTML.
 * Format compact.  Le programme et ses données, y compris de nombreuses langues,
   Totalise environ 1 Moctets.
 * Peut traduire le texte aux codes de phonèmes, afin qu'il puisse être adapté comme un front
   Fin d'un autre moteur de synthèse de discours.
 * Possibilité d'autres langues.  Plusieurs sont inclus dans différentes étapes
   De progrès.  L'aide des locuteurs natifs pour ces langues ou d'autres langues est
   accueilli.
 * Outils de développement disponibles pour produire et accorder des données de phonèmes.
 * Écrit en C ++.