Reconnaissance de la parole – Logiciel MP3 au texte

Je recherche un programme indépendant (commercial ou gratuit) qui me permettrait de transcrire des fichiers MP3 contenant des enregistrements vocaux (en particulier des podcasts) au texte. Je voulais essayer Dragon Naturally Speaking, mais il semble que cela ne supporte que la transcription de mes propres enregistrements vocaux. Alors quelles sont les alternatives?

    Dragon Naturally Speaking va importer des fichiers mp3 et essayer de les transcrire. Il préfère accorder sa reconnaissance vocale au haut-parleur individuel, mais fait un travail équitable sans accord. Cela fonctionnerait probablement mieux si vos haut-parleurs podcast ressemblaient à Tom Brokaw.

    Une solution possible serait de télécharger votre vidéo sur Youtube et d'essayer les légendes automatiques que vous pouvez activer … il n'est pas encore trop précis, mais vous pouvez télécharger le fichier de légende et le modifier vous-même si cela aide … comme Pour les problèmes de droit d'auteur / piraterie pour la chanson, vous pouvez rendre la vidéo privée sur votre profil, si cela est possible?

    Je prévoyais d'essayer Dragon Naturally Speaking – J'ai écrit quelques scripts sur mon iPhone jailbreaké pour copier / convertir tous les fichiers de messagerie vocale de mon téléphone vers un dossier sur mon PC et avoir le service de transcription Dragon Naturally Speaking fonctionné contre eux.

    Le résultat de l'exécution de la transcription sur des fichiers avec différents haut-parleurs était absolument inutilisable. J'ai essayé certaines des alternatives open source, mais la reconnaissance vocale indépendante des locuteurs semble encore limitée aux très petits dictionnaires.

    J'utilise http://www.voicebase.com avec podcast et vidéos en anglais et ça marche très bien. C'est gratuit pendant 50 heures audio.

    Vous pouvez télécharger la transcription audio sur rtf, srt ou pdf.

    Vous pouvez télécharger des transcriptions de machines environ 10-15 minutes après votre téléchargement, et parfois, tôt.

    Open Source: Sphinx CMU

    Shareware: http://www.e-speaking.com/ (Windows)

    Commercial: Dragon NaturallySpeaking (Windows)

    Vous pouvez également essayer cette méthode si vous essayez avec osx qui peut être fait en utilisant audace et soundflower

    Vous pouvez également trouver des liens pertinents pour opensource. Un autre shareware vaut la peine d'essayer était voxcribe

    Si vous êtes un programmeur .net, vous pouvez utiliser cette méthode pour créer votre propre kit

    Podzinger serait une excellente solution, mais je ne suis pas certain que cette rampe (le nouveau nom de la société qui était EveryZing, qui a produit Podzinger) offre le service gratuitement …

    http://fr.wikipedia.org/wiki/Podzinger