Захват вывода TTS в Python

То, что я пытаюсь достичь, - сохранить вывод текста в речь из Python в аудиофайл.

Ну, единственным ограничением является версия Python версии 2.7 (было бы здорово, если бы она работала на Windows и ubuntu, но не обязательно). Я нашел pyttsx и смог прочитать текст, но я не могу его захватить, потому что нет никакого метода, как в pyTTS SpeakToMemory. Хорошо pyTTS доступно только для Python 2.5. Я тоже не могу это использовать.

Как я могу сделать текст в речь и сохранить его в аудиофайле с помощью python 2.7?

2 ответа

Как создать звук из текста с помощью API-интерфейсов Google в речь

Сначала установите gtts из cmd

from gtts import gTTS
tts = gTTS("Hello","en")
tts.save("hello.mp3")

и все готово.


Ваш вопрос подразумевает, что это нормально, если это решение только для Mac OS X? Если это так, то вы можете изменить драйвер Mac OS X в pyttsx (pyttsx/drivers/nsss.py) и дать ему возможность вызвать метод startSpeakingString:toURL: в классе NSSpeechSynthesizer:

http://developer.apple.com/library/mac/#documentation/Cocoa/Reference/ApplicationKit/Classes/NSSpeechSynthesizer_Class/Reference/Reference.html

Это сохранит синтезированный текст в файл.

licensed under cc by-sa 3.0 with attribution.