Поиск по сайту:

Преобразование текста в речь с помощью eSpeak NG в Linux

В этом руководстве объясняется, что такое eSpeak NG, как установить eSpeak NG в Linux и как преобразовывать текст в речь с помощью eSpeak NG в Linux.

Что такое eSpeak NG?

eSpeak NG — это многоязычный программный синтезатор речи для английского и многих других языков, работающий из командной строки. Мы можем конвертировать текст в речь с помощью eSpeak NG в Linux и Unix-подобных системах. eSpeak NG — это обновленная версия движка eSpeak, созданная Джонатаном Даддингтоном.

Вы можете использовать eSpeak NG для прослушивания блогов и новостных сайтов, а также конвертировать текстовые файлы в голос для людей с нарушениями зрения. eSpeak включает в себя разные голоса, и их характеристики можно изменять.

eSpeak NG — это кроссплатформенное приложение, поддерживающее Android, Linux, Mac OS и Windows. Это бесплатная программа с открытым исходным кодом, написанная на языке программирования C. Исходный код проекта eSpeak NG размещен на GitHub.

Как работает eSpeak NG?

eSpeak NG прочитает за вас данный текст вслух! Он может произносить текст либо со стандартного ввода, либо из файла. Таким образом, вы можете напрямую указать фразу для произнесения в качестве входных данных для eSpeak NG или сохранить текст в файле, а затем передать этот текстовый файл в качестве входных данных. Он использует преобразование текста в речь для разговора через звуковое устройство по умолчанию.

Вы также можете сохранить выходной файл в формате wav или mp3 вместо того, чтобы говорить напрямую. Полученный файл можно воспроизвести на любых медиаплеерах, таких как VLC, SMplayer и т. д. Он также может переводить текст в коды фонем.

Поддерживаемые языки

eSpeak NG синтезирует текст в речь для более чем 100 языков и акцентов, включая африкаанс, албанский, арагонский, армянский, болгарский, кантонский, каталанский, хорватский, чешский, датский, голландский, английский, эсперанто, эстонский, фарси, финский, французский, грузинский. , немецкий, греческий, хинди, венгерский, исландский, индонезийский, ирландский, итальянский, каннада, курдский, латышский, литовский, ложбан, македонский, малазийский, малаялам, мандаринский, непальский, норвежский, польский, португальский, панджаби, румынский, русский, сербский , словацкий, испанский, суахили, шведский, тамильский, телугу, турецкий, вьетнамский, валлийский и другие. Некоторые языки поддерживаются лучше, чем другие.

Установите eSpeak NG в Linux

eSpeak NG упакован для популярных операционных систем Linux, поэтому вы можете установить eSpeak с помощью менеджера пакетов по умолчанию.

Чтобы установить eSpeak NG в Arch Linux, EndeavourOS и Manjaro Linux, запустите:

sudo pacman -S espeak-ng

Debian, Ubuntu и его производные, такие как Linux Mint и Pop OS:

sudo apt install espeak-ng

Fedora, CentOS, AlmaLinux и Rocky Linux:

sudo dnf install espeak-ng

openSUSE:

sudo zypper install espeak-ng

Преобразование текста в речь с помощью eSpeak NG

eSpeak NG полностью совместим со своим предшественником eSpeak. Фактически, eSpeak NG использует те же параметры командной строки, что и eSpeak, с несколькими дополнительными функциями. Давайте посмотрим несколько примеров.

1. Произнесите фразу вслух с помощью eSpeak NG:

espeak-ng "Welcome to OSTechNix blog"

Альтернативно вы можете использовать команду echo для передачи фразы в качестве входных данных в eSpeak NG, как показано ниже:

echo "Excellence is not by accident. It is process, where an individual, organisation or nation continuously strive to better oneself. - APJ Abdul Kalam" | espeak-ng

eSpeak NG прочитает вслух данную строку через звуковое устройство по умолчанию.

2. Как говорилось ранее, eSpeak NG может читать вслух содержимое файла.

espeak-ng -f file.txt

Или,

cat file.txt | espeak-ng

3. Чтение введенного текста из стандартного ввода, а не из файла:

espeak-ng

Введите слово, которое нужно произнести, и нажмите клавишу ENTER. Чтобы выйти, нажмите CTRL+C.

4. Если вы хотите сохранить вывод в аудиофайл WAV, а не произносить его напрямую, используйте флаг -w:

espeak-ng  -w audio.wav "I use Arch, BTW"

5. eSpeak может печатать фонемы текста.

Следующая команда произнесет слово «ostechnix» и распечатает произнесенные фонемы.

espeak-ng -x ostechnix

Пример вывода:

'0stEkn,Iks

6. eSpeak NG поддерживает несколько разных голосов. Чтобы просмотреть все голоса, поддерживаемые eSpeak NG, запустите:

espeak-ng --voices

Вы также можете перечислить все голоса, говорящие на определенном языке, например английском (en), как показано ниже:

espeak-ng --voices=en

7. eSpeak NG произнесет заданный текст английским голосом по умолчанию. Если вы хотите использовать другой голос, запустите:

espeak-ng -v <voice>

Пример:

espeak-ng -vta "வாழ்க தமிழ்மொழி!"

8. Более подробную информацию о eSpeak NG можно найти на страницах руководства:

man espeak-ng

Gespeaker — GTK-интерфейс для eSpeak

Gespeaker — это интерфейс GTK+ для преобразования текста в речь для eSpeak и mbrola. Это позволяет воспроизводить текст на многих языках. Вы можете настроить различные параметры, такие как голос, высота звука, громкость и скорость.

Чтобы установить Gespeaker в Debian, Ubuntu и их производных, запустите:

sudo apt install gespeaker

После установки запустите Gespeaker из меню или панели запуска приложений. Интерфейс Gespeaker по умолчанию будет выглядеть следующим образом:

Интерфейс геспикера

Использовать Gespeaker довольно просто! Введите текст для произнесения и нажмите кнопку «Воспроизвести». это так просто!!

Вы можете выбрать язык и голос (мужской или женский) на вкладке «Базовые настройки» и настроить значения высоты звука, громкости, скорости и задержки по вашему желанию в разделе «Дополнительные настройки».

Ресурсы:

  • Репозиторий eSpeak NG на GitHub
  • Репозиторий Gespeaker на GitHub

Связанное чтение:

  • Как использовать Google Translate из командной строки в Linux

Статьи по данной тематике