Скачать синтезатор речи svox. Обзор русскоязычных синтезаторов речи для Android OS

Рейтинг: / 44
Подробности Категория: Android. Изучение и разработка. Обновлено 12.02.2018 10:54 Просмотров: 37086

Страница 2 из 3

Для установки и настройки русского голоса в CoolReader его нужно поставить на Android (голос). Android (сгодняшний, непроапгреденный до 4-й версии) уже имеет многое для этого, но, увы, разработчики CoolReader приверженцы старых традиций и голосов. Поэтому пришлось наравне с уже имеющимися на моём Galaxy Note : Samsung TTS и Pico TTS , ещё поставить один TTS - SVOX Classic TTS (открываем у себя Market Play и находим там SVOX Classic TTS , он распространяется бесплатно, чего не скажешь о голосах к нему). Установили? Идём в настройки , там - Голосовой ввод и вывод , Преобразование текста в речь . Поставьте "флажок" в Всегда использовать мои параметры . И включите (опять флажок) SVOX Classic TTS .

АХТУНГ, АХТУНГ! Русен, халявен, не тупите и отказывайтесь от любых автоматических апдейтов и апгрейтов как SVOX Classic TTS в общем так и Russian Female Voice в частности .

Зпускаем CoolReader, в системном меню выбираем Опции /Читать вслух . И всё... Работает как и на персоналках. Громко и хорошо. Не икает. Скорость я поставил довольно быструю, стало немного приятнее слушать голос женщины-робота. Но мне и так сойдёт. Пока еду на работу слушаю книгу, да и на работе в моменты посещения лютой безделицы: наушники в ухи, девайс в карман и стучи иногда по клавишам, дабы не привлекать внимание наблюдательное начальство отсутствием клавиатурного стрекота с своей стороны .

Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.

В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.

Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.

Для удобства разделим движки TTS на три класса:

  • коммерческие;
  • свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
  • встроенные (средства, предоставляемые самой операционной системой).

Коммерческие движки

SVOX Mobile TTS

Цена: n/a
Языки: 26, включая русский
высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW

Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт - SVOX Mobile TTS . Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.

Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт . Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.

Отмечу, что Acapela предоставляет «облачный» синтез речи , а так-же портирование SDK под любую платформу.

Свободные движки

Flite
Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)

В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile , PalmOS, Android и .

Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить .

ESpeak портирован на Android . Самый простой способ его попробовать - это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.

Встроенные решения

Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).
Symbian

Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть

Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.

Дополнительные языковые пакеты можно загрузить , однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.

Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти

Языковые движки и синтезаторы (TTS text-to-speech) для русского языка никогда не были чем-то совершенным. В отличие от английских, чье развитие шло постоянно и неуклонно, лучшим представителем отечественных синтезаторов уже более десяти лет был мужской голос Николай от компании Acapela. Конкуренцию ему в последние годы составляли два вполне приличных женских варианта - Алена (Acapela) и Катерина, позднее - Катерина II (ScanSoft RealSpeak).

Для повседневного использования требовались определенные усилия, а уж для мобильных платформ, в первую очередь Android, они подходили лишь в связке с персональным компьютером, заставляя перегонять текст в звук, чтобы позднее воспроизводить стандартным Mp3 плеером на конечном устройстве.

Некоторую надежду на прогресс, как это часто бывает, дарила корпорация добра Google, см. наш материал:
. До недавнего времени максимум возможностей, предоставляемых поисковым гигантом, сводился к онлайн работе с их синтезатором. Результат, откровенно говоря, не был чем-то революционным. С примером работы Google API TTS вы можете ознакомиться на с общей информацией о Клубе.

Существовало и еще несколько решений, заточенных непосредственно под использование со смартфонами:

  • Поставляемый по умолчанию Pico TTS - без русского языка
  • IVONA Text-to-Speech - к сожалению, поддержка русского пока не реализована, хотя официальный голос Татьяна представлен на сайте разработчика
  • SVOX Classic Text To Speech Engine - единственная рабочая модель. Установка софта - бесплатная, пробный период на ознакомление. Конечная цена ~ 3USD
Как видите, реально работает только решение SVOX . При всей "реальности", работает система из рук вон плохо. То есть основное свое предназначение - читать по-русски, формально она выполняет, но читает плохо.

И вот, в конце мая 2014 года в Google Play появляется их новый абсолютно бесплатный Синтезатор речи Google . Этот продукт легко затыкает за пояс прошлые решения с использованием русских систем TTS, более того, по моему скромному мнению, этот женский голос лучше доступных решений для персональных компьютеров.

Ниже приведен небольшой демофрагмент полученный со смартфона с установленным синтезатором речи Google - русский женский голос (пока единственный из доступных)

Запись получена через стандартную программу для fb2 FBReader с подключенным модулем чтения Даже если вы не воспринимаете компьютерную речь в контексте озвучивания книг, это решение позволит вам апгрейдить своего мобильного друга. Гугль навигация начнет читать вам названия улиц, специальные приложения смогут озвучивать текст СМС и номера при входящих звонках.

Кроме того, и это весьма полезно для слабовидящих или незрячих пользователей, теперь можно полноценно использовать TalkBack - аналог знакомого многим по работе на персоналках скрин-ридера Jaws. Эта система реализует потенциал Android для голосового оповещения о всех событиях на телефоне, позволяющего управлять им, не видя экрана.

    Недостатки в работе с синтезатором
  • Существенный минус для любителя аудиокниг - повышенное энергопотребление, за пару часов озвучивания вы потеряете до половины заряда аккумулятора
  • Неприятность, зафиксированная лишь во время проигрывания через динамик телефона: легкий fade in - затухание уровня звука в начале предложения. Через проводную гарнитуру, внешнее устройство и bluetooth этот эффект отсутствует
  • Нет поддержки пользовательских ударений и словарей

Особенных чудес ждать не приходится - это всего лишь компьютер, впрочем, некоторая холодность во время чтения кому-то может показаться приятным отдохновением после избытка театральности в работе отдельных исполнителей.

Установка синтезатора предельно проста.
Заходим на страницу продукта в магазине . Google Play, как обычно, известит вас о совместимости с вашим устройством - требуется Android 4.0.3 и выше, затем произойдет загрузка и установка. После чего нужно скачать "голос":
Настройки -> Специальные возможности -> Вывод функции текста в речь -> Синтезатор речи Google (не пугайтесь грозного предупреждения, ничего нового о вас производитель через эту программу не узнает, ему и так все доподлинно известно) -> скачать. И для спокойствия - перезагрузить.

    UPD.: октябрь 2016
Для андроид 4,2 (лучше 4,4) и выше к базовому женскому голосу добавлено 6 новых - три мужских и три женских:

Языковые движки и синтезаторы (TTS text-to-speech) для русского языка никогда не были чем-то совершенным. В отличие от английских, чье развитие шло постоянно и неуклонно, лучшим представителем отечественных синтезаторов уже более десяти лет был мужской голос Николай от компании Acapela. Конкуренцию ему в последние годы составляли два вполне приличных женских варианта - Алена (Acapela) и Катерина, позднее - Катерина II (ScanSoft RealSpeak).

Для повседневного использования требовались определенные усилия, а уж для мобильных платформ, в первую очередь Android, они подходили лишь в связке с персональным компьютером, заставляя перегонять текст в звук, чтобы позднее воспроизводить стандартным Mp3 плеером на конечном устройстве.

Некоторую надежду на прогресс, как это часто бывает, дарила корпорация добра Google, см. наш материал:
. До недавнего времени максимум возможностей, предоставляемых поисковым гигантом, сводился к онлайн работе с их синтезатором. Результат, откровенно говоря, не был чем-то революционным. С примером работы Google API TTS вы можете ознакомиться на с общей информацией о Клубе.

Существовало и еще несколько решений, заточенных непосредственно под использование со смартфонами:

  • Поставляемый по умолчанию Pico TTS - без русского языка
  • IVONA Text-to-Speech - к сожалению, поддержка русского пока не реализована, хотя официальный голос Татьяна представлен на сайте разработчика
  • SVOX Classic Text To Speech Engine - единственная рабочая модель. Установка софта - бесплатная, пробный период на ознакомление. Конечная цена ~ 3USD
Как видите, реально работает только решение SVOX . При всей "реальности", работает система из рук вон плохо. То есть основное свое предназначение - читать по-русски, формально она выполняет, но читает плохо.

И вот, в конце мая 2014 года в Google Play появляется их новый абсолютно бесплатный Синтезатор речи Google . Этот продукт легко затыкает за пояс прошлые решения с использованием русских систем TTS, более того, по моему скромному мнению, этот женский голос лучше доступных решений для персональных компьютеров.

Ниже приведен небольшой демофрагмент полученный со смартфона с установленным синтезатором речи Google - русский женский голос (пока единственный из доступных)

Запись получена через стандартную программу для fb2 FBReader с подключенным модулем чтения Даже если вы не воспринимаете компьютерную речь в контексте озвучивания книг, это решение позволит вам апгрейдить своего мобильного друга. Гугль навигация начнет читать вам названия улиц, специальные приложения смогут озвучивать текст СМС и номера при входящих звонках.

Кроме того, и это весьма полезно для слабовидящих или незрячих пользователей, теперь можно полноценно использовать TalkBack - аналог знакомого многим по работе на персоналках скрин-ридера Jaws. Эта система реализует потенциал Android для голосового оповещения о всех событиях на телефоне, позволяющего управлять им, не видя экрана.

    Недостатки в работе с синтезатором
  • Существенный минус для любителя аудиокниг - повышенное энергопотребление, за пару часов озвучивания вы потеряете до половины заряда аккумулятора
  • Неприятность, зафиксированная лишь во время проигрывания через динамик телефона: легкий fade in - затухание уровня звука в начале предложения. Через проводную гарнитуру, внешнее устройство и bluetooth этот эффект отсутствует
  • Нет поддержки пользовательских ударений и словарей

Особенных чудес ждать не приходится - это всего лишь компьютер, впрочем, некоторая холодность во время чтения кому-то может показаться приятным отдохновением после избытка театральности в работе отдельных исполнителей.

Установка синтезатора предельно проста.
Заходим на страницу продукта в магазине . Google Play, как обычно, известит вас о совместимости с вашим устройством - требуется Android 4.0.3 и выше, затем произойдет загрузка и установка. После чего нужно скачать "голос":
Настройки -> Специальные возможности -> Вывод функции текста в речь -> Синтезатор речи Google (не пугайтесь грозного предупреждения, ничего нового о вас производитель через эту программу не узнает, ему и так все доподлинно известно) -> скачать. И для спокойствия - перезагрузить.

    UPD.: октябрь 2016
Для андроид 4,2 (лучше 4,4) и выше к базовому женскому голосу добавлено 6 новых - три мужских и три женских:

Приложения-синтезаторы речи – удобные и надежные помощники для Андроид пользователей. С их помощью можно «озвучить» приложения на самые популярные языки мира, настроить тембр голоса и другие важные параметры, а также , прослушивать звучание разных слов. Большинство TTS приложений для Android доступны бесплатно, однако за установку отдельных голосов и функций нужно доплатить. Мы подобрали для вас наиболее удобные синтезаторы речи, скачать которые можно на нашем сайте.

Синтез речи от Google


Жанр Инструменты
Рейтинг 4,1
Установки 1 000 000 000–5 000 000 000
Разработчик Google LLC
Русский язык есть
Оценок 1 107 289
Версия 3.14.9
Размер apk 14.7 MB


Наиболее популярная и доступная TTS-утилита, совместимая со многими Андроид-девайсами. С помощью программы вы можете озвучивать текст на экране, а также выполнять ряд важных функций:

  • Озвучивать книги приложения Google Play Книги.
  • Переводить и озвучивать слова из .
  • Включать голосовые подсказки при помощи сервиса TalkBack.

Активировать приложение Синтез речи от Google можно прямо на своем девайсе. Для этого откройте пункт меню «Настройки», где зайдите в подраздел «Язык и методы ввода», а там – «Синтез речи». Выберите систему синтеза речи от Google, после чего приложение активируется автоматически.

Программа поддерживает более 40 языков, среди которых английский, русский, французский, немецкий, японский, испанский, датский, хинди и много других. В последней версии утилиты добавлено 3 новые языка – румынский, эстонский и словацкий, а также улучшено качество голоса в целом.

Acapela TTS Voices


Жанр Связь
Рейтинг 3,5
Установки 100 000–500 000
Разработчик Acapela Group S.A.
Русский язык нет
Оценок 3 883
Версия 6.0.0.2
Размер apk 9.3 MB


Еще один качественный синтезатор речи на Андроид, который доступен на нашем портале. Программа является условно бесплатной, при этом перед тем, как купить приложение, вы можете прослушать демо-версии мужских и женских голосов в режиме онлайн. Утилита позволяет покупать и устанавливать программы с голосом высокого качества, такие как Google TalkBack, переводчики и озвучивания новостей.

Для выбора и установки голоса в приложении войдите в меню, после чего нажмите на голос и удерживайте несколько секунд. Возле выбранного голоса появится значок желтой звезды, и он будет установлен по умолчанию. Теперь вы можете использовать эту программу с вашей любимой читалкой книг.

Приложение Acapela TTS Voices можно активировать следующими действиями.

  • Загрузите сервис на нашем сайте или портале Google Play.
  • После установки приложения кликните на иконку программы. Убедитесь в наличии Интернет-соединения.
  • Ознакомьтесь со списком голосов, которые загружены с сервера.
  • Нажмите на меню напротив каждого голоса, где можно прослушать собственный текст или сразу перейти к покупке.
  • После покупки и оплаты голос будет загружен, и вы сможете пользоваться им в любое время.

Приложение Acapela TTS Voices совместимо с ОС Android 2.2 и более поздними версиями.

Vocalizer TTS Voice


Жанр Работа
Рейтинг 3,3
Установки 500 000–1 000 000
Разработчик Code Factory
Русский язык есть
Оценок 3 405
Версия 2.0.8
Размер apk 5.4 MB


Синтезатор речи с меню на английском языке. Программа обладает интегрированным TTS-движком, поддерживающим более 50 языков. Сервис выгодно выделяется приятным и чистым звуком, тембр которого можно настраивать на свое усмотрение.

Vocalizer позволяет озвучить популярные Андроид-приложения, такие как книги, и реабилитационное программное обеспечение.

Среди других важных функций Vocalizer TTS Voice стоит отметить:

  • Поддержка 50 языков и 100 видов голоса.
  • Поддержка эмоцзи (а вы знали, что есть ?).
  • Озвучивание слов в словарях.
  • Настройки скорости чтения.
  • Настройки озвучивания пунктуации.

После того, как программа будет установлена на вашем устройстве, вы можете активировать ее через меню настроек в разделе «Язык и методы ввода» – Text-To-Speech и установить Vocalizer TTS как систему по умолчанию.

Приложение совместимо с системой Android версии 4.0 и далее.

Если вам понравилось это приложение, и вы ищете похожие приложения – посмотрите обзор . А если вы в незнакомой стране, и вам не до озвучки текста, вам нужно перевести этот текст – вы можете сфотографировать его и перевести .