Всем известно, что Asterisk является очень гибкой программной телефонной платформой, на основе которой можно достаточно просто строить приложения, гибко адаптируемые под конкретные требования бизнеса. Например, простейшее IVR меню может быть построено за 20 минут, при этом наибольшее время потребуется для записи звуковых файлов для меню, подбор наилучшего варианта записи, подгонка фрагментов записи друг к другу (по интонации, громкости и пр.)
Представьте, что теперь не нужно записывать звуковые файлы, для использования в IVR системе. Диктор не может заболеть, потерять голос или уволиться, в конце концов. Подготовка и обновление фраз для IVR сводится к замене или изменению текста. Время, которое требуется для этой процедуры несоизмеримо меньше по сравнению с записью речевых сообщений диктором.
Этот факт позволит аутсорсинговым call-центрам вводить новые услуги (ветки меню для новых проектов) в кратчайшие сроки, что несомненно повышает эффективность call-центра в разы.
Далее »
автор igorg
\\ теги: ASR, call-центр, IVR, mrcp, TTS, unimrcp, распознавание речи, синтез, ЦРТ
Сегодня с большим удовольствием и некоторым разочарованием, обнаружил для себя, что в Астериске появится полноценная поддержка распознавания/синтеза речи посредством MRCP протокола. Недавно такая поддержка появилась в FreeSWITCH (с версии 1.0.4), а сейчас по многочисленным просьбам, автор библиотеки произвел работы по созданию аналогичного модуля для Астериск и анонсировал появление базовой поддержки в новостях на сайте. Рекомендую скачивать исходные коды напрямую из svn и пользоваться на данный момент реализацией, содержащейся в модуле app_unimrcp.
Далее »
автор igorg
\\ теги: freeswitch, mrcp, unimrcp, распознавание речи, синтез
В Asterisk с версии 1.4 предусмотрен API для сопряжения с системами распознавания речи. Данный API позволяет стандартным образом предоставить возможность распознавания речи приложениям, построенным на базе Asterisk. На данный момент мне известны модули для коммерческих систем Lumenvox и Nuace. Есть некоторая попытка написать клиент-серверное решение для Sphinx, эта реализация может служить хорошим учебным пособием по написанию модуля для системы ASR, так как другие примеры отсутствуют. Данный API используется в рамках VXML интерпретатора от i6net — VXI* для задач распознавания речи.
Я немного расскажу о API в плане написания модуля для сопряжения Asterisk с системой распознавания речи. Материала по этой теме толком нет, нужно смотреть исходные коды. Для справедливости стоит отметить, что исходники в этой части далеко не сложны, да и систем распознавания не много, чтобы написание таких модулей являлось частой задачей.
Далее »
автор igorg
\\ теги: API, ASR, Sphinx, исходные коды, программирование, распознавание речи, речь