Всем известно, что Asterisk является очень гибкой программной телефонной платформой, на основе которой можно достаточно просто строить приложения, гибко адаптируемые под конкретные требования бизнеса. Например, простейшее IVR меню может быть построено за 20 минут, при этом наибольшее время потребуется для записи звуковых файлов для меню, подбор наилучшего варианта записи, подгонка фрагментов записи друг к другу (по интонации, громкости и пр.)
Представьте, что теперь не нужно записывать звуковые файлы, для использования в IVR системе. Диктор не может заболеть, потерять голос или уволиться, в конце концов. Подготовка и обновление фраз для IVR сводится к замене или изменению текста. Время, которое требуется для этой процедуры несоизмеримо меньше по сравнению с записью речевых сообщений диктором.
Этот факт позволит аутсорсинговым call-центрам вводить новые услуги (ветки меню для новых проектов) в кратчайшие сроки, что несомненно повышает эффективность call-центра в разы.
Далее »
автор igorg
\\ теги: ASR, call-центр, IVR, mrcp, TTS, unimrcp, распознавание речи, синтез, ЦРТ
В Asterisk с версии 1.4 предусмотрен API для сопряжения с системами распознавания речи. Данный API позволяет стандартным образом предоставить возможность распознавания речи приложениям, построенным на базе Asterisk. На данный момент мне известны модули для коммерческих систем Lumenvox и Nuace. Есть некоторая попытка написать клиент-серверное решение для Sphinx, эта реализация может служить хорошим учебным пособием по написанию модуля для системы ASR, так как другие примеры отсутствуют. Данный API используется в рамках VXML интерпретатора от i6net — VXI* для задач распознавания речи.
Я немного расскажу о API в плане написания модуля для сопряжения Asterisk с системой распознавания речи. Материала по этой теме толком нет, нужно смотреть исходные коды. Для справедливости стоит отметить, что исходники в этой части далеко не сложны, да и систем распознавания не много, чтобы написание таких модулей являлось частой задачей.
Далее »
автор igorg
\\ теги: API, ASR, Sphinx, исходные коды, программирование, распознавание речи, речь