Поиск

Приложения с распознаванием речи

Технология распознавания речи позволяет строить максимально дружественные телефонные IVR приложения. Во время диалога с роботом абонент осуществляет выбор в меню не только тональным набором но и а произнося голосовые команды. Естественный для человека стиль общения помогает максимально быстро предоставить доступ к желаемой информации или выполнить необходимую операцию.
Благодаря распознаванию речи появилась возможность создавать такие системы, которые было практически невозможно реализовать, имея в качестве интерфейса только тональный набор. Например, система автоматического бронирования авиабилетов по телефону подразумевает выбор из большого числа городов, и тональное меню здесь практически нереализуемо. При использовании же распознавания речи, диалог системы с пользователем может выглядеть примерно так:
Система: Назовите город вылета
Абонент: Москва
Система: Назовите город прилета
Абонент: Хабаровск
Система: Назовите дату
Абонент: 15 июля
т.е. максимально естественно и приближенно к обслуживанию оператором.
Один из ведущих производителей систем распознавания речи в телефонии, компания Vocative разработала продукт LOGOS, специально предназначенный для распознавания произвольного набора слов и фраз с заранее определенным набором возможных контекстов в телекоммуникационных приложениях:
  • Навигация по информационно-развлекательным IVR-меню (информация о счете, заказ билетов, гороскопы, результаты матчей и т.п)
  • Голосовое управление VAS-услугами (голосовая почта, навигация по контенту) В настояший момент компания Vocative концентрирует усилия на подготовке лучшей технологии распознавания русской речи для использования в многопользовательских приложениях в телекоммуникационном и корпоративном сегментах рынка.
Основные характеристики:
  • Дикторонезависимость
  • Шумоустойчивость
  • Уровень уверенности (Confidence level)
  • Неограниченный словарь
  • Интеллектуальные алгоритмы выделения речи из звукового потока (Voice Activity Detection)
  • Лингвистические алгоритмы, учитывающие особенности русского языка: фонетика, морфология, правила произношения, вариативность
  • Кэширование грамматик
  • Распознавание DTMF
Основные технические характеристики LOGOS:
  • Поддерживаемые платформы: Windows 2000, Windows XP
  • API: MRCP
  • Формат звукового сигнала: 8 kHz
  • Формат описания грамматик: SRGS 1.0, SISR
Распознавание речи используется в Smartphone в готовом "коробочном" решении - Smartphone Speech Attendant. Для решений класса Speech Attendant (Автосекретарь) компания Vocative разработала специальный продукт - Smart LOGOS .

Copyright © 2010-2017 NOVAVOX