“Яндекс, записывай!” благодаря speechkit cloud
Другими словами, вчера на конференции YAC2014 Яндекс показали новые возможности SpeechKit Cloud, который позволит добавлять разработчикам функцию распознования голоса во всевозможные приложения. Технология распознает русский язык, реагирует за одну секунду и она кроссплатформенная.
SpeechKit Cloud – это облачный сервис распознования речи со скоростью 1,1 секунда, который можно встраивать в приложения, системы навигации, телефонию, компании с большим объемом телефонных звонков и множество других сфер применения. Чтобы долго не объяснять, что это и для чего, вот вам простой понятный пример.
Именно с помощью SpeechKit речь распознает CUBIC, это робот-домашний помощник от компании Cubic Robotics, о которых мы уже писали вот здесь. Кроме этого интересного робота, собственно разработкой пользуются и дочерние продукты Яндекса – навигатор, карты, поиск и тд.
Теперь же SpeechKit научился распозновать голосовую активацию. Это точно так же, как говорить “ОК, Google”, только можно менять формулировку. Разработчик сам может выбрать, какой фразой или фразами запускать сервис.
После того, как кодовые слова сказаны, помощник слушает вас внимательнее любого собеседника, чтобы потом выполнить поставленную задачу. “Яндекс, записывай”, – это первая голосвая команда, которую, собственно, и показали на YAC2014.
Выгодно отличается от множества других систем распознавания голоса SpeechKit именно тем, что его разрабоатывали русские, а значит и понимание русского языка выше всяких похвал. Еще летом Яндекс предоставлял статистику распознавания голосовых команд русским языком: диктовка текстов — 82%, короткие запросы из 3–5 слов на любую тематику — 85% и геозависимые запросы — 95%.
Кроме того, сервис научился выделять ключевые слова в потоках речи: значения, цифры, команды. Поэтому реагирует достаточно конкретно и по делу. И теперь умеет отвечать голосом. Пока еще он недостаточно напоминает человеческий, но зато разборчивый.
Послушать можно хотя бы на примере вот этого ролика с тем же CUBIC. И он, точно как и Google Now, не всегда в ладах с ударениями.
Если вам стало любопытно, ознакомится более детально с возможностями системы можно в проекте Яндекс. Диктовка.
Название чудное, но попробовать ради интереса стоит. А для разработчиков компания даже выкатила SDK.
Если количество запросов не превышает 10 000 в сутки, использовать SpeechKit можно бесплатно.
Яндекс Speech Kit Cloud. Воспроизведение текста на JavaScript. Костыль #3