Голосовое управление (программное обеспечение)

Статус
Закрыто для дальнейших ответов.

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
Прошу совет у коллективного разума форума: есть ли нормальные (адекватно работающие то есть) программы для сабжа?

Нужен такой процесс:

1. На входе голосовая команда (надиктованная/натренированная программе)
2. Уверенное распознавание оной
3. На выходе имитация нажатия на кнопку (keystroke, стало быть)


Вспахал Гугел с Яндексом - весь взмок уже за 2 дня. Толку ноль. 'hz'
 

xm

иксэ́м
R.I.P.
Сообщения
4 978
Реакции
2 667
Ответ: Голосовое управление (программное обеспечение)

Не написано к чему конкретно это, но голосовому набору телефона уже 100 лет. Как сейчас помню, на самой популярной первой Nokia (номер модели не вспомню, что-то типа 2310) работал безотказно. Это же какая-то программа в нём была?
 

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
Ответ: Голосовое управление (программное обеспечение)

Это должна быть программа для операционной системы Microsoft® Windows® 7.

В ойФоне, который я использую, голосовые функции есть и так. Надо для ПК.
 

ch_alex

Погулять вышел.
15 лет на форуме
Сообщения
8 420
Реакции
2 709
Ответ: Голосовое управление (программное обеспечение)

Когда-то был Дракон (Dragon Dictate), когда только появилась 95-я винда. Теперь даже не могу предположить.

Программный комплекс "Горыныч" - первая русскоязычная система автоматического распознавания речи. Программа для диктовки и голосового управления компьютером по-русски.

Возможности программы:
* Ввод текста с голоса на русском и английском языке; голосовое управление периферийным оборудованием; голосовое управление отдельными функциями операционных систем Microsoft Windows; голосовое управление функциями текстовых редакторов и прикладных программ; позволяет оформлять документы, дипломные работы (включая формулы) для школьников, абитуриентов, студентов.
* В качестве ядра системы используется американская программа "Dragon Dictate" и русский модуль, разработаный программистами White; он обеспечивает ввод под диктовку русского текста и голосовое управление по-русски (и те же функции для английского языка).
* Данная программа позволяет осуществлять голосовой ввод текстов в компьютер в редакторах, работающих под операционными системами Windows, а также осуществлять голосовое управление компьютером. Скорость голосового набора текстов зависит от производительности Вашего компьютера и может достигать 500-700 печатных знаков в минуту, что значительно превышает скорость "слепого" метода печатания.
* При этом система "Горыныч" осуществляет автоматический контроль правописания: в текстах, введенных с ее помощью, исключены орфографические ошибки, что практически недостижимо при использовании клавиатурного ввода. Во время работы Вы по-прежнему можете пользоваться клавиатурой и мышкой. Чем чаще Вы диктуете, тем больше система "привыкает" к Вашему голосу.


Typle Premium 2.0 - это отличная и простая в использовании программа для управления компьютером с помощью голоса. Она обладает удивительными возможностями. К примеру, с помощью Typle 2.0 вы легко сможете записать сколь угодно много голосовых команд, а потом просто произнести их в микрофон. Распознавание речи на очень высоком уровне. Например, Вы хотите открыть песню "ABBA - Happy New Year". Просто скажите в микрофон "Открыть Happy New Year", и в мгновение ока компьютер откроет проигрыватель и начнет воспроизводить эту песню. Команду можно присвоить и сайтам. Для этого достаточно в настройках указать определенный параметр и произнести в микрофон "Открыть сайт Корпорации EnerSoft". Voila! Наш сайт уже перед вами. Здорово, не правда ли?

Speaker - ну очень интересная программа по голосовому управлению и разпознаванию русской речи. Работает просто и быстро. Единственное, что нужно - это подключение к интернету. Это своего рода облачное приложение. Но всё работает. Спасибо разработчикам. Вот их сайт: http://голосовоеуправление.рф

Чисто теоретически я обратил бы внимание на Горыныча.


http://www.vxodmir.ru/to-download-free-of-charge/interesting-programs/47.html

ЗЫ. Пользуюсь Яндексом. Пусть его не любят мэтры, но его люблю я. :)

ЗЗЫ. А вот и Хабр что-то написал. http://habrahabr.ru/qa/3955/
 

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
Ответ: Голосовое управление (программное обеспечение)

Уже пробовал все эти проги. И обзор видел, конечно.

"Dragon Dictate" - это только распознавание текста в чистом виде (на английском, разумеется). В "Typle" нет keystroke, всего лишь запуск какой-нибудь сторонней программы. "Горыныч" просто сам по себе лютый мрак. "Speaker" не существует в природе больше - не только сайт помер, но и нигде не найти следов программы (потестить, соответственно, не получилось).

Большинство проектов на данный момент умерло. Ни сайтов, ни следов не осталось. Есть "Game Commander 3", но ему так же 10 лет исполнилось и поддержка прекращена. Прога всем хороша, кроме, собственно, качества распознавания. Оно неудачное и неустойчивое. Всего три паттерна тренировки.

Еще есть "Комбат". 96-й год выпуска, под Windows 3.0. Ставить не стал. '))'

Все остальное, что нашел, надстройки над распознавалкой самой системы. По понятным причинам не годится - это просто ввод текста на английском. Мне же нужны свои паттерны.

Встречаются монстроидальные системы для call-центров и промышленных применений. Это тоже не то. :)


А вот "проект Simon" по ссылке из Хабра попробую. Спасибо.


ЗЫ. Нашел "Speaker" - прога оказалась вирусом. Именно поэтому "разработчик" с сайтом пропал.
 

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
Ответ: Голосовое управление (программное обеспечение)

Попробовал "проект Simon". Нечто линуксоидное, опенсорсное, с какими-то эмуляторами чего-то. Поставилось. Запустилось. Долго настраивал. Работать отказалось. '))'

Про Typle уже говорил - не то.

А вот за список по второй ссылке спасибо. Пороюсь.
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 324
Реакции
7 870
Ответ: Голосовое управление (программное обеспечение)

Существует подозрение, что отечественных разработчиков в этом направлении или скупают или тупо стреляют враги. Надо искать иностранные аналоги...
 

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
Ответ: Голосовое управление (программное обеспечение)

С иностранными тоже не менее печально.

По приведенным ссылкам все перерыл - нет результата.


ЗЫ. Пока пытаюсь уговорить стабильно работать Game Commander, повесив в разрыв сигнала Noise Gate.
 

ch_alex

Погулять вышел.
15 лет на форуме
Сообщения
8 420
Реакции
2 709

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
Ответ: Голосовое управление (программное обеспечение)

Этот сайт уже перерыл. :) Кроме разве что форума тамошнего.
 

bomer

Участник
Сообщения
2
Реакции
0
Здравствуйте . Голосовые программы эволюционируют.
Typle довольно серьёзная программа, жаль распознавание нет.
В принципе у кого интернет всегда подключен всегда то лучше пользоваться программами
на базе гугловского движка распознавания у них распознавалка лучше.
Сам испытываю программу Speechka
простая программа минимум настроек.
Тут видео как она работает
 

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
Голосовые программы эволюционируют
Не заметно.
на базе гугловского движка
%)

Repeat:
1. На входе голосовая команда (надиктованная/натренированная программе)
3. На выходе имитация нажатия на кнопку
 

Vishnevskyi

15 лет на форуме
Сообщения
260
Реакции
87
Взгляните Game Commander 3. Может понравится.
 

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
Вперед, в прошлое:
Есть "Game Commander 3", но ему так же 10 лет исполнилось и поддержка прекращена. Прога всем хороша, кроме, собственно, качества распознавания. Оно неудачное и неустойчивое. Всего три паттерна тренировки.
 

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
В последний раз повторю:

Нужно реагирование на любую команду, любой заранее заданный звук, а не распознавание речи, слов и фраз. И нужно имитировать нажатие на клавиатуру (keystrokes), а не искать браузером или запускать по шорткатам.


в программе Speechka
Это не программа, а оболочка. Программа - она у Гугла.
 

РастОК

Участник
Сообщения
2
Реакции
0
В последний раз повторю:

Нужно реагирование на любую команду, любой заранее заданный звук, а не распознавание речи, слов и фраз. И нужно имитировать нажатие на клавиатуру (keystrokes), а не искать браузером или запускать по шорткатам.

Есть ещё древняя программа VoiceNet2000, но у меня она не запускается, т.к. 64 разрядная система.
Тоже ищу программу удовлетворяющую вышеперечисленным требованиям. Лет 12 назад случайно набрёл на такую (может это даже VoiceNet200). В инструкции говорилось, что чем длиннее фраза, тем более точно он её сможет потом определить и выполнить команду, повешенную на фразу и меньше будет путаться среди других команд. В ней также указывалось, что ни о каком распознавании не идёт речь, а только лишь о распознавании последовательности звуков, поэтому она не была привязана ни к какому языку. Думаю подобным алгоритмом пользуются сейчас программы, которые по кусочку музыкальной дорожки определяют композицию и исполнителя в интернете.
P.S. Тоже уже второй день вскапываю интернет, но не могу найти ничего толком. Если кто установит VoiceNet200, отпишитесь как она работает.
 

TRANTOR

Son of a Gun
Топикстартер
R.I.P.
Сообщения
4 566
Реакции
2 956
Нашел эту прогу. Точное название VoiceNet VRS 2000. Установить ее не представляется возможным на x64-систему. Разработчика уже давно след простыл - новых версий ожидать не приходится.
 

РастОК

Участник
Сообщения
2
Реакции
0
Нашел эту прогу. Точное название VoiceNet VRS 2000. Установить ее не представляется возможным на x64-систему. Разработчика уже давно след простыл - новых версий ожидать не приходится.
Нашёл прогу, вчера весь вечер тестил, результаты положительные - заходит в браузер, перемещается в нём по окнам, закрывает окна, закрывает браузер, заходит на любимые сайты, включает музыку и многое другое, единственное, что нужно ползунок в окне Forgiveness level переместить на пару позиций вниз, чтобы прога не срабатывала на каждый громкий звук (я так понял). Что такое второе окно Set Confidense level я не разобрался, переводится как "уровень доверия", но к чему это я так и не понял, может в нём нужно ползунок ниже сделать, чтобы на всякое "блаблабла" он не распознавал что-то своё. Во всяком случае старайтесь давать названия подлиннее, чтобы ошибок было меньше, ну типа не просто Хром, а Браузер_Хром, хотя и так распознаёт. Окно программы в точности совпадает с окном VoiceNet VRS 2000, так что думаю кто-то у кого-то слизал оболочку. Судя по тому, что в VoiceNET 2000 в режиме ожидания при каком-либо звуке он тут-же записывается и воспроизводится в колонки, видимо всё-таки VoiceNET взяла оболочку у этой проги. Называется она Спик-ту-ме (пишу на русском, чтобы не удалили за авторские права, хотя они закончились ещё в 2010 судя по окошку "О программе"). В интернете практически невозможно найти.
{censored}
 
Последнее редактирование модератором:
Статус
Закрыто для дальнейших ответов.