[ID CC-CC2022] Голосовой запуск скриптов

  • Автор темы Автор темы LeshikSan
  • Дата начала Дата начала

LeshikSan

Топикстартер
15 лет на форуме
Сообщения
266
Реакции
185
Можно организовать по такой схеме:
1. создаем локальный сервер, открываем с него в Chrome страницу, на которой реализован webkitSpeechRecognition
2. в InDesign вешаем на горячую клавишу (напр. F2) jsx-скрипт, который отправляет http-запрос на этот сервер с командой включения захвата голоса
3. сервер пересылает команду своей странице в Chrome, там отрабатывает webkitSpeechRecognition, результат пересылается серверу
4. сервер возвращает jsx-скрипту текстовый результат, на основе которого производится какое-либо действие.

Теоретически может быть полезно при внесении большого количества правки.

Работает ли у вас в хроме webkitSpeechRecognition проверяется здесь:
 
Теоретически все это можно сделать в CEP, но практически польза сомнительна.
"Вольжский бюльвар двацить шест дропь симнацать".
 
  • Спасибо
Реакции: kstati
Ну понятно что голосовой набор текста будет кривой. Но корректно распознать одно-два слова вполне по силам.
В общем все это пока на уровне спортивного интереса. Вечером постараюсь выложить практическую реализацию.
 
В MacOS это делается системными средствами: Системные настройки—Универсальный доступ—Диктовка—Команды диктовки. Понятливость хорошая. У меня уже не маленький список команд, на скриншоте только небольшая часть.
Снимок экрана 2020-10-27 в 19.40.22.png
 
  • Спасибо
Реакции: tor
Как и обещал, выкладываю голосозапускатель

0. Проверяем в браузере Chrome, что webkitSpeechRecognition у нас работает: Chrome Browser

1. Устанавливаем node.js: Node.js
2. Распаковываем nodeWebkitSpeechRecognition_1.0.zip
3. Открываем окно командной строки:
- пишем: cd <путь_к_распакованой_папке> (достаточно папку перетянуть в окно - путь сам пропишется), жмем Enter
- пишем: node server, жмем Enter. Должна появиться надпись "Сервер запущен". Сервер будет работать пока открыто это окно.
4. В браузере Chrome открываем страницу http://localhost:8082/
5. Теперь можно в InDesign запустить скрипт do_ speech_capture.jsx. На произнесение дается 3 секунды времени. Для демонстрации в скрипте прописано поведение на два слова: "запятая" и "тире" (курсор должен стоять в тексте), остальные распознаные фразы будут просто показаны в всплывающем окне.
 

Вложения

  • Спасибо
Реакции: Petruccio