[ID CC-CC2022] Голосовой запуск скриптов

LeshikSan · 26.10.2020

Можно организовать по такой схеме:
1. создаем локальный сервер, открываем с него в Chrome страницу, на которой реализован webkitSpeechRecognition
2. в InDesign вешаем на горячую клавишу (напр. F2) jsx-скрипт, который отправляет http-запрос на этот сервер с командой включения захвата голоса
3. сервер пересылает команду своей странице в Chrome, там отрабатывает webkitSpeechRecognition, результат пересылается серверу
4. сервер возвращает jsx-скрипту текстовый результат, на основе которого производится какое-либо действие.

Теоретически может быть полезно при внесении большого количества правки.

Работает ли у вас в хроме webkitSpeechRecognition проверяется здесь:

Chrome Browser

Google Chrome is a browser that combines a minimal design with sophisticated technology to make the web faster, safer, and easier.

www.google.com

_MBK_ · 26.10.2020

Не пойму

LeshikSan сказал(а):
Можно организовать

или уже реализовано и работает? '))'

Oleg Butrin · 26.10.2020

Теоретически все это можно сделать в CEP, но практически польза сомнительна.
"Вольжский бюльвар двацить шест дропь симнацать".

LeshikSan · 26.10.2020

Ну понятно что голосовой набор текста будет кривой. Но корректно распознать одно-два слова вполне по силам.
В общем все это пока на уровне спортивного интереса. Вечером постараюсь выложить практическую реализацию.

apg_777 · 27.10.2020

В MacOS это делается системными средствами: Системные настройки—Универсальный доступ—Диктовка—Команды диктовки. Понятливость хорошая. У меня уже не маленький список команд, на скриншоте только небольшая часть.

LeshikSan · 30.10.2020

Как и обещал, выкладываю голосозапускатель

0. Проверяем в браузере Chrome, что webkitSpeechRecognition у нас работает: Chrome Browser

1. Устанавливаем node.js: Node.js
2. Распаковываем nodeWebkitSpeechRecognition_1.0.zip
3. Открываем окно командной строки:
- пишем: cd <путь_к_распакованой_папке> (достаточно папку перетянуть в окно - путь сам пропишется), жмем Enter
- пишем: node server, жмем Enter. Должна появиться надпись "Сервер запущен". Сервер будет работать пока открыто это окно.
4. В браузере Chrome открываем страницу http://localhost:8082/
5. Теперь можно в InDesign запустить скрипт do_ speech_capture.jsx. На произнесение дается 3 секунды времени. Для демонстрации в скрипте прописано поведение на два слова: "запятая" и "тире" (курсор должен стоять в тексте), остальные распознаные фразы будут просто показаны в всплывающем окне.

Поиск

[ID CC-CC2022] Голосовой запуск скриптов

LeshikSan

Chrome Browser

_MBK_

Пикирующий бомбардировщик

Oleg Butrin

LeshikSan

apg_777

LeshikSan

Вложения