Voice input support by AnToHu0 · Pull Request #98 · vakovalskii/ValeDesk

AnToHu0 · 2026-01-27T19:38:39Z

Голосовой ввод: запись аудио с микрофона и транскрипция в реальном времени
Настройки голоса: вкладка в настройках для конфигурации STT сервера (base URL, API key, модель, язык)
Docker setup: скрипт setup_voice_server.sh для запуска локального сервера транскрипции (faster-whisper-server)
Интеграция: потоковая отправка аудио-чанков в Tauri backend с обработкой частичных и финальных транскрипций
Хранение настроек: добавлена структура VoiceSettings в БД для сохранения конфигурации голосового ввода

Потоковая отправка чанков на сервер транскрипции
Автоматическое обновление текста промпта при получении транскрипций
Проверка доступности voice server с индикацией статуса
Локальный сервер в докере выдаёт неплохой ТПС, для увеличения можно в скрипт передавать параметрами большее число ядер и памяти(по умолчанию 8 ядер и 5 гигов).

PS. Круто будет, если на основе этого потом добавить скилл с распознаванием аудиофайлов.

PPS. Я не шарю ни за раст, ни за реакт, но очень уж хотелось запилить эту фичу. Если что-не так с кодом, можно поправить ручками в рамках пр.

…odule

AnToHu0 added 2 commits January 27, 2026 22:58

Voice input support+tts server docker setup

b647327

Merge remote-tracking branch 'origin/main' into feature/voice-input-m…

889e66f

…odule

Provide feedback