diff --git a/docs/web-test-recording-guide.md b/docs/web-test-recording-guide.md index 59f3f555..cf94afc1 100644 --- a/docs/web-test-recording-guide.md +++ b/docs/web-test-recording-guide.md @@ -202,13 +202,15 @@ await showCaption('Технические детали', { speech: false }); ### Какой провайдер выбрать? -| Контент | Рекомендация | Почему | -|---------|-------------|--------| -| **Русскоязычный** | Edge TTS (DmitryNeural / SvetlanaNeural) | Правильные ударения, естественная интонация, верные смысловые акценты | -| **Англоязычный / мультиязычный** | ElevenLabs | Менее «роботизированный» тембр, хорошая мультиязычная модель | -| **OpenAI-совместимый сервис** | OpenAI | Если уже есть API-ключ или свой TTS-сервер | +| Провайдер | Тембр | Произношение русского | Цена | +|-----------|-------|----------------------|------| +| **Edge TTS** | Синтетичнее | Корректные ударения, правильная артикуляция | Бесплатно | +| **ElevenLabs** | Живее, естественнее | Возможны ошибки в ударениях и артикуляции (напр. «докумЭнт», «крЕдит» вместо «кредИт») | Платно (starter+) | +| **OpenAI** | Зависит от голоса | Зависит от сервиса | Платно | -**Для русскоязычных видеоинструкций рекомендуется Edge TTS** — он бесплатный и даёт лучшее качество русской речи. Голоса DmitryNeural и SvetlanaNeural специально обучены для русского языка: правильно расставляют ударения, делают паузы в нужных местах и выделяют ключевые слова. ElevenLabs при озвучке русского текста звучит «через английский» — тембр приятнее, но акцент и просодика хуже. +**Для русскоязычных видеоинструкций рекомендуется Edge TTS** — он бесплатный и даёт надёжное качество русской речи. Голоса DmitryNeural и SvetlanaNeural специально обучены для русского языка: правильно расставляют ударения, корректно артикулируют и делают паузы в нужных местах. + +**ElevenLabs** даёт более живой, «человечный» тембр — голос звучит менее синтетически. Однако мультиязычная модель иногда ошибается в произношении русских слов (особенно профессиональная терминология). Если выбираете ElevenLabs для русского контента — берите **professional-голоса** с образовательным или деловым профилем (например, Olga Orlova, Artem), они дают лучший результат, чем англоязычные premade-голоса через мультиязычную модель. Управлять ударениями через API нельзя — фонемные теги (SSML) поддерживаются только для английских моделей. ### Edge TTS (бесплатный) — рекомендуется для русского @@ -229,21 +231,29 @@ await showCaption('Технические детали', { speech: false }); } ``` -### ElevenLabs (платный) — для английского и мультиязычного контента +### ElevenLabs (платный) — живой тембр -Модель `eleven_multilingual_v2` поддерживает русский, но лучшие результаты — на английском. Тембр менее синтетический, чем у Edge TTS. +Модель `eleven_multilingual_v2` поддерживает русский. Тембр заметно живее, чем у Edge TTS, но возможны артикуляционные ошибки на русской терминологии. + +Для русского контента выбирайте **professional-голоса** с образовательным/деловым профилем из Voice Library: + +| Голос | ID | Профиль | +|-------|----|---------| +| Olga Orlova | `d60rsXo2p0OwikDR5bS7` | Clear and Engaging | +| Artem | `WTn2eCRCpoFAC50VD351` | Friendly & Professional | +| Denis | `0BcDz9UPwL3MpsnTeUlO` | Pleasant, Engaging and Friendly | ```json { "tts": { "provider": "elevenlabs", "apiKey": "sk_...", - "voice": "onwK4e9ZLuTAKqWW03F9" + "voice": "d60rsXo2p0OwikDR5bS7" } } ``` -`voice` — ID голоса из библиотеки ElevenLabs (не имя). Список голосов — в личном кабинете. Требуется платный тариф (starter и выше). +`voice` — ID голоса (не имя). Professional-голоса добавляются в аккаунт через Voice Library в личном кабинете. Требуется платный тариф (starter и выше). Особенности: лимит на параллельные запросы (2–3 одновременно), система автоматически ограничивает размер пакета.