Яндекс.Метрика

Polyglot Voice

Вы читаете руководство Polyglot Voice — нашей платформы для преобразования речи в текст и перевода.

Чтобы транскрибировать или перевести аудио или видео в текст, войдите или создайте бесплатный аккаунт (это займет всего минуту). Студия поддерживает 98 языков; вы можете изменить направление и модели в любое время после загрузки.

Speech-to-text API

API нужен, когда транскрипция и перевод должны работать внутри вашего продукта, бота, внутреннего инструмента или автоматизации. Создавайте задачи из файлов или ссылок, проверяйте статус, принимайте webhook и забирайте текстовый результат.

Загружайте аудио/видео или создавайте задачи по поддерживаемым ссылкам

Получайте webhook по завершении и забирайте структурированные результаты

Связывайте транскрипцию с переводом, субтитрами и автоматизацией

Попробуйте сценарий перед оплатой

Из записи в готовый текст, перевод или озвучку за несколько шагов

Покажите пользователю быстрый путь: загрузите файл или запишите речь, получите текст, затем переведите, озвучьте или выгрузите результат. Бесплатного старта достаточно, чтобы понять качество.

AI speechTranslationSubtitles

Быстрая оценка цены

10 min
10 000

Транскрибация от: 490

Озвучка примерно: 10

Расчёт примерный: итог зависит от выбранного качества, пакета и тарифа.

Как это работает

  1. Загрузите аудио/видео, вставьте ссылку или запишите речь в браузере.
  2. Выберите язык, качество и нужный результат: текст, перевод, субтитры или озвучку.
  3. Получите результат в кабинете и при необходимости докупите минуты, символы TTS или API-доступ.

Пример результата

Before

До: запись лекции, интервью или видео на другом языке.

After

После: структурированный текст, перевод, субтитры и база для озвучки или клипов.

Почему можно доверять

  • Исходные файлы удаляются с диска примерно через 1 час после обработки.
  • Можно начать бесплатно и платить только за нужные минуты, попытки или символы озвучки.
  • Есть веб-интерфейс для разовых задач и API для автоматизации.

Что входит в тариф

  • Минуты/попытки транскрибации
  • Символы TTS для озвучки
  • История задач, экспорт, API-ключи и webhook

Честные ограничения

  • Демо ограничено 60 секундами
  • Качество зависит от шума и дикции
  • Дорогие модели и длинные файлы требуют тарифа

Как это работает

  1. Загрузите исходный аудио или видео файл, соответствующий вашему рабочему процессу.
  2. Выберите задачу, язык или направление перевода, соответствующее вашей цели.
  3. Просмотрите результат, экспортируйте вывод и продолжите работу с субтитрами, клипами или автоматизацией через API.

Поддерживаемые форматы и входные данные

REST APImultipart uploadURL taskswebhooks

Лучше всего подходит для

  • боты с голосовыми сообщениями
  • обработка звонков
  • медиаархивы
  • внутренняя автоматизация

Часто задаваемые вопросы

Как начать использовать speech-to-text API?

Создайте API-ключ в кабинете, отправьте запрос загрузки и получите результат после завершения задачи.

Поддерживает ли API webhook?

Да. Можно настроить webhook завершения, чтобы получать событие, когда задача транскрипции закончилась.

Можно ли транскрибировать видео через API?

Да. API принимает поддерживаемые аудио/видео файлы и задачи по ссылке в зависимости от тарифа и лимитов.

Связанные руководства

Связанные страницы