Яндекс.Метрика
Polyglot Voice

用 AI 将音视频转为文字 — 98+ 种语言

上传或录制音频和视频,选择处理模型,并在几秒钟内将语音转换为多语言文本。

准确转录

在 98+ 种语言中提供高质量的语音转文本,并可翻译成 98+ 种语言。

实时录制

录制麦克风、耳机或系统音频,并具有实时进度和分钟跟踪。

学生讲座

将讲座录音转换为现成的笔记。非常适合备考。

剪辑编辑

在我们编辑器中直接从长视频创建短剪辑。

社区和支持

协作聊天、提案板和保持平台安全的适度工具。

集成到您的应用中

通过 REST API 和账户中的密钥将转录和媒体处理连接到您的产品 — 为开发者构建。

Polyglot Voice 地理分布

语言越热门,模型的基础可信度就越高。我们支持稀有语言,但处理可能需要稍长时间。

简体中文

zh

英语

en

法语

fr

德语

de

日语

ja

葡萄牙语

pt

俄语

ru

西班牙语

es

南非荷兰语

af

阿尔巴尼亚语

sq

阿姆哈拉语

am

阿拉伯语

ar

亚美尼亚语

hy

阿萨姆语

as

阿塞拜疆语

az

Bashkir

ba

巴斯克语

eu

白俄罗斯语

be

孟加拉语

bn

波斯尼亚语

bs

布列塔尼语

br

保加利亚语

bg

缅甸语

my

加泰罗尼亚语

ca

技术要求

音频/视频上传和音频录制

  • 支持的音视频格式:3g2, 3gp, aac, aif, aiff, avi, flac, flv, m2ts, m4a, m4v, mkv, mov, mp3, mp4, mpeg, mpg, mpga, mts, oga, ogg, ogv, opus, ts, wav, webm, wmv, wma。您可以上传文件或粘贴视频链接(支持内置下载器的 YouTube 和其他来源)。主要限制:处理视频时长最高 5 分钟。为了获得最佳稳定性,我们推荐使用 MP3、WAV、M4A、MP4 或 WEBM。
  • 从麦克风、耳机或系统声音录制音频。免费方案最高 5 分钟。
  • 选择相同的语言(例如俄语→俄语,英语→英语等)可以跳过翻译步骤,最快地获得文本转录。非常适合记录任何受支持语言的讲座内容的学生。
  • 快速模型仅支持翻译和现场录制的英语。其他语言请使用中等或准确模型。
  • 如果录音语言设置为自动,识别可能比明确指定语言时耗时更长;为了获得更可预测的翻译结果,请手动选择语言。

如果音频长于 5 分钟,请将其拆分为几部分或使用付费录音分钟数,以避免被裁剪。

合作伙伴广告

音频、视频和语音工作流尽在掌握

Polyglot Voice 专为需要的不仅仅是简单转录的人士打造。该平台将音频转文本、视频转录、翻译、字幕工作流、剪辑制作、配音准备和媒体实用程序组合在一个流程中。这对于每天处理语音内容的创作者、学生、研究人员、营销人员和多语言团队非常有用。

无需在用于转录、字幕、翻译和媒体转换的单独工具之间切换,您可以上传一次,选择正确的工作流,然后导出结果用于发布、学习、存档或重新利用。

工作原理

  1. 1. 上传音频或视频,或实时录制语音。
  2. 2. 选择语言工作流:转录、翻译、字幕或配音准备。
  3. 3. 将结果导出为文本、字幕友好输出或可重复使用的媒体资产。

最适用于

  • 将讲座转为笔记的学生
  • 将视频转为字幕和剪辑的创作者
  • 翻译访谈、会议和培训媒体的团队
  • 为自动化管道使用 API 的开发人员

支持的工作流

音频转文本、视频转文本、语音转文本、字幕生成、翻译、剪辑提取、格式转换以及从视频中提取音频。

为什么选择我们

它结合了多语言覆盖、导出灵活性和创作者友好的工作流,而不是为每个步骤强加单独的工具。

常见问题

我可以在线将音频和视频转换为文本吗?

是的。Polyglot Voice 专为音频转文本和视频转文本工作流而设计,支持多语言转录。

我可以将语音翻译成另一种语言吗?

是的。您可以同时使用转录和翻译工作流,将语音内容转化为翻译文本,用于字幕或笔记。

它对讲座、访谈和播客有用吗?

是的。该工作流对于需要搜索性或字幕的讲座、访谈、会议和播客特别有用。

你们支持很多语言吗?

该平台围绕广泛的语言支持构建,包括处理多种输入语言的能力。