字幕在使视频内容更广泛受众可访问方面起着至关重要的作用。传统上,创建字幕需要进行费时费力的手动转录和同步。然而,AI 驱动技术的进步现在提供了更高效的解决方案。根据 AssemblyAI,一种新方法利用 AssemblyAI 的转录功能和 DeepL 的翻译服务快速准确地生成多语言字幕。
使用 AssemblyAI 进行转录
AssemblyAI 的语音转录功能可以在几分钟内将视频内容转录为文本。此异步转录服务允许用户上传视频文件并接收常用格式如 SRT 或 VTT 的转录内容,这些格式通常用于字幕。
在 AssemblyAI 提供的教程中,用户可以构建一个 Go 的 Web 应用程序来处理视频上传、转录音频并生成字幕。教程概述了设置过程,包括为项目创建目录、初始化 Go 模块以及使用 Gin 框架和 UUID 编写服务器代码来唯一标识作业。
集成 DeepL 进行翻译
一旦视频被转录,字幕可以使用 DeepL 翻译成多种语言。DeepL 以其高质量的翻译而闻名,并支持各种语言,使其成为此目的的理想工具。
教程演示了如何创建一个路由来处理翻译请求,将转录的字幕发送给 DeepL,并接收翻译后的文本。然后将此翻译后的文本重新集成到 Web 应用程序中,允许用户选择他们偏好的字幕语言。
前端实现
在前端,应用程序会定期检查转录状态并相应更新用户界面。一旦转录完成,会创建一个视频元素并添加原始字幕。用户可以从下拉菜单中选择一种语言,这将触发翻译过程并更新所选语言的字幕。
教程提供了详细的代码片段,用于设置服务器、处理文件上传、转录音频和翻译字幕。它还包括创建前端组件并将其与后端集成的说明。
结论
通过结合 AssemblyAI 和 DeepL,开发者可以创建一个无缝的工作流程来生成多语言字幕,显著提高视频内容的可访问性和用户体验。这种集成不仅节省了时间,还确保了字幕生成和翻译的准确性和一致性。
欲了解更多详细的说明和代码示例,请访问 AssemblyAI 的原始教程。
Image source: Shutterstock