AssemblyAI 宣布对其服务进行了重要升级,包括在其 Universal-1 模型中增加了德语语音转文字 (STT) 支持,并增强了个人可识别信息 (PII) 和实体检测模型,根据 AssemblyAI 的报道。
德语语音转文字加入 Universal-1
这家 AI 公司将德语支持整合到了 Universal-1 中,这是其最先进的多语言 STT 模型。此更新使用户能够以高准确率转录德语音频和视频,方便开发者将德语转录功能集成到他们的应用中。
Universal-1 模型以其在多种语言中的语音识别高性能而闻名。随着德语的加入,AssemblyAI 继续扩展其语言能力,满足更广泛的受众,提升用户体验。
改进的 PII 和实体检测模型
AssemblyAI 还升级了其英文 PII 文本涂抹和实体检测模型。改进提高了从转录中检测和删除个人可识别信息和其他实体的准确性,确保更高的数据安全性和隐私法规的合规性。
更新模型的新功能包括检测 16 个新实体,如 vehicle_id 和 account_number。此外,PII 文本涂抹模型现在支持四种新语言:中文、荷兰语、日语和格鲁吉亚语,使总数达到 47 种语言。
这些改进使开发者能够生成删除敏感信息的转录,利用 AssemblyAI 的先进音频智能模型。
额外资源和社区参与
AssemblyAI 鼓励开发者通过他们的详细 文档 探索 Universal-1 和更新的 PII 和实体检测模型的增强功能。公司还邀请用户在 Twitter 等社交媒体平台上分享他们的项目并参与讨论,使用标签 #AssemblyAI 并提及 @AssemblyAI。
来自 AssemblyAI 博客的见解
AssemblyAI 博客提供各种教程和指南,帮助开发者最大化其 API 的潜力。近期的帖子包括:
- 使用 Node.js 从音频中涂抹个人可识别信息 (PII):学习如何使用 Node.js 和 AssemblyAI API 自动从音频和视频文件中涂抹 PII。
- 使用 LLMs 在 Python 中提取电话洞见:了解如何使用大语言模型 (LLM) 和 Python 自动提取客户通话洞见。
- 使用 LLMs 在 Node.js 中总结音频:学习使用 Node.js 和 AssemblyAI 语音转文字 API 总结音频。
流行 YouTube 教程
AssemblyAI 的 YouTube 频道提供教程,帮助用户充分利用其服务。流行视频包括:
- 高效转录和筛选大量音频的最佳方法:学习如何使用 AssemblyAI 的 Universal-1 模型高效转录大量音频。
- 从头开始编写 AI 语音机器人:使用 Python 进行实时对话:构建一个实时 AI 语音助手,能够处理通话、转录语音并生成响应。
- 如何使用 @postman 测试带有音频数据的 LLM:学习如何使用 AssemblyAI 和 LeMUR,AssemblyAI 用于语音数据的 LLM 框架,来转录和理解音频数据。