AssemblyAI 扩展 PII 去标记和实体检测至 47 种新语言

realtime news  Jul 19, 2024 02:07  UTC 18:07

1 Min Read

AssemblyAI 宣布对其 PII 去标记和实体检测功能进行了重大更新,增强了其音频智能能力。根据 AssemblyAI 的说法,此次更新包括对另外 47 种语言和 16 种新实体类型的支持,使平台功能更加强大和全球化。

扩展的 PII 去标记语言支持

AssemblyAI 最新更新的 PII 去标记功能现在支持更多 47 种语言。这一增强确保了各类语言和地区的个人身份信息 (PII) 得到保护,提供了强大的隐私措施。该功能允许用户安全处理客户服务电话,安全共享用户生成内容,并在市场研究中保护参与者隐私。

PII 去标记可以识别并删除转录中如地址、电话号码和信用卡信息等敏感数据。它支持文本和音频删除,确保高度精确和准确。模型在主要语言(包括英语、法语、德语、意大利语和西班牙语)中的精度、准确率和召回率超过 99%。

实体检测的改进

AssemblyAI 还通过增加 16 种新实体类型来增强其实体检测功能,使总数达到 44 种。此更新允许用户通过自动识别和分类转录中的关键信息,从他们的音频数据中提取更多价值。实体检测支持识别姓名、组织、地址等,提供详细的实体列表和时间戳。

该功能旨在简化从大量音频数据中提取有意义见解的过程,使其更高效且资源成本更低。它支持各种用例,包括分析呼叫中心交互、分类媒体内容和从市场研究数据中提取趋势。

实体检测在主要语言中提供可靠的99%准确率,并支持 13 种语言的欧盟数据驻留,帮助用户保持区域合规要求。

常见问题

扩展后的 PII 去标记和实体检测语言是否支持欧盟数据驻留?

是的,AssemblyAI 的“最佳 ASR”提供中的 13 种语言将支持欧盟数据驻留,包括英语、法语、德语、意大利语和西班牙语。

PII 去标记和实体检测在各语言中的质量如何?

最高质量的 PII 去标记和实体检测见于如英语、法语、德语、意大利语和西班牙语等语言,其精确度、准确率和召回率高达 99% 以上。

使用 AssemblyAI 的 PII 去标记和实体检测时,我的数据有多安全?

AssemblyAI 优先考虑数据安全,提供企业级别的传输和静态加密。用户可以随时请求删除他们的数据,这些请求会被及时处理。



Read More