AssemblyAI 扩展 PII 去标记和实体检测至 47 种新语言 - Blockchain.News

AssemblyAI 扩展 PII 去标记和实体检测至 47 种新语言

realtime news Jul 18, 2024 18:07

AssemblyAI 增强了 PII 去标记和实体检测,增加了对 47 种新语言和 16 种新实体类型的支持,提高了全球数据隐私和洞察提取能力。

AssemblyAI 扩展 PII 去标记和实体检测至 47 种新语言

AssemblyAI 宣布对其 PII 去标记和实体检测功能进行了重大更新,增强了其音频智能能力。根据 AssemblyAI 的说法,此次更新包括对另外 47 种语言和 16 种新实体类型的支持,使平台功能更加强大和全球化。

扩展的 PII 去标记语言支持

AssemblyAI 最新更新的 PII 去标记功能现在支持更多 47 种语言。这一增强确保了各类语言和地区的个人身份信息 (PII) 得到保护,提供了强大的隐私措施。该功能允许用户安全处理客户服务电话,安全共享用户生成内容,并在市场研究中保护参与者隐私。

PII 去标记可以识别并删除转录中如地址、电话号码和信用卡信息等敏感数据。它支持文本和音频删除,确保高度精确和准确。模型在主要语言(包括英语、法语、德语、意大利语和西班牙语)中的精度、准确率和召回率超过 99%。

实体检测的改进

AssemblyAI 还通过增加 16 种新实体类型来增强其实体检测功能,使总数达到 44 种。此更新允许用户通过自动识别和分类转录中的关键信息,从他们的音频数据中提取更多价值。实体检测支持识别姓名、组织、地址等,提供详细的实体列表和时间戳。

该功能旨在简化从大量音频数据中提取有意义见解的过程,使其更高效且资源成本更低。它支持各种用例,包括分析呼叫中心交互、分类媒体内容和从市场研究数据中提取趋势。

实体检测在主要语言中提供可靠的99%准确率,并支持 13 种语言的欧盟数据驻留,帮助用户保持区域合规要求。

常见问题

扩展后的 PII 去标记和实体检测语言是否支持欧盟数据驻留?

是的,AssemblyAI 的“最佳 ASR”提供中的 13 种语言将支持欧盟数据驻留,包括英语、法语、德语、意大利语和西班牙语。

PII 去标记和实体检测在各语言中的质量如何?

最高质量的 PII 去标记和实体检测见于如英语、法语、德语、意大利语和西班牙语等语言,其精确度、准确率和召回率高达 99% 以上。

使用 AssemblyAI 的 PII 去标记和实体检测时,我的数据有多安全?

AssemblyAI 优先考虑数据安全,提供企业级别的传输和静态加密。用户可以随时请求删除他们的数据,这些请求会被及时处理。

Image source: Shutterstock