NVIDIA推出用于AI应用的数字人界面蓝图

realtime news  Sep 26, 2024 20:59  UTC 12:59

1 Min Read

为客户提供优质服务仍然是各行业企业的首要任务,从回答问题和解决问题到在线订单的处理。根据NVIDIA技术博客,随着企业扩大运营并在全球范围内扩展业务以竞争,对无缝客户服务的需求呈指数级增长。

通过数字人界面增强客户服务

传统的客户服务方法,例如知识库文章和电话树,通常会给客户带来大量信息,导致信息保留率低下。为了解决这一问题,NVIDIA推出了其数字人NVIDIA NIM代理蓝图,结合NVIDIA NIM微服务与参考代码和文档,以提供更具吸引力和更有效的客户服务体验。

企业现在可以部署数字人界面,提供流畅的类人互动,而不仅仅依赖于基于文本的聊天机器人。这种创新方法利用生成性AI、对话AI和视觉AI等技术来提高用户参与度和满意度。

设计用于客户服务的类人聊天机器人

在开发客户服务工具时,至关重要的是考虑最终用户及其偏好的互动方式。虽然基于文本的应用程序有其优势,但是对多语言支持和精确信息检索的需求推动了数字人界面的需求。例如,企业可以使用像James这样的化身,他是对NVIDIA产品颇有了解的互动性数字人,通过检索增强生成(RAG)进行信息检索,提供可扩展且准确的客户支持。

用于客户服务的数字人NVIDIA NIM代理蓝图包括几个关键组件:

  • NVIDIA Riva ASR NIM:一个先进的Parakeet自动语音识别(ASR)模型,可以高精度地转录英语口语。
  • NVIDIA Riva TTS NIM:FastPitch,一个mel谱图生成器,与神经逆编码器结合使用以生成男性或女性的美式英语语音。
  • NVIDIA Audio2Face NIM:将3D角色的面部特征与任何音频轨道匹配,使其动画化。
  • Llama 3 8B NIM:一个先进的大型语言模型(LLM),拥有卓越的语言理解、推理和文本生成能力。

构建数字人界面

用于客户服务的数字人NIM代理蓝图由NVIDIA Tokkio提供支持,集成了基于RAG构建的现有生成性AI应用程序。这种方法通过一个3D动画数字人界面使企业应用程序变得生动,增强用户体验并提供更快的解决方案。

蓝图包括两个主要步骤:

步骤1:启动用户互动

用户的音频通过网页前端处理,传递给NVIDIA ACE代理,在互动过程中将音频转换为文本并反过来转换回音频。

步骤2:驱动类真实的数字人

代理使用音频管道来动画化化身并渲染栩栩如生的特征。用户反馈随后被纳入后端RAG应用程序,以实现持续改进。

蓝图包包括:

  • 一个可定制的数字人名为Ben
  • 示例应用程序
  • 定制文档
  • 参考代码
  • Helm图表
  • 集成指南
  • 部署说明
  • 评估指标

开始使用

要探索用于客户服务的数字人的互动演示,请访问NVIDIA ACE。有关文档、示例代码和Helm图表,请查看生成性AI示例GitHub仓库。加入NVIDIA开发者计划,在开发期间免费访问或申请90天试用期的NVIDIA AI Enterprise以获得进一步支持。



Read More