NVIDIA NIM 微服务颠覆 AI 模型部署

realtime news  Aug 07, 2024 01:43  UTC 17:43

1 Min Read

作为优化的容器形式交付,NVIDIA NIM 微服务旨在加速各种规模企业的 AI 应用开发,为 AI 技术的快速生产和部署铺平了道路。这套微服务可用于建立和部署涉及语音 AI、数据检索、数字生物、数字人、仿真和大型语言模型(LLM)的 AI 解决方案,依据 NVIDIA 技术博客 所述。

语音和翻译 NIM 微服务

最新的语音和翻译 NIM 微服务使组织能够将先进的多语言语音和翻译能力集成到其对话应用中。这些包括自动语音识别(ASR)、语音合成(TTS)和神经机器翻译(NMT),以满足不同行业的需求。

Parakeet ASR

Parakeet ASR-CTC-1.1B-EnUS ASR 模型,拥有 11 亿参数,提供创纪录的英语语言转录功能。它具有卓越的准确性和鲁棒性,能够巧妙应对各种语音模式和噪声水平,使企业能提升其语音服务。

FastPitch-HiFiGAN TTS

FastPitch-HiFiGAN-EN 集成了 FastPitch 和 HiFiGAN 模型,能从文本生成高保真音频,帮助企业创建自然的声音,提高用户参与度并提供沉浸式体验。

Megatron NMT

Megatron 1B-En32 是一个强大的神经机器翻译模型,在多语言间进行实时翻译,使无缝的多语言交流成为可能,帮助组织扩大其全球影响力并吸引多样化的受众。

检索 NIM 微服务

最新的 NVIDIA NeMo Retriever NIM 微服务帮助开发者高效获取最佳专有数据,以生成知识丰富的 AI 应用响应。NeMo Retriever 使组织能够无缝连接自定义模型到多样化的业务数据,并通过检索增强生成(RAG)提供高度准确的响应。

Embedding QA E5

NVIDIA NeMo Retriever QA E5 嵌入模型针对文本问答检索进行了优化。它将文本信息转化为密集的向量表示,这是文本检索系统的关键。

Embedding QA Mistral 7B

嵌入问答 Mistral 7B 是一个多语言社区基础模型,经过高精度问答竟对调优。适用于用户在大文本语料库上构建问答应用。

Snowflake Arctic Embed

Snowflake Arctic Embed 是一套高质量检索的文本嵌入模型,性能优化。该模型已准备好用于商业用途,免费提供,并在 MTEB/BEIR 排行榜上取得了最先进的性能。

Reranking QA Mistral 4B

NVIDIA NeMo Retriever QA Mistral 4B 重排序模型提供了表示文档对查询相关性的逻辑得分。通常与嵌入模型结合部署,提高文本检索系统的整体准确性。

数字生物 NIM 微服务

在医疗保健和生命科学领域,NVIDIA NIM 微服务正在改变数字生物学。这些 AI 工具使制药公司、生物技术和医疗机构加速创新,为患者带来救命药物。

MolMIM

MolMIM 是一个基于变压器的小分子生成模型,用于优化和采样分子以提高所需评分函数的值。可部署在云端或本地,用于计算药物发现工作流程。

DiffDock

NVIDIA DiffDock NIM 微服务专为高性能、可扩展的分子对接而构建。它预测的姿态数量比基准模型多 7 倍,降低了计算药物发现工作流程的成本。

LLM NIM 微服务

新的 NVIDIA NIM 微服务为 LLM 提供了前所未有的性能和准确性,适用于各种应用和语言。

Llama 3.1 8B 和 70B

Llama 3.1 8B 和 70B 模型提供了最先进的文本生成和语言理解能力,成为创建引人入胜和信息丰富内容的强大工具。在 NVIDIA H100 数据中心 GPU 上部署 Llama 3.1 8B NIM 可实现每秒多达 2.5 倝内容生成。

Llama 3.1 405B

Llama 3.1 405B 是最大公开可用的用于各种用例的模型,包括合成数据生成。Llama 3.1 405B NIM 微服务可从 NVIDIA API 目录下载并在任何地方运行。

仿真 NIM 微服务

新的 NVIDIA USD NIM 微服务提供了利用生成式 AI 副驾驶员和代理开发通用场景描述(OpenUSD)工具的能力,加速 3D 世界的创建。

USD Code

USD Code 是一款最先进的大型语言模型,能够回答 OpenUSD 知识查询并生成 USD-Python 代码。

USD Search

USD Search 使用文本或图像输入为 OpenUSD 数据、3D 模型、图像和资产提供 AI 驱动的搜索。

USD Validate

USD Validate 可即时 RTX 渲染和基于规则验证,以验证 OpenUSD 资产的兼容性。

视频会议 NIM 微服务

NVIDIA Maxine 简化了增强音频、视频和增强现实效果的 AI 功能在视频会议和远程呈现中的部署。

Maxine Audio2Face-2D

Maxine Audio2Face-2D 通过语音音频实时动画一个 2D 图像,实现自然的头部姿态动画,可与聊天机器人输出或翻译后的语音结合使用。

Eye Contact

NVIDIA Maxine Eye Contact NIM 微服务使用 AI 对用户的摄像头画面应用实时滤镜,使用户的眼神朝向摄像头,改善、增强用户体验。

加速 AI 应用开发

NVIDIA NIM 通过在各领域中实现专门微服务的集成,简化了复杂 AI 应用的创建。使用 NIM 微服务,组织可以绕过从头构建 AI 模型的复杂性,节省时间和资源。这使得可以组装适合特定业务需求的定制 AI 解决方案。

例如,公司可以将 ACE NIM 微服务(包括语音识别)与 LLM NIM 微服务结合起来,创建用于个性化客户服务的数字人,适用于医疗保健、金融和零售等行业。

NIM 微服务也可以集成到供应链管理系统中,将用于路线优化的 cuOpt NIM 微服务与用于检索增强生成的 NeMo Retriever NIM 微服务以及用于业务沟通的 LLM NIM 微服务结合起来。

开始使用

NVIDIA NIM 赋能企业充分利用 AI,加速创新,保持竞争优势,并提供卓越的客户体验。探索 NIM 微服务提供的最新 AI 模型,发现这些强大工具如何改变您的业务。



Read More