NVIDIA发布RTX AI PC的新语言模型

realtime news Dec 18, 2024 02:51 UTC 18:51

1 Min Read

据NVIDIA透露，NVIDIA宣布了一系列旨在增强数字人能力的小型语言模型（SLMs）。这些模型是NVIDIA ACE的一部分，这是一套设计用于赋予代理、助手和虚拟形象生命的技术，利用RTX AI PC的强大功能。

引入多模态能力

新模型包括NVIDIA Nemovision-4B-Instruct，这是一种多模态SLM，允许数字人解释视觉图像并提供上下文相关的响应。通过最新的NVIDIA VILA和NeMo框架构建，这些模型在多个NVIDIA RTX GPU上进行了性能优化，保持了开发人员所需的高精度水平。

大上下文语言模型

NVIDIA的新大上下文SLMs旨在处理庞大的数据输入，促进复杂提示的理解。Mistral-NeMo-Minitron-128k-Instruct系列，提供8B、4B和2B参数版本，在NVIDIA RTX AI PC上平衡速度、内存使用和精度。这些模型可以在单次处理过程中处理大量数据，减少数据分割的需要，从而提高精度。

Audio2Face-3D NIM的增强

NVIDIA还更新了其Audio2Face-3D NIM微服务，以提高面部动画的真实性，这对于真实的数字人交互至关重要。该微服务现在支持实时的唇同步和面部动画，通过单个可下载的优化容器增强了自定义选项。

简化RTX AI PC上的部署

在RTX AI PC上部署数字人需要高效协调动画、智能和语音AI模型。NVIDIA正在引入新的SDK插件和示例，以简化设备上的工作流程，包括NVIDIA Riva自动语音识别和由Audio2Face-3D驱动的Unreal Engine 5示例应用程序。这些工具是NVIDIA In-Game Inference SDK的一部分，目前可用于测试版，通过管理模型和依赖资源下载并启用混合AI操作来简化AI集成。

对这些改进感兴趣的开发人员可以通过NVIDIA Developer平台获取这些工具。

News ▸

NVIDIA发布RTX AI PC的新语言模型

引入多模态能力

大上下文语言模型

Audio2Face-3D NIM的增强

简化RTX AI PC上的部署

Read More

NVIDIA Unveils New Language Models for RTX AI PCs

Enhancing Code Review with Fine-Tuned Small Language Models

Bitcoin (BTC) Surpasses $100,000 Amid Market Optimism for 2025

NVIDIA Enhances Llama 3.3 70B Model Performance with TensorRT-LLM

NVIDIA Unveils NeMo Retriever for Multilingual AI Advancements