根据 NVIDIA 博客,NVIDIA 推出了 Edify,这是一个尖端的 AI 架构,旨在帮助开发者使用自己的授权数据构建定制模型。这一创新旨在通过提供工具,为创意社区在各种媒体类型中生成高质量内容的能力,从图像、视频到 3D 资产。
NVIDIA Edify 的关键特性
Edify 以其多模态能力脱颖而出,可以从简单的文本提示生成各种内容。系统可以创建图像、视频、3D 模型、360 度高动态范围成像(HDRi)和基于物理的渲染(PBR)材料。其最显著的特性之一是训练效率,能够以更少的图像生成高质量内容。
此外,Edify 可以微调模型以匹配特定风格或学习特定角色和物体。这种灵活性使其成为从艺术创作到商业项目的广泛应用的强大工具。
应用和用例
Edify 的一个典型应用是其与 Getty Images 的生成式 AI 服务的集成。通过利用 NVIDIA AI Foundry,Getty Images 使用其授权内容训练 Edify,确保不包含任何受版权保护的角色或产品。该服务允许用户生成和修改图像,同时保持商业安全。数据集的贡献者也从新的收入来源中受益,因为他们获得了一部分利润。
Edify 的功能不仅限于图像生成。它还可以创建具有干净拓扑的艺术家就绪的 3D 网格和高达 4K PBR 材料。这些网格非常适合用于原型场景、生成背景对象或作为 3D 雕刻的起点。系统的快速预览模式可以在短至 10 秒内生成结果,然后可以进一步细化为完整的 3D 模型。
图像编辑的高级功能
Edify Image 提供了图像编辑的高级功能,例如 InPaint,允许用户在图像中添加或修改内容。Replace 功能是 InPaint 的更严格版本,可以更改如衣服等细节。OutPaint 可以扩展图像以匹配不同的宽高比,而 Segment 功能通过文本提示简化对象蒙版。
系统还支持高级提示遵循和相机控件,使用户能够指定焦距或景深。像 Sketch 和 Depth 这样的 ControlNets 引导生成过程,允许高度可控和可定制的输出。
360 度 HDRi 和多模态能力
Edify 360 HDRi 生成可用于场景照明、反射和背景的自然景观环境图。该模型可以从文本或图像提示创建高达 16K 的 HDRi 图像,节省用户数小时寻找合适背板的时间。
Edify 的一大特点是其多模态能力,能够结合不同的资产类型进行高级工作流程。例如,用户可以通过一个简单的文本提示在几分钟内原型出一个完整的场景,如 NVIDIA 在研究 SIGGRAPH 演示中展示的那样。通过在 3D 中生成场景,艺术家可以构图他们想要的镜头,然后使用 Edify Image 将原型转变为写实图像。
Getty Images 的生成式 AI
作为创意视觉的领先提供商,Getty Images 利用 NVIDIA AI Foundry 训练其生成式 AI 服务的 Edify Image 模型。通过面向企业的 Getty Images 生成式 AI 和面向小型企业的 iStock 生成式 AI 服务,用户可以使用 Edify 驱动的模型生成和修改图像。
Edify Image 的最新更新改进了生成速度和提示遵循,加入了新的相机控件。用户现在可以编辑和修改 iStock 的视觉资料库,以快速迭代和完善内容。这些功能很快也将在 Getty Images 的平台上提供。
欲了解更多信息,请访问 NVIDIA 博客。
Image source: Shutterstock