gpu
NVIDIA CUDA Toolkit 12.4 加强运行时 Fatbin 的创建
NVIDIA CUDA Toolkit 12.4 引入了 nvFatbin 库,简化了运行时 fatbin 的创建并增强了 GPU 代码的兼容性。
简化AI开发:Brev.dev与NVIDIA NGC目录集成,实现一键GPU部署
Brev.dev和NVIDIA NGC目录通过一键部署GPU优化软件,简化了AI开发流程,提高了效率并减少了设置时间。
NVIDIA H100 GPUs 和 TensorRT-LLM 实现 Mixtral 8x7B 的突破性性能
NVIDIA 的 H100 Tensor Core GPU 和 TensorRT-LLM 软件展示了 Mixtral 8x7B 模型在 FP8 精度下的破纪录性能。
NVIDIA 发布 NVDashboard v0.10,增强 GPU 监控功能
NVIDIA 的 NVDashboard v0.10 引入了 WebSocket 数据流、改进的可用性和主题支持,加强了 JupyterLab 中的实时 GPU 监控。
OKX Ventures 支持 Compute Labs 的代币化 GPU 市场计划
OKX Ventures 已投资 Compute Labs,以推进代币化 GPU 市场,通过区块链技术提升计算收入的可及性。
Modelserve: Golem Network的新AI推理服务
Golem Network 推出了 Modelserve,这是一项为开发者和初创公司设计的具有可扩展性和成本效益的AI模型推理服务。
NVIDIA 全面采用开源 GPU 内核模块,将在即将发布的 R560 驱动程序中推出
NVIDIA 随着 R560 驱动程序的发布,过渡到开源 GPU 内核模块,增强了对现代 GPU 的性能和支持。
Golem Network 推出 Golem-Workers API 提升计算灵活性
Golem Network 推出了 Golem-Workers API,提供对 GPU 和 CPU 资源的高级访问,满足 AI 模型部署以外的多种计算需求。
Golem Network 推出更新版 AI/GPU 路线图
Golem Network 宣布了一份更新版的 AI/GPU 路线图,重点关注经过市场验证的项目,增强 AI 行业所需的 GPU 资源供应。
Together AI通过Kernel Collection提升NVIDIA H200和H100 GPU集群性能
Together AI通过其Together Kernel Collection增强了NVIDIA H200和H100 GPU集群,为AI训练和推理提供了显著的性能提升。
NVIDIA 推出具有增强 GPU 通信功能的 NVSHMEM 3.0
NVIDIA 的 NVSHMEM 3.0 提供多节点支持、ABI 向后兼容性和 CPU 辅助的 InfiniBand GPU Direct Async,增强了 GPU 通信。
AMD发布ROCm 6.2.3,提升Radeon GPU的AI性能
AMD发布ROCm 6.2.3,增强了Radeon GPU在Llama 3、Stable Diffusion和Triton框架的支持,提升AI开发效率。
Render Network 为 Cinema 4D 增强支持 Redshift 提供卓越的 GPU 渲染
Render Network 向 Cinema 4D Wizard 引入 Redshift 支持,为艺术家提供增强的 GPU 渲染功能。探索最新功能和集成细节。
Llama 3.1 405B 利用 NVIDIA H200 GPU 和 NVLink 实现 1.5 倍吞吐量提升
NVIDIA 最新的并行技术进步,通过使用 NVIDIA H200 Tensor Core GPU 和 NVLink Switch,将 Llama 3.1 405B 的吞吐量提升了 1.5 倍,提高了 AI 推理性能。
NVIDIA 的 cuGraph 利用 GPU 加速增强 NetworkX
NVIDIA 推出使用 cuGraph 为 NetworkX 提供 GPU 加速,在无需更改代码的情况下显著提高图分析的速度,适合大规模数据处理。
Blender Cycles 加入 Render Network 的分布式渲染封闭测试版
Blender Cycles 已被集成到 Render Network 的封闭测试版中,为数百万艺术家提供分布式 GPU 渲染服务。这标志着 Render 在扩展多渲染功能方面迈出了重要一步。
NVIDIA RAPIDS 24.10 提升了 NetworkX 和 Polars 的 GPU 加速能力
NVIDIA RAPIDS 24.10 引入了 GPU 加速的 NetworkX 和 Polars,无需更改代码,从而增强了与 Python 3.12 和 NumPy 2.x 的兼容性,以改善数据处理。
NVIDIA 的 cuPyNumeric 提升科学研究的 GPU 加速能力
NVIDIA 发布了 cuPyNumeric,这是一款利用 GPU 加速数据分析的库,帮助科学家高效处理海量数据集,并轻松扩展计算规模。
利用 RAPIDS cuML 在 GPU 上增强 UMAP 性能
RAPIDS cuML 通过使用 GPU 加速引入了更快、更具可扩展性的 UMAP 实现,解决了大型数据集处理中面临的挑战,并通过新算法提升了性能。
Manta Network与Aethir合作,提供高性能GPU访问,增强生态系统
Manta Network与Aethir合作,为应用程序提供高性能GPU访问,提升生态系统的可扩展性和成本效益,特别有利于AI和游戏行业。
NVIDIA 和 Windows 365:通过 GPU 加速增强 AI 工作负载
NVIDIA 和 Windows 365 合作,通过 GPU 加速来增强 AI 工作负载,为各个行业的 AI 驱动应用程序带来了显著的性能提升。
提升NVIDIA Nsight Graphics 2024.3的GPU工作负载
NVIDIA Nsight Graphics 2024.3引入了新的功能,专注于着色器性能优化和减少图形应用中的线程发散,以优化GPU工作负载。
NVIDIA 的 RAPIDS cuDF 通过统一虚拟内存增强 pandas
NVIDIA 的 RAPIDS cuDF 利用统一虚拟内存,将 pandas 的性能提升 50 倍,实现与现有工作流程的无缝集成和 GPU 加速。
Warp 1.5.0 推出基于Tile的编程以增强GPU效率
Warp 1.5.0 在Python中引入基于Tile的编程,利用cuBLASDx和cuFFTDx进行高效的GPU操作,大大提高了科学计算和模拟中的性能。