gpu
NVIDIA CUDA Toolkit 12.4 加强运行时 Fatbin 的创建
NVIDIA CUDA Toolkit 12.4 引入了 nvFatbin 库,简化了运行时 fatbin 的创建并增强了 GPU 代码的兼容性。
简化AI开发:Brev.dev与NVIDIA NGC目录集成,实现一键GPU部署
Brev.dev和NVIDIA NGC目录通过一键部署GPU优化软件,简化了AI开发流程,提高了效率并减少了设置时间。
NVIDIA H100 GPUs 和 TensorRT-LLM 实现 Mixtral 8x7B 的突破性性能
NVIDIA 的 H100 Tensor Core GPU 和 TensorRT-LLM 软件展示了 Mixtral 8x7B 模型在 FP8 精度下的破纪录性能。
NVIDIA 发布 NVDashboard v0.10,增强 GPU 监控功能
NVIDIA 的 NVDashboard v0.10 引入了 WebSocket 数据流、改进的可用性和主题支持,加强了 JupyterLab 中的实时 GPU 监控。
OKX Ventures 支持 Compute Labs 的代币化 GPU 市场计划
OKX Ventures 已投资 Compute Labs,以推进代币化 GPU 市场,通过区块链技术提升计算收入的可及性。
Modelserve: Golem Network的新AI推理服务
Golem Network 推出了 Modelserve,这是一项为开发者和初创公司设计的具有可扩展性和成本效益的AI模型推理服务。
NVIDIA 全面采用开源 GPU 内核模块,将在即将发布的 R560 驱动程序中推出
NVIDIA 随着 R560 驱动程序的发布,过渡到开源 GPU 内核模块,增强了对现代 GPU 的性能和支持。
Golem Network 推出 Golem-Workers API 提升计算灵活性
Golem Network 推出了 Golem-Workers API,提供对 GPU 和 CPU 资源的高级访问,满足 AI 模型部署以外的多种计算需求。
Golem Network 推出更新版 AI/GPU 路线图
Golem Network 宣布了一份更新版的 AI/GPU 路线图,重点关注经过市场验证的项目,增强 AI 行业所需的 GPU 资源供应。
Together AI通过Kernel Collection提升NVIDIA H200和H100 GPU集群性能
Together AI通过其Together Kernel Collection增强了NVIDIA H200和H100 GPU集群,为AI训练和推理提供了显著的性能提升。
NVIDIA 推出具有增强 GPU 通信功能的 NVSHMEM 3.0
NVIDIA 的 NVSHMEM 3.0 提供多节点支持、ABI 向后兼容性和 CPU 辅助的 InfiniBand GPU Direct Async,增强了 GPU 通信。