gpu
NVIDIA CUDA Toolkit 12.4 加强运行时 Fatbin 的创建
NVIDIA CUDA Toolkit 12.4 引入了 nvFatbin 库,简化了运行时 fatbin 的创建并增强了 GPU 代码的兼容性。
简化AI开发:Brev.dev与NVIDIA NGC目录集成,实现一键GPU部署
Brev.dev和NVIDIA NGC目录通过一键部署GPU优化软件,简化了AI开发流程,提高了效率并减少了设置时间。
NVIDIA H100 GPUs 和 TensorRT-LLM 实现 Mixtral 8x7B 的突破性性能
NVIDIA 的 H100 Tensor Core GPU 和 TensorRT-LLM 软件展示了 Mixtral 8x7B 模型在 FP8 精度下的破纪录性能。
NVIDIA 发布 NVDashboard v0.10,增强 GPU 监控功能
NVIDIA 的 NVDashboard v0.10 引入了 WebSocket 数据流、改进的可用性和主题支持,加强了 JupyterLab 中的实时 GPU 监控。
OKX Ventures 支持 Compute Labs 的代币化 GPU 市场计划
OKX Ventures 已投资 Compute Labs,以推进代币化 GPU 市场,通过区块链技术提升计算收入的可及性。
Modelserve: Golem Network的新AI推理服务
Golem Network 推出了 Modelserve,这是一项为开发者和初创公司设计的具有可扩展性和成本效益的AI模型推理服务。
NVIDIA 全面采用开源 GPU 内核模块,将在即将发布的 R560 驱动程序中推出
NVIDIA 随着 R560 驱动程序的发布,过渡到开源 GPU 内核模块,增强了对现代 GPU 的性能和支持。
Golem Network 推出 Golem-Workers API 提升计算灵活性
Golem Network 推出了 Golem-Workers API,提供对 GPU 和 CPU 资源的高级访问,满足 AI 模型部署以外的多种计算需求。
Golem Network 推出更新版 AI/GPU 路线图
Golem Network 宣布了一份更新版的 AI/GPU 路线图,重点关注经过市场验证的项目,增强 AI 行业所需的 GPU 资源供应。
Together AI通过Kernel Collection提升NVIDIA H200和H100 GPU集群性能
Together AI通过其Together Kernel Collection增强了NVIDIA H200和H100 GPU集群,为AI训练和推理提供了显著的性能提升。
NVIDIA 推出具有增强 GPU 通信功能的 NVSHMEM 3.0
NVIDIA 的 NVSHMEM 3.0 提供多节点支持、ABI 向后兼容性和 CPU 辅助的 InfiniBand GPU Direct Async,增强了 GPU 通信。
AMD发布ROCm 6.2.3,提升Radeon GPU的AI性能
AMD发布ROCm 6.2.3,增强了Radeon GPU在Llama 3、Stable Diffusion和Triton框架的支持,提升AI开发效率。
Render Network 为 Cinema 4D 增强支持 Redshift 提供卓越的 GPU 渲染
Render Network 向 Cinema 4D Wizard 引入 Redshift 支持,为艺术家提供增强的 GPU 渲染功能。探索最新功能和集成细节。
Llama 3.1 405B 利用 NVIDIA H200 GPU 和 NVLink 实现 1.5 倍吞吐量提升
NVIDIA 最新的并行技术进步,通过使用 NVIDIA H200 Tensor Core GPU 和 NVLink Switch,将 Llama 3.1 405B 的吞吐量提升了 1.5 倍,提高了 AI 推理性能。
NVIDIA 的 cuGraph 利用 GPU 加速增强 NetworkX
NVIDIA 推出使用 cuGraph 为 NetworkX 提供 GPU 加速,在无需更改代码的情况下显著提高图分析的速度,适合大规模数据处理。
Blender Cycles 加入 Render Network 的分布式渲染封闭测试版
Blender Cycles 已被集成到 Render Network 的封闭测试版中,为数百万艺术家提供分布式 GPU 渲染服务。这标志着 Render 在扩展多渲染功能方面迈出了重要一步。
NVIDIA RAPIDS 24.10 提升了 NetworkX 和 Polars 的 GPU 加速能力
NVIDIA RAPIDS 24.10 引入了 GPU 加速的 NetworkX 和 Polars,无需更改代码,从而增强了与 Python 3.12 和 NumPy 2.x 的兼容性,以改善数据处理。
NVIDIA 的 cuPyNumeric 提升科学研究的 GPU 加速能力
NVIDIA 发布了 cuPyNumeric,这是一款利用 GPU 加速数据分析的库,帮助科学家高效处理海量数据集,并轻松扩展计算规模。
利用 RAPIDS cuML 在 GPU 上增强 UMAP 性能
RAPIDS cuML 通过使用 GPU 加速引入了更快、更具可扩展性的 UMAP 实现,解决了大型数据集处理中面临的挑战,并通过新算法提升了性能。
Manta Network与Aethir合作,提供高性能GPU访问,增强生态系统
Manta Network与Aethir合作,为应用程序提供高性能GPU访问,提升生态系统的可扩展性和成本效益,特别有利于AI和游戏行业。
NVIDIA 和 Windows 365:通过 GPU 加速增强 AI 工作负载
NVIDIA 和 Windows 365 合作,通过 GPU 加速来增强 AI 工作负载,为各个行业的 AI 驱动应用程序带来了显著的性能提升。
提升NVIDIA Nsight Graphics 2024.3的GPU工作负载
NVIDIA Nsight Graphics 2024.3引入了新的功能,专注于着色器性能优化和减少图形应用中的线程发散,以优化GPU工作负载。
NVIDIA 的 RAPIDS cuDF 通过统一虚拟内存增强 pandas
NVIDIA 的 RAPIDS cuDF 利用统一虚拟内存,将 pandas 的性能提升 50 倍,实现与现有工作流程的无缝集成和 GPU 加速。
Warp 1.5.0 推出基于Tile的编程以增强GPU效率
Warp 1.5.0 在Python中引入基于Tile的编程,利用cuBLASDx和cuFFTDx进行高效的GPU操作,大大提高了科学计算和模拟中的性能。
NVIDIA 引领 AI 中心化数据中心迎接第五次工业革命
NVIDIA 的 Wade Vinson 讨论了将数据中心转变为 AI 工厂,强调了 GPU 进步和能源效率是推动第五次工业革命的关键因素。
NVIDIA 发布支持 Blackwell GPU 的 Video Codec SDK 13.0
NVIDIA 的 Video Codec SDK 13.0 引入了重大升级,支持 Blackwell GPU,增强了现代视频应用的视频编码和解码能力。
NVIDIA和Red Hat通过签名模块增强RHEL9的GPU驱动支持
NVIDIA和Red Hat合作,通过提供签名的开放GPU内核模块,改善对Red Hat Enterprise Linux 9的GPU驱动支持,提升安全性和部署便利性。
NVIDIA的Project Aether提升Apache Spark效率
NVIDIA推出Project Aether,通过GPU加速简化Apache Spark工作负载,大幅减少企业全球范围的处理时间和成本。
NVIDIA vGPU 18.0 扩展了虚拟平台的 AI 功能
NVIDIA 的 vGPU 18.0 版本增强了虚拟平台上的 AI 功能,支持 Microsoft Windows Server 2025 和 Proxmox VE,并为开发者引入了新的 AI 工具包。
通过分块读取和UVM提升Polars GPU Parquet Reader性能
探索Polars GPU Parquet Reader如何通过分块读取和统一虚拟内存(UVM)提高性能,增强大数据集的数据处理能力。
Rivian 使用 NVIDIA RTX PRO Blackwell GPU 提升 XR 设计
Rivian 利用 NVIDIA RTX PRO Blackwell GPU 提升 XR 设计,实现逼真视觉效果和增强的 AI 交互,变革汽车设计流程。