RAPIDS 推出 GPU Polars 流处理和统一的 GNN API 增强功能

realtime news   Jul 05, 2025 05:49  UTC 21:49

1 Min Read

NVIDIA 宣布了其 RAPIDS 套件的最新版本 25.06,这是一套用于 Python 数据科学的 CUDA-X 库。根据NVIDIA,本次发布引入了几项突破性功能,旨在提升计算效率和数据处理能力。

Polars GPU 引擎增强

新版本对 Polars GPU 引擎进行了重大更新,该引擎最初于 2024 年 9 月推出。其关键功能之一是实验性的流执行器,通过数据分区和并行处理实现对超过 VRAM 的数据集的执行。这一发展对于加速对超大型数据集的分析操作至关重要,范围从数百GB扩展到TB。此外,该更新引入了一种洗牌机制,以促进设备之间的数据重分布,并支持多GPU执行。

另一个增强功能包括对滚动聚合和扩展列操作能力的支持,这对于时间序列数据分析尤其有利。GPU 引擎现在还支持更广泛的日期时间列操作表达式,例如.strftime().cast_time_unit()

图神经网络 (GNNs) 统一 API

将 WholeGraph 集成到 NVIDIA 的 cuGraph-PyG 中,创造了一个统一的 API,加速了 GNNs 的特征获取。该 API 允许用户在不修改脚本的情况下,轻松从单 GPU 过渡到多 GPU 或多节点工作流。使用了 PyTorch 中熟悉的 torchrun 命令来管理进程,方便 PyTorch 用户使用。

零代码更改机器学习增强

RAPIDS 25.06 版本通过在 cuML 库中包含支持向量机 (SVM) 来扩展其机器学习的零代码更改加速。这使得现有使用 SVM 的 scikit-learn 工作流能够在无需任何代码修改的情况下受益于 GPU 加速。该更新提高了与 scikit-learn 的兼容性,增强了参数验证和错误处理。

其他平台和兼容性更新

本次发布还包含对 RAPIDS 内存管理器 (RMM) 的升级,现支持 NVIDIA Blackwell GPU 上的硬件解压缩引擎。该功能承诺在 IO 密集型工作流中实现性能改进。此外,该平台现在支持 Python 3.13,并标志着最后一版支持 CUDA 11 的发布。

总体而言,RAPIDS 25.06 版本为数据科学家和开发人员带来了显著的进步,重点提升了 GPU 加速数据处理任务的性能和易用性。



Read More



ai price analysis test 1

Jul 04, 2025    1 Min Read