NVIDIA通过CUDA-X加速增强Polars数据处理 - Blockchain.News

NVIDIA通过CUDA-X加速增强Polars数据处理

realtime news Oct 08, 2024 03:12

NVIDIA将CUDA-X与Polars集成,大幅提升数据处理速度。此次更新可将性能提高至13倍,增强数据科学家和工程师的效率。

NVIDIA通过CUDA-X加速增强Polars数据处理

NVIDIA宣布其CUDA-X平台与Polars数据处理库的整合,标志着数据分析能力的重大提升。据NVIDIA技术博客报道,此次合作将为数据科学家和工程师提供显著的性能提升。

Polars的日益普及

Polars是一个快速增长的DataFrame库,其月下载量最近已超过900万次。Polars以其在单机上处理数据集的效率而闻名,避免了分布式计算系统的复杂性,是许多企业应对复杂数据问题的理想选择。

与NVIDIA的CUDA-X集成预计将加速查询执行,使Polars的速度提高至传统CPU处理的13倍。这一进展对于需要处理如信用卡交易中时间窗图案检测或管理全球库存变化等任务的企业特别有益。

借助RAPIDS cuDF的技术进步

由RAPIDS cuDF驱动的新Polars GPU引擎现已进入公开测试阶段。此开发允许Polars社区在无需更改代码的情况下利用加速计算。Polars的作者兼CEO Ritchie Vink强调,与NVIDIA的合作是利用NVIDIA RAPIDS和GPU技术提升性能的独特机会。

RAPIDS是NVIDIA CUDA-X的一部分,包含一系列GPU加速的库,旨在优化数据科学和分析管道。RAPIDS cuDF的加入使得数据的加载、连接、聚合、过滤和操作更加高效。

可扩展的数据处理解决方案

对于数据科学和工程团队来说,选择合适的软件和基础设施对于保持高效运作至关重要。具有增强GPU支持的Polars为适合单机(如工作站和笔记本电脑)的工作负载提供了简化的解决方案。这一设置减少了开发的复杂性和基础设施成本,提高了生产力,并允许更多的探索性分析。

对于超出单机容量的大规模数据处理,组织常常转向如Apache Spark的框架。然而,CUDA-X平台旨在解决与大规模工作负载相关的成本和能效挑战,同时显著提升单机任务的性能。

NVIDIA的加速数据处理能力承诺带来显著的收益,基准测试显示,GPU系统上Polars和其他库如pandas的性能比CPU快多达50倍。

未来展望

随着全球数据的不断增长,对加速计算解决方案的需求至关重要。NVIDIA将CUDA-X与Polars的整合是在工作站或数据中心高效实施数据处理的进步。此次增强不仅提高了生产力,还大幅降低了成本,使其成为数据驱动企业具有吸引力的选择。

Image source: Shutterstock