NVIDIA 推出先进视频分析的 AI 蓝图
realtime news May 19, 2025 05:58
NVIDIA 介绍了一种全面的 AI 蓝图,用于视频搜索和总结,增强了视频分析功能,新增了音频转录和多路实时流处理等功能。

NVIDIA 宣布其视频搜索和总结的 AI 蓝图正式上线,这是一个旨在增强视频分析的全面工具。据NVIDIA介绍,该蓝图集成了视觉语言模型 (VLMs)、大型语言模型 (LLMs) 和检索增强生成 (RAG),提供了一个强大的视频分析框架。
视频分析的增强功能
NVIDIA AI 蓝图引入了多个增强功能,旨在提高视频分析的效率和准确性。这些功能包括同时处理多个实时流和预录视频文件的能力、新的视频摄取突发模式和可定制的计算机视觉处理管道。此外,蓝图现在支持音频转录,允许对视频内容进行多模态理解。
发布的关键特性
此次发布提供了单 GPU 部署选项,支持 NVIDIA A100、H100 和 H200 GPUs,适合于较小的工作负载。多路实时流功能允许同时处理数百个流,而音频转录功能将语音转化为文本,提高了对教学视频和会议信息的分析。
先进的计算机视觉能力
将计算机视觉模型与 VLMs 集成,蓝图提供了关于视频中对象的详细元数据,包括位置和跟踪 ID。这实现了有效的视觉锚定,允许 AI 代理基于个别对象生成响应,这对复杂查询特别有用。
优化的性能和部署
AI 蓝图针对 NVIDIA GPUs 进行了优化,在视频总结任务中实现了显著的速度提升。它提供了多种部署选项,包括 NVIDIA API Catalog、NVIDIA Launchables、Docker 和云端部署,确保根据用户需求灵活定制。工具包支持 AWS,并计划扩展到 Azure 和 GCP。
NVIDIA 的蓝图旨在简化视频分析 AI 代理的开发,提供长期视频理解的综合解决方案。凭借这些进步,NVIDIA 继续推动 AI 驱动的视频分析的界限,为智慧空间到仓库自动化等行业提供强大的工具。
Image source: Shutterstock