Search results for
nemotron-cc
NVIDIA 推出 Nemotron-CC:用于 LLM 预训练的大规模数据集
NVIDIA 亮相 Nemotron-CC,这是一个包含 6.3 万亿标记的英语数据集,通过创新的数据整理方法提升大型语言模型的预训练。
NVIDIA 发布 Nemotron-CC:用于增强大型语言模型训练的万亿标记数据集
NVIDIA 推出 Nemotron-CC,一个集成了 NeMo Curator 的万亿标记数据集,专为大型语言模型设计。这一创新流程优化了数据质量和数量,以实现卓越的 AI 模型训练。