Search results for
nemotron-cc
NVIDIA 推出 Nemotron-CC:用于 LLM 预训练的大规模数据集
NVIDIA 亮相 Nemotron-CC,这是一个包含 6.3 万亿标记的英语数据集,通过创新的数据整理方法提升大型语言模型的预训练。