MultiSynt/nemotron-cc-spanish-tower72b
收藏Hugging Face2025-09-12 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/MultiSynt/nemotron-cc-spanish-tower72b
下载链接
链接失效反馈官方服务:
资源简介:
Nemotron-cc的高实际子集,已使用Tower+ 72B翻译成西班牙语,适用于文本生成任务。该数据集包含1.564亿行和约1.147万亿个词。
A high actual subset of Nemotron-cc translated to Spanish using Tower+ 72B for text generation tasks. The dataset contains 156,418,250 rows and approximately 114,647,001,076 tokens.
提供机构:
MultiSynt



