lehduong/cci40
收藏Hugging Face2025-07-23 更新2025-08-30 收录
下载链接:
https://hf-mirror.com/datasets/lehduong/cci40
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含文本数据的训练集,共有163933213个文本示例,数据集大小为328GB。数据集通过一个默认配置进行访问,配置中指定了训练数据文件的路径。
This dataset contains a training set with 163933213 text examples, with a total size of 328GB. The dataset is accessed through a default configuration, which specifies the path to the training data files.
提供机构:
lehduong



