【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72
BAAI-CCI 2.0
收藏智源2024-04-19 更新2024-04-12 收录
下载链接:
https://data.baai.ac.cn/details/BAAI-CCI2
下载链接
链接失效反馈官方服务:
资源简介:
进一步扩充数据来源,并迭代了数据处理规则,构建了CCI2.0 - 一个规模为500GB的高质量中文互联网语料库
By further expanding data sources and iterating data processing rules, we constructed CCI2.0, a high-quality Chinese internet corpus with a total size of 500 GB.
提供机构:
智源研究院
创建时间:
2024-04-19
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



