登录后查看消息通知
搜索
常见问题
消息
登录
BAAI-CCI 2.0|中文语料库数据集|预训练数据集数据集
收藏
智源
2024-04-19 更新
2024-04-12 收录
中文语料库
预训练数据集
下载链接:
https://data.baai.ac.cn/details/BAAI-CCI2
下载链接
链接失效反馈
资源简介:
进一步扩充数据来源,并迭代了数据处理规则,构建了CCI2.0 - 一个规模为500GB的高质量中文互联网语料库
应用场景:
提供机构:
智源研究院
创建时间:
2024-04-19
AI搜集汇总
数据集介绍
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
5,000+
优质数据集
54 个
任务类型
进入经典数据集
© 2023-2025 上海数据发展科技有限责任公司 版权所有
沪ICP备17003045号-15
热门搜索
社区交流群
面向社区/商业的数据集话题
科研交流群
面向高校/科研机构的开源数据集话题
数据驱动未来
携手共赢发展
商业合作