five

cc-clean/CC-MAIN-2025-08

收藏
Hugging Face2025-08-15 更新2025-08-30 收录
下载链接:
https://hf-mirror.com/datasets/cc-clean/CC-MAIN-2025-08
下载链接
链接失效反馈
官方服务:
资源简介:
CC-MAIN-2025-08数据集是从CommonCrawler中抽取的只包含日语数据的数据集。它用于研究目的,并通过cc-downloader-rs工具获取。数据集的构建得益于IPA的ICSCoE提供的资源。

The CC-MAIN-2025-08 dataset is extracted from CommonCrawler and contains only Japanese language data. It is intended for research purposes and was obtained using the cc-downloader-rs tool. The construction of the dataset benefits from the resources provided by IPAs ICSCoE.
提供机构:
cc-clean
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作