five

Kars/wikipedia

收藏
Hugging Face2025-04-07 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/Kars/wikipedia
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置文件:20231101.en和20231101.hi,每个文件都包含id、url、title、text和article_length五个字段。数据集仅包含训练集分割,20231101.en的训练集有6407814个示例,而20231101.hi的训练集有163093个示例。具体的数据集内容描述未在README中提供。

The dataset consists of two configuration files: 20231101.en and 20231101.hi, each containing five fields: id, url, title, text, and article_length. The dataset only includes a training split, with 20231101.en training set having 6407814 examples, and 20231101.hi training set having 163093 examples. Specific dataset content description is not provided in the README.
提供机构:
Kars
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作