five

dvilasuero/fineweb-c-prelim

收藏
Hugging Face2024-12-16 更新2024-12-21 收录
下载链接:
https://hf-mirror.com/datasets/dvilasuero/fineweb-c-prelim
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,包括唯一标识符(id)、状态(status)、服务器ID(_server_id)、文本内容(text)、教育价值相关的响应(educational_value.responses)、响应的用户(educational_value.responses.users)、响应的状态(educational_value.responses.status)、数据集来源(dataset)以及一个索引级别(__index_level_0__)。数据集主要用于训练,包含154,285个样本,总大小为724,806,092字节,下载大小为365,654,859字节。

This dataset includes multiple features such as unique identifier (id), status, server ID (_server_id), text content (text), educational value-related responses (educational_value.responses), users of the responses (educational_value.responses.users), status of the responses (educational_value.responses.status), dataset source (dataset), and an index level (__index_level_0__). The dataset is primarily used for training, containing 154,285 samples with a total size of 724,806,092 bytes and a download size of 365,654,859 bytes.
提供机构:
dvilasuero
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作