five

AlienKevin/genius-seg

收藏
Hugging Face2024-08-22 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/AlienKevin/genius-seg
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个分割:训练集、验证集和测试集。训练集包含9960000个示例,验证集和测试集各包含20000个示例。数据集的特征为tokens,其类型为字符串序列。数据集的总下载大小为1544145340字节,总数据集大小为3930062366字节。

The dataset includes three splits: train, validation, and test. The train split contains 9,960,000 examples, while both the validation and test splits contain 20,000 examples each. The feature of the dataset is tokens, which is a sequence of strings. The total download size of the dataset is 1,544,145,340 bytes, and the total dataset size is 3,930,062,366 bytes.
提供机构:
AlienKevin
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作