five

booydar/prolong-64k-hf

收藏
Hugging Face2024-11-29 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/booydar/prolong-64k-hf
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个与datasets.load_dataset()兼容的版本,原始数据集来自https://huggingface.co/datasets/princeton-nlp/prolong-data-64K。数据集包含420,000个训练样本,大小为110,491,186,099字节,下载大小为53,073,050,463字节。数据集的特征包括domain(字符串类型)、indices(int64序列)、input_ids(int32序列)和length(int64类型)。

This dataset is a datasets.load_dataset() - compatible version of https://huggingface.co/datasets/princeton-nlp/prolong-data-64K. It contains 420,000 training examples, with a dataset size of 110,491,186,099 bytes and a download size of 53,073,050,463 bytes. The features include domain (string), indices (sequence of int64), input_ids (sequence of int32), and length (int64).
提供机构:
booydar
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作