Cheremy/alibaba_scidocs_chunked
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Cheremy/alibaba_scidocs_chunked
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含25314个训练示例,总大小为727321848字节。每个示例包含三个特征:id(字符串类型)、text(浮点数序列)和__index_level_0__(整数类型)。数据集的下载大小为174854074字节。
The dataset contains 25,314 training examples with a total size of 727,321,848 bytes. Each example includes three features: id (string type), text (sequence of float64), and __index_level_0__ (int64 type). The download size of the dataset is 174,854,074 bytes.
提供机构:
Cheremy
原始信息汇总
数据集概述
数据集信息
- 特征:
- id: 数据类型为
string。 - text: 包含一个序列,序列类型为
float64。 - index_level_0: 数据类型为
int64。
- id: 数据类型为
数据分割
- 训练集 (train):
- 样本数量: 25314
- 字节数: 727321848
数据集大小
- 下载大小: 174854074 字节
- 总大小: 727321848 字节
配置
- 默认配置 (default):
- 数据文件路径:
data/train-*
- 数据文件路径:



