JuliaVin/100chunk_dataset
收藏Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/JuliaVin/100chunk_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:id(字符串类型)、abstract(字符串类型)和embedding(浮点数序列类型)。数据集分为一个训练集(train),包含259个样本,总大小为1167415字节。下载大小为1045016字节。数据集的配置名为default,数据文件路径为data/train-*。
The dataset contains three main features: id (string type), abstract (string type), and embedding (sequence of float64). The dataset is divided into one training set (train) with 259 samples, totaling 1167415 bytes. The download size is 1045016 bytes. The dataset configuration is named default, and the data file path is data/train-*.
提供机构:
JuliaVin
原始信息汇总
数据集概述
数据集信息
-
特征:
- id: 数据类型为字符串。
- abstract: 数据类型为字符串。
- embedding: 数据类型为浮点数序列。
-
分割:
- train:
- 字节数: 1167415
- 样本数: 259
- train:
-
下载大小: 1045016 字节
-
数据集大小: 1167415 字节
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



