librarian-bots/dataset-abstracts
收藏Hugging Face2023-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/librarian-bots/dataset-abstracts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个配置:abstracts和default,每个配置都有训练集和测试集。数据集的特征包括文本、输入结构(如摘要、标题、URL等)、预测、注释、标签等。数据集的规模较小,训练集和测试集的样本数量分别为21和15。
This dataset contains two configurations: abstracts and default, each with a training set and a test set. The features of the dataset include text, input structures (such as abstracts, titles, URLs, etc.), predictions, annotations, labels, etc. The dataset is relatively small in scale, with 21 and 15 samples in the training set and test set respectively.
提供机构:
librarian-bots
原始信息汇总
数据集概述
语言
- 英语(en)
数据集大小分类
- n<1K
配置
-
abstracts
- 数据文件路径:
- 训练集:
abstracts/train-* - 测试集:
abstracts/test-*
- 训练集:
- 特征:
text: 字符串inputs: 结构体abstract: 字符串title: 字符串url: 字符串
prediction: 空prediction_agent: 空annotation: 字符串annotation_agent: 字符串vectors: 空multi_label: 布尔值explanation: 空id: 字符串metadata: 空status: 字符串metrics: 结构体text_length: 整数(int64)
label: 类别标签0: new_dataset1: no_new_dataset
- 分割:
- 训练集:
- 字节数:56302.166666666664
- 样本数:21
- 测试集:
- 字节数:40215.833333333336
- 样本数:15
- 训练集:
- 下载大小:102778
- 数据集大小:96518.0
- 数据文件路径:
-
default
- 数据文件路径:
- 训练集:
data/train-* - 测试集:
data/test-*
- 训练集:
- 特征:
text: 字符串inputs: 结构体abstract: 字符串title: 字符串url: 字符串
prediction: 空prediction_agent: 空annotation: 字符串annotation_agent: 字符串vectors: 空multi_label: 布尔值explanation: 空id: 字符串metadata: 空status: 字符串event_timestamp: 时间戳(timestamp[us])metrics: 结构体text_length: 整数(int64)
label: 类别标签0: new_dataset1: no_new_dataset
- 分割:
- 训练集:
- 字节数:56470.166666666664
- 样本数:21
- 测试集:
- 字节数:40335.833333333336
- 样本数:15
- 训练集:
- 下载大小:104180
- 数据集大小:96806
- 数据文件路径:



