kdercksen/substanreview
收藏Hugging Face2024-02-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kdercksen/substanreview
下载链接
链接失效反馈官方服务:
资源简介:
这是一个重新格式化(分割spans和labels)的SubstanReview数据集版本,原始数据集可以在https://github.com/YanzhuGuo/SubstanReview找到。数据集包含id、review、spans和labels四个特征,分为训练集和测试集,分别包含440和110个样本。
提供机构:
kdercksen
原始信息汇总
数据集概述
特征信息
- id: 数据类型为
int64 - review: 数据类型为
string - spans: 数据类型为
int64的序列 - labels: 数据类型为
string的序列
数据分割
- train: 包含 440 个样本,总字节数为 1264992
- test: 包含 110 个样本,总字节数为 299386
数据大小
- 下载大小: 840892 字节
- 数据集大小: 1564378 字节
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



