mlburnham/bill_summary_entailment
收藏Hugging Face2024-07-20 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/mlburnham/bill_summary_entailment
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为bill_summary_entailment,包含训练集和测试集,主要用于处理与法案摘要相关的文本数据。数据集的特征包括法案ID(b_id)、标题(title)、前提(premise)、政策领域(policy_area)、假设(hypothesis)、蕴含关系(entailment)、已验证的标签(validated_label)和验证来源(validation_source)。训练集包含13,756个示例,测试集包含4,586个示例。
The dataset named bill_summary_entailment includes training and test sets, primarily used for handling text data related to bill summaries. The features of the dataset include bill ID (b_id), title, premise, policy area, hypothesis, entailment, validated label, and validation source. The training set contains 13,756 examples, and the test set contains 4,586 examples.
提供机构:
mlburnham
原始信息汇总
数据集卡片:bill_summary_entailment
数据集配置
- 配置名称: default
- 数据文件:
- 训练集: data/train-*
- 测试集: data/test-*
- 数据文件:
数据集信息
-
特征:
- b_id: 字符串
- title: 字符串
- premise: 字符串
- policy_area: 字符串
- hypothesis: 字符串
- entailment: 整数 (int64)
- validated_label: 整数 (int64)
- validation_source: 字符串
-
数据分割:
- 训练集:
- 字节数: 10654598
- 样本数: 13756
- 测试集:
- 字节数: 3571705
- 样本数: 4586
- 训练集:
-
下载大小: 6710909 字节
-
数据集大小: 14226303 字节



