five

mlburnham/bill_summary_entailment

收藏
Hugging Face2024-07-20 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/mlburnham/bill_summary_entailment
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为bill_summary_entailment,包含训练集和测试集,主要用于处理与法案摘要相关的文本数据。数据集的特征包括法案ID(b_id)、标题(title)、前提(premise)、政策领域(policy_area)、假设(hypothesis)、蕴含关系(entailment)、已验证的标签(validated_label)和验证来源(validation_source)。训练集包含13,756个示例,测试集包含4,586个示例。

The dataset named bill_summary_entailment includes training and test sets, primarily used for handling text data related to bill summaries. The features of the dataset include bill ID (b_id), title, premise, policy area, hypothesis, entailment, validated label, and validation source. The training set contains 13,756 examples, and the test set contains 4,586 examples.
提供机构:
mlburnham
原始信息汇总

数据集卡片:bill_summary_entailment

数据集配置

  • 配置名称: default
    • 数据文件:
      • 训练集: data/train-*
      • 测试集: data/test-*

数据集信息

  • 特征:

    • b_id: 字符串
    • title: 字符串
    • premise: 字符串
    • policy_area: 字符串
    • hypothesis: 字符串
    • entailment: 整数 (int64)
    • validated_label: 整数 (int64)
    • validation_source: 字符串
  • 数据分割:

    • 训练集:
      • 字节数: 10654598
      • 样本数: 13756
    • 测试集:
      • 字节数: 3571705
      • 样本数: 4586
  • 下载大小: 6710909 字节

  • 数据集大小: 14226303 字节

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作