five

Rud/multi_lexsum_et_validation

收藏
Hugging Face2024-04-07 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Rud/multi_lexsum_et_validation
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: id dtype: string - name: sources sequence: string - name: sources_metadata sequence: - name: doc_id dtype: string - name: doc_type dtype: string - name: doc_title dtype: string - name: parser dtype: string - name: is_ocr dtype: bool - name: url dtype: string - name: summary/long dtype: string - name: summary/short dtype: string - name: summary/tiny dtype: string - name: case_metadata struct: - name: case_name dtype: string - name: case_type dtype: string - name: filing_date dtype: string - name: filing_year dtype: string - name: case_ongoing dtype: string - name: case_ongoing_record_time dtype: string - name: closing_year dtype: string - name: order_start_year dtype: string - name: order_end_year dtype: string - name: defendant_payment dtype: string - name: class_action_sought dtype: string - name: class_action_granted dtype: string - name: attorney_orgs list: string - name: prevailing_party dtype: string - name: plaintiff_types list: string - name: plaintiff_description dtype: string - name: constitutional_clauses list: string - name: causes_of_action list: string - name: summary_authors list: string - name: case_url dtype: string - name: document dtype: string - name: et_summary dtype: string splits: - name: validation num_bytes: 227955865 num_examples: 454 download_size: 103412737 dataset_size: 227955865 configs: - config_name: default data_files: - split: validation path: data/validation-* ---
提供机构:
Rud
原始信息汇总

数据集概述

数据集特征

  • id:字符串类型
  • sources:字符串序列类型
  • sources_metadata:结构化序列,包含以下字段:
    • doc_id:字符串类型
    • doc_type:字符串类型
    • doc_title:字符串类型
    • parser:字符串类型
    • is_ocr:布尔类型
    • url:字符串类型
  • summary/long:字符串类型
  • summary/short:字符串类型
  • summary/tiny:字符串类型
  • case_metadata:结构化类型,包含以下字段:
    • case_name:字符串类型
    • case_type:字符串类型
    • filing_date:字符串类型
    • filing_year:字符串类型
    • case_ongoing:字符串类型
    • case_ongoing_record_time:字符串类型
    • closing_year:字符串类型
    • order_start_year:字符串类型
    • order_end_year:字符串类型
    • defendant_payment:字符串类型
    • class_action_sought:字符串类型
    • class_action_granted:字符串类型
    • attorney_orgs:字符串列表类型
    • prevailing_party:字符串类型
    • plaintiff_types:字符串列表类型
    • plaintiff_description:字符串类型
    • constitutional_clauses:字符串列表类型
    • causes_of_action:字符串列表类型
    • summary_authors:字符串列表类型
    • case_url:字符串类型
  • document:字符串类型
  • et_summary:字符串类型

数据集分割

  • validation
    • 字节数:227955865
    • 示例数:454

数据集大小

  • 下载大小:103412737字节
  • 数据集大小:227955865字节

配置

  • default
    • 数据文件路径:data/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作