southeyc/legal_case_summary-500
收藏Hugging Face2023-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/southeyc/legal_case_summary-500
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
struct:
- name: citation
sequence: int64
- name: full_text
sequence: string
- name: juris
sequence: string
- name: summary
sequence: string
- name: year
sequence: int64
splits:
- name: train
num_bytes: 677775520.0
num_examples: 80
- name: test
num_bytes: 169443880.0
num_examples: 20
- name: train_ift
num_bytes: 677775520.0
num_examples: 80
- name: test_ift
num_bytes: 169443880.0
num_examples: 20
download_size: 845611594
dataset_size: 1694438800.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: train_ift
path: data/train_ift-*
- split: test_ift
path: data/test_ift-*
---
数据集信息:
特征(features):
- 名称:text
结构:
- 名称:引用标识(citation),类型为64位整数序列
- 名称:完整文本(full_text),类型为字符串序列
- 名称:法域(juris),类型为字符串序列
- 名称:摘要(summary),类型为字符串序列
- 名称:年份(year),类型为64位整数序列
数据划分(splits):
- 名称:训练集(train),字节占用:677775520.0,样本数量:80
- 名称:测试集(test),字节占用:169443880.0,样本数量:20
- 名称:train_ift,字节占用:677775520.0,样本数量:80
- 名称:test_ift,字节占用:169443880.0,样本数量:20
下载大小:845611594
总数据集大小:1694438800.0
配置项(configs):
- 配置名称:默认配置(default)
数据文件:
- 划分:训练集(train),路径:data/train-*
- 划分:测试集(test),路径:data/test-*
- 划分:train_ift,路径:data/train_ift-*
- 划分:test_ift,路径:data/test_ift-*
提供机构:
southeyc
原始信息汇总
数据集概述
数据集特征
- 名称: text
- 结构:
- citation: 序列类型为 int64
- full_text: 序列类型为 string
- juris: 序列类型为 string
- summary: 序列类型为 string
- year: 序列类型为 int64
数据集分割
- train:
- 字节数: 677775520.0
- 样本数: 80
- test:
- 字节数: 169443880.0
- 样本数: 20
- train_ift:
- 字节数: 677775520.0
- 样本数: 80
- test_ift:
- 字节数: 169443880.0
- 样本数: 20
数据集大小
- 下载大小: 845611594
- 数据集大小: 1694438800.0
配置
- 配置名称: default
- 数据文件:
- train: data/train-*
- test: data/test-*
- train_ift: data/train_ift-*
- test_ift: data/test_ift-*



