MoritzLaurer/cap_sotu_simple
收藏Hugging Face2023-06-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MoritzLaurer/cap_sotu_simple
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: labels
dtype: string
- name: label_cap2
dtype: int64
- name: label_cap2_text
dtype: string
- name: label_cap4
dtype: int64
- name: year
dtype: int64
- name: president
dtype: string
- name: pres_party
dtype: int64
- name: id_original
dtype: int64
- name: text_original
dtype: string
- name: text_preceding
dtype: string
- name: text_following
dtype: string
- name: doc_id
dtype: int64
- name: idx
dtype: int64
splits:
- name: train
num_bytes: 3700466
num_examples: 6339
download_size: 1940441
dataset_size: 3700466
---
# Dataset Card for "cap_sotu_simple"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
MoritzLaurer
原始信息汇总
数据集概述
数据集名称
- 名称: cap_sotu_simple
数据集特征
- text: 数据类型为字符串。
- labels: 数据类型为字符串。
- label_cap2: 数据类型为整数64位。
- label_cap2_text: 数据类型为字符串。
- label_cap4: 数据类型为整数64位。
- year: 数据类型为整数64位。
- president: 数据类型为字符串。
- pres_party: 数据类型为整数64位。
- id_original: 数据类型为整数64位。
- text_original: 数据类型为字符串。
- text_preceding: 数据类型为字符串。
- text_following: 数据类型为字符串。
- doc_id: 数据类型为整数64位。
- idx: 数据类型为整数64位。
数据集分割
- train:
- num_bytes: 3700466
- num_examples: 6339
数据集大小
- download_size: 1940441
- dataset_size: 3700466



