mholi/nl_speech_dataset
收藏Hugging Face2023-04-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mholi/nl_speech_dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: 'Unnamed: 0'
dtype: int64
- name: id
dtype: string
- name: year
dtype: int64
- name: month
dtype: int64
- name: rdf:type
dtype: string
- name: skos:prefLabel
dtype: string
- name: semparls:endDate
dtype: string
- name: semparls:speaker
dtype: string
- name: semparls:party
dtype: string
- name: semparls:content
dtype: string
- name: parlsampos:facet_gender
dtype: string
- name: parlsampos:facet_annif_subject
dtype: string
- name: parlsampos:facet_referenced_person
dtype: string
- name: semparls:isInterruptedBy
dtype: string
splits:
- name: train
num_bytes: 135170320.44183758
num_examples: 19763
- name: validation
num_bytes: 15019684.44518926
num_examples: 2196
- name: test
num_bytes: 37549211.11297315
num_examples: 5490
download_size: 106902049
dataset_size: 187739216.0
---
# Dataset Card for "nl_speech_dataset"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
mholi
原始信息汇总
数据集概述
特征信息
数据集包含以下特征:
- Unnamed: 0: 数据类型为
int64 - id: 数据类型为
string - year: 数据类型为
int64 - month: 数据类型为
int64 - rdf:type: 数据类型为
string - skos:prefLabel: 数据类型为
string - semparls:endDate: 数据类型为
string - semparls:speaker: 数据类型为
string - semparls:party: 数据类型为
string - semparls:content: 数据类型为
string - parlsampos:facet_gender: 数据类型为
string - parlsampos:facet_annif_subject: 数据类型为
string - parlsampos:facet_referenced_person: 数据类型为
string - semparls:isInterruptedBy: 数据类型为
string
数据分割
数据集分为以下几个部分:
- train: 包含 19763 个样本,总大小为 135170320.44183758 字节
- validation: 包含 2196 个样本,总大小为 15019684.44518926 字节
- test: 包含 5490 个样本,总大小为 37549211.11297315 字节
数据大小
- 下载大小: 106902049 字节
- 数据集总大小: 187739216.0 字节



