ferrazzipietro/e3c-sentences
收藏Hugging Face2024-01-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ferrazzipietro/e3c-sentences
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: sentence
dtype: string
- name: entities
list:
- name: id
dtype: string
- name: offsets
sequence: int64
- name: role
dtype: string
- name: semantic_type_id
dtype: string
- name: text
dtype: string
- name: type
dtype: string
- name: original_text
dtype: string
- name: original_id
dtype: string
splits:
- name: en.layer1
num_bytes: 4664440
num_examples: 1520
- name: en.layer2
num_bytes: 7776287
num_examples: 2873
- name: en.layer2.validation
num_bytes: 930399
num_examples: 334
- name: en.layer3
num_bytes: 8034412
num_examples: 9779
- name: es.layer1
num_bytes: 3684526
num_examples: 1134
- name: es.layer2
num_bytes: 6683282
num_examples: 2347
- name: es.layer2.validation
num_bytes: 757207
num_examples: 261
- name: es.layer3
num_bytes: 6726042
num_examples: 1876
- name: eu.layer1
num_bytes: 10097402
num_examples: 3126
- name: eu.layer2
num_bytes: 4263642
num_examples: 1594
- name: eu.layer2.validation
num_bytes: 2807698
num_examples: 468
- name: eu.layer3
num_bytes: 4701763
num_examples: 1232
- name: it.layer1
num_bytes: 3413113
num_examples: 1146
- name: it.layer2
num_bytes: 7216893
num_examples: 2436
- name: it.layer2.validation
num_bytes: 866966
num_examples: 275
- name: it.layer3
num_bytes: 86621561
num_examples: 10213
- name: fr.layer1
num_bytes: 3662172
num_examples: 1109
- name: fr.layer2
num_bytes: 7217583
num_examples: 2389
- name: fr.layer2.validation
num_bytes: 864874
num_examples: 293
- name: fr.layer3
num_bytes: 458879871
num_examples: 25740
download_size: 242478141
dataset_size: 629870133
configs:
- config_name: default
data_files:
- split: en.layer1
path: data/en.layer1-*
- split: en.layer2
path: data/en.layer2-*
- split: en.layer2.validation
path: data/en.layer2.validation-*
- split: en.layer3
path: data/en.layer3-*
- split: es.layer1
path: data/es.layer1-*
- split: es.layer2
path: data/es.layer2-*
- split: es.layer2.validation
path: data/es.layer2.validation-*
- split: es.layer3
path: data/es.layer3-*
- split: eu.layer1
path: data/eu.layer1-*
- split: eu.layer2
path: data/eu.layer2-*
- split: eu.layer2.validation
path: data/eu.layer2.validation-*
- split: eu.layer3
path: data/eu.layer3-*
- split: it.layer1
path: data/it.layer1-*
- split: it.layer2
path: data/it.layer2-*
- split: it.layer2.validation
path: data/it.layer2.validation-*
- split: it.layer3
path: data/it.layer3-*
- split: fr.layer1
path: data/fr.layer1-*
- split: fr.layer2
path: data/fr.layer2-*
- split: fr.layer2.validation
path: data/fr.layer2.validation-*
- split: fr.layer3
path: data/fr.layer3-*
---
提供机构:
ferrazzipietro
原始信息汇总
数据集概述
特征信息
- sentence: 类型为字符串。
- entities: 列表类型,包含以下子特征:
- id: 类型为字符串。
- offsets: 整数序列。
- role: 类型为字符串。
- semantic_type_id: 类型为字符串。
- text: 类型为字符串。
- type: 类型为字符串。
- original_text: 类型为字符串。
- original_id: 类型为字符串。
数据分割
- en.layer1: 字节数为4664440,样本数为1520。
- en.layer2: 字节数为7776287,样本数为2873。
- en.layer2.validation: 字节数为930399,样本数为334。
- en.layer3: 字节数为8034412,样本数为9779。
- es.layer1: 字节数为3684526,样本数为1134。
- es.layer2: 字节数为6683282,样本数为2347。
- es.layer2.validation: 字节数为757207,样本数为261。
- es.layer3: 字节数为6726042,样本数为1876。
- eu.layer1: 字节数为10097402,样本数为3126。
- eu.layer2: 字节数为4263642,样本数为1594。
- eu.layer2.validation: 字节数为2807698,样本数为468。
- eu.layer3: 字节数为4701763,样本数为1232。
- it.layer1: 字节数为3413113,样本数为1146。
- it.layer2: 字节数为7216893,样本数为2436。
- it.layer2.validation: 字节数为866966,样本数为275。
- it.layer3: 字节数为86621561,样本数为10213。
- fr.layer1: 字节数为3662172,样本数为1109。
- fr.layer2: 字节数为7217583,样本数为2389。
- fr.layer2.validation: 字节数为864874,样本数为293。
- fr.layer3: 字节数为458879871,样本数为25740。
数据集大小
- 下载大小: 242478141字节。
- 数据集大小: 629870133字节。
配置信息
- default配置包含以下数据文件:
- en.layer1: 路径为
data/en.layer1-*。 - en.layer2: 路径为
data/en.layer2-*。 - en.layer2.validation: 路径为
data/en.layer2.validation-*。 - en.layer3: 路径为
data/en.layer3-*。 - es.layer1: 路径为
data/es.layer1-*。 - es.layer2: 路径为
data/es.layer2-*。 - es.layer2.validation: 路径为
data/es.layer2.validation-*。 - es.layer3: 路径为
data/es.layer3-*。 - eu.layer1: 路径为
data/eu.layer1-*。 - eu.layer2: 路径为
data/eu.layer2-*。 - eu.layer2.validation: 路径为
data/eu.layer2.validation-*。 - eu.layer3: 路径为
data/eu.layer3-*。 - it.layer1: 路径为
data/it.layer1-*。 - it.layer2: 路径为
data/it.layer2-*。 - it.layer2.validation: 路径为
data/it.layer2.validation-*。 - it.layer3: 路径为
data/it.layer3-*。 - fr.layer1: 路径为
data/fr.layer1-*。 - fr.layer2: 路径为
data/fr.layer2-*。 - fr.layer2.validation: 路径为
data/fr.layer2.validation-*。 - fr.layer3: 路径为
data/fr.layer3-*。
- en.layer1: 路径为



