lingvenvist/animacy-es-gold-standard
收藏Hugging Face2024-07-14 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/lingvenvist/animacy-es-gold-standard
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,包括句子、词元、动画标签和目标索引。动画标签是一个序列字段,包含三个类别标签:N、A和H。数据集被分为训练集、测试集和验证集,分别包含8645、1852和1853个示例。总下载大小为2378146字节,数据集总大小为5061692字节。
The dataset includes multiple fields such as sentences, tokens, anim_tags, and target-indexes. The anim_tags field is a sequence containing three class labels: N, A, and H. The dataset is divided into training, test, and validation sets, containing 8645, 1852, and 1853 examples respectively. The total download size is 2378146 bytes, and the total dataset size is 5061692 bytes.
提供机构:
lingvenvist
原始信息汇总
数据集概述
特征信息
- sentences: 类型为字符串。
- tokens: 类型为字符串序列。
- anim_tags: 类型为序列,包含分类标签,标签名称为:
- 0: N
- 1: A
- 2: H
- target-indexes: 类型为整数序列。
数据集划分
- train: 包含8645个样本,占用3531908字节。
- test: 包含1852个样本,占用748393字节。
- validation: 包含1853个样本,占用781391字节。
数据集大小
- 下载大小: 2378146字节。
- 总大小: 5061692字节。
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-* - validation: 路径为
data/validation-*
- train: 路径为
- data_files:



