lingvenvist/animacy-et-gold-standard-mid
收藏Hugging Face2024-07-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/lingvenvist/animacy-et-gold-standard-mid
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含句子、词元、动画标签和目标索引四个主要特征。动画标签是一个序列字段,包含类别标签N、A和H。数据集被分为训练集、测试集和验证集,分别包含7270、1558和1559个示例。数据集的下载大小为1900749字节,总大小为3348235字节。
The dataset contains four main features: sentences, tokens, anim_tags, and target-indexes. The anim_tags feature is a sequence field containing class labels N, A, and H. The dataset is divided into training, test, and validation sets, containing 7270, 1558, and 1559 examples respectively. The download size of the dataset is 1900749 bytes, and the total size is 3348235 bytes.
提供机构:
lingvenvist
原始信息汇总
数据集概述
特征信息
- sentences: 类型为字符串。
- tokens: 类型为字符串序列。
- anim_tags: 类型为序列,包含以下类别标签:
- 0: N
- 1: A
- 2: H
- target-indexes: 类型为整数序列。
数据集划分
- train: 包含7270个样本,占用2334542字节。
- test: 包含1558个样本,占用504642字节。
- validation: 包含1559个样本,占用509051字节。
数据集大小
- 下载大小: 1900749字节。
- 总大小: 3348235字节。
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-*。 - test: 路径为
data/test-*。 - validation: 路径为
data/validation-*。
- train: 路径为
- data_files:



