lingvenvist/animacy-ko-gold-standard-org
收藏Hugging Face2024-07-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/lingvenvist/animacy-ko-gold-standard-org
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含句子、词元、动画标签和目标索引四个主要特征。动画标签是一个序列字段,包含类标签,分别代表不同的类别(N, A, H, O)。数据集被分为训练集、测试集和验证集,每个集的大小和示例数量也被详细列出。数据集的下载大小为237739字节,总大小为451087字节。
The dataset contains four main features: sentences, tokens, anim_tags, and target-indexes. The anim_tags is a sequence field containing class labels representing different categories (N, A, H, O). The dataset is divided into training, test, and validation sets, with the size and number of examples for each set detailed. The download size of the dataset is 237739 bytes, and the total size is 451087 bytes.
提供机构:
lingvenvist
原始信息汇总
数据集概述
数据集信息
特征
- sentences: 类型为字符串。
- tokens: 类型为字符串序列。
- anim_tags: 类型为序列,包含以下类别标签:
- 0: N
- 1: A
- 2: H
- 3: O
- target-indexes: 类型为整数序列。
数据分割
- train: 包含3178个样本,占用317572字节。
- test: 包含681个样本,占用67072字节。
- validation: 包含682个样本,占用66443字节。
数据集大小
- 下载大小: 237739字节。
- 总大小: 451087字节。
配置
- config_name: default
- 数据文件路径:
- train: data/train-*
- test: data/test-*
- validation: data/validation-*
- 数据文件路径:



