lingvenvist/animacy-bg

Name: lingvenvist/animacy-bg
Creator: lingvenvist
Published: 2024-06-20 16:25:30
License: 暂无描述

Hugging Face2024-06-20 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/lingvenvist/animacy-bg

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含四个主要特征：句子（sentences）、词元（tokens）、动画标签（anim_tags）和目标索引（target-indexes）。句子是字符串类型，词元是字符串序列，动画标签是一个包含三个类别（N、A、H）的序列，目标索引是整数序列。数据集分为三个部分：训练集（3个样本）、测试集（12317个样本）和验证集（3个样本）。数据集的下载大小为2818786字节，总大小为7209509字节。数据集配置为默认配置，数据文件分别存储在data目录下的train-*、test-*和validation-*文件中。

提供机构：

lingvenvist

原始信息汇总

数据集概述

特征信息

sentences: 类型为字符串。
tokens: 类型为字符串序列。
anim_tags: 类型为序列，包含以下类别标签：
- 0: N
- 1: A
- 2: H
target-indexes: 类型为整数序列。

数据集划分

train: 包含3个样本，占用1866字节。
test: 包含12317个样本，占用7205777字节。
validation: 包含3个样本，占用1866字节。

数据集大小

下载大小: 2818786字节
数据集总大小: 7209509字节

配置信息

config_name: default
- data_files:
  - train: 路径为data/train-*
  - test: 路径为data/test-*
  - validation: 路径为data/validation-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集