ScarlettSun9/autotrain-data-ZuoZhuan
收藏Hugging Face2022-07-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ScarlettSun9/autotrain-data-ZuoZhuan
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为项目ZuoZhuan自动处理的AutoTrain数据集。数据集的BCP-47语言代码为unk,表明语言未知。数据集的结构包括数据实例和字段,数据实例由tokens和tags组成,tags是28个类别的ClassLabel。数据集被分为训练集和验证集,分别包含5836和2860个样本。
提供机构:
ScarlettSun9
原始信息汇总
AutoTrain Dataset for project: ZuoZhuan
数据集描述
- 语言: 数据集的语言代码为unk。
数据集结构
数据实例
- 示例: json [ { "tokens": ["三", "军", "之", "用", "。"], "tags": [6, 23, 23, 15, 24] }, { "tokens": ["羊", "革", ",", "裘", "长", ",", "而", "自", "蔽", "于", "贾", ",", "。"], "tags": [3, 23, 24, 23, 8, 24, 2, 15, 23, 13, 8, 8, 24] } ]
数据集字段
- 字段:
tokens: 字符序列,类型为字符串。tags: 类别标签序列,类别数为28,类别名包括/a, /b, /c, /d, /f, /j, /m, /mr, /n, /nn, /nr, /ns, /nsr, /p, /q, /r, /rn, /rr, /rs, /s, /sv, /t, /u, /v, /w, /wv, /y, /yv。
数据集分割
- 分割详情:
分割名称 样本数 train 5836 valid 2860



