five

ScarlettSun9/autotrain-data-ZuoZhuan

收藏
Hugging Face2022-07-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ScarlettSun9/autotrain-data-ZuoZhuan
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为项目ZuoZhuan自动处理的AutoTrain数据集。数据集的BCP-47语言代码为unk,表明语言未知。数据集的结构包括数据实例和字段,数据实例由tokens和tags组成,tags是28个类别的ClassLabel。数据集被分为训练集和验证集,分别包含5836和2860个样本。
提供机构:
ScarlettSun9
原始信息汇总

AutoTrain Dataset for project: ZuoZhuan

数据集描述

  • 语言: 数据集的语言代码为unk。

数据集结构

数据实例

  • 示例: json [ { "tokens": ["三", "军", "之", "用", "。"], "tags": [6, 23, 23, 15, 24] }, { "tokens": ["羊", "革", ",", "裘", "长", ",", "而", "自", "蔽", "于", "贾", ",", "。"], "tags": [3, 23, 24, 23, 8, 24, 2, 15, 23, 13, 8, 8, 24] } ]

数据集字段

  • 字段:
    • tokens: 字符序列,类型为字符串。
    • tags: 类别标签序列,类别数为28,类别名包括/a, /b, /c, /d, /f, /j, /m, /mr, /n, /nn, /nr, /ns, /nsr, /p, /q, /r, /rn, /rr, /rs, /s, /sv, /t, /u, /v, /w, /wv, /y, /yv。

数据集分割

  • 分割详情:
    分割名称 样本数
    train 5836
    valid 2860
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作