Tippawan/test2-data-semi-trainulb-r4-WLV
收藏Hugging Face2023-12-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Tippawan/test2-data-semi-trainulb-r4-WLV
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括tokens(字符串序列)、ner_tags(整数序列)、prob(浮点数序列)、ifpass(整数序列)、pred(整数)和__index_level_0__(整数)。数据集分为一个训练集,包含35403个样本,总大小为68713130字节。下载大小为11638964字节。数据集的配置文件中指定了训练数据文件的路径。
该数据集包含多个特征,包括tokens(字符串序列)、ner_tags(整数序列)、prob(浮点数序列)、ifpass(整数序列)、pred(整数)和__index_level_0__(整数)。数据集分为一个训练集,包含35403个样本,总大小为68713130字节。下载大小为11638964字节。数据集的配置文件中指定了训练数据文件的路径。
提供机构:
Tippawan
原始信息汇总
数据集概述
特征信息
- tokens: 序列类型,字符串
- ner_tags: 序列类型,64位整数
- prob: 序列类型,64位浮点数
- ifpass: 序列类型,64位整数
- pred: 数据类型,64位整数
- index_level_0: 数据类型,64位整数
数据分割
- train:
- 字节数: 68713130
- 样本数: 35403
数据集大小
- 下载大小: 11638964 字节
- 数据集大小: 68713130 字节
配置信息
- default:
- 数据文件路径: data/train-*



