MikeGreen2710/12_jun_hn_pred_all
收藏Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MikeGreen2710/12_jun_hn_pred_all
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括一个唯一的id、文本内容以及一系列特定编码的字段(如STR, LEG等),这些字段可能代表不同的实体或属性。数据集分为训练集,包含1324839个样本和1372802140字节的数据。
该数据集包含多个特征,包括一个唯一的id、文本内容以及一系列特定编码的字段(如STR, LEG等),这些字段可能代表不同的实体或属性。数据集分为训练集,包含1324839个样本和1372802140字节的数据。
提供机构:
MikeGreen2710
原始信息汇总
数据集概述
数据集特征
- id: 字符串类型
- text: 字符串类型
- STR: 字符串序列类型
- LEG: 字符串序列类型
- LOC: 字符串序列类型
- CIT: 字符串序列类型
- WAR: 字符串序列类型
- NUM: 字符串序列类型
- DIS: 字符串序列类型
- LAN: 字符串序列类型
- SHP: 字符串序列类型
- CAR: 字符串序列类型
- PUR: 字符串序列类型
- FWD: 字符串序列类型
- LIV: 字符串序列类型
- ARA: 字符串序列类型
- RWD: 字符串序列类型
- FDR: 字符串序列类型
- NOF: 字符串序列类型
- RPI: 字符串序列类型
- NOBR: 字符串序列类型
- NOBA: 字符串序列类型
- PRI: 字符串序列类型
- YCT: 字符串序列类型
- STU: 字符串序列类型
- COR: 字符串序列类型
数据集分割
- train: 包含1,324,839个样本,占用1,372,802,140字节
数据集大小
- 下载大小: 650,512,477字节
- 数据集大小: 1,372,802,140字节
配置
- default: 包含训练数据文件,路径为
data/train-*



