MikeGreen2710/12_jun_hn_pred_p4_standardized
收藏Hugging Face2024-06-25 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MikeGreen2710/12_jun_hn_pred_p4_standardized
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如id、text、LAN、CIT、STR、LOC、DIS、NUM、LEG、WAR、SHP、PUR、FWD、ARA、LIV、CAR、FDR、RWD、NOBA、NOF、NOBR、COR、YCT、RPI、PRI、STU、STU_std、SHP_std、COR_std、tum_san_thuong、ham、lung、tret、NOF_so_tang、NOF_so_lau、NOF_so_tang_noi、NOF_std等。这些特征大多为序列类型,部分为整数或浮点数类型。数据集包含一个训练集,大小为309274166字节,包含275041个样本。
This dataset contains multiple features such as id, text, LAN, CIT, STR, LOC, DIS, NUM, LEG, WAR, SHP, PUR, FWD, ARA, LIV, CAR, FDR, RWD, NOBA, NOF, NOBR, COR, YCT, RPI, PRI, STU, STU_std, SHP_std, COR_std, tum_san_thuong, ham, lung, tret, NOF_so_tang, NOF_so_lau, NOF_so_tang_noi, NOF_std, etc. Most of these features are of sequence type, while some are of integer or float type. The dataset includes a training set with a size of 309274166 bytes, containing 275041 samples.
提供机构:
MikeGreen2710
原始信息汇总
数据集概述
数据集特征
- id: 字符串类型
- text: 字符串类型
- LAN: 字符串序列
- CIT: 字符串序列
- STR: 字符串序列
- LOC: 字符串序列
- DIS: 字符串序列
- NUM: 字符串序列
- LEG: 字符串序列
- WAR: 字符串序列
- SHP: 字符串序列
- PUR: 字符串序列
- FWD: 字符串序列
- ARA: 字符串序列
- LIV: 字符串序列
- CAR: 字符串序列
- FDR: 字符串序列
- RWD: 字符串序列
- NOBA: 字符串序列
- NOF: 字符串序列
- NOBR: 字符串序列
- COR: 字符串序列
- YCT: 字符串序列
- RPI: 字符串序列
- PRI: 字符串序列
- STU: 字符串序列
- STU_std: 字符串序列
- SHP_std: 字符串序列
- COR_std: 字符串序列
- tum_san_thuong: 64位整数类型
- ham: 64位整数类型
- lung: 64位整数类型
- tret: 64位整数类型
- NOF_so_tang: 64位浮点数类型
- NOF_so_lau: 64位浮点数类型
- NOF_so_tang_noi: 64位浮点数类型
- NOF_std: 64位浮点数类型
数据集分割
- train:
- 样本数量: 275041
- 数据大小: 309274166字节
数据集大小
- 下载大小: 136783496字节
- 数据集总大小: 309274166字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



