siacus/cap_pe_v2
收藏Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/siacus/cap_pe_v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如文本、编码ID、原始ID、宏观信息、宏观编码和纯文本。数据集分为训练集和测试集,分别包含3341和1446个样本。数据集的下载大小为6224234字节,总大小为14464041字节。数据集配置为默认配置,训练集和测试集的数据文件分别存储在data/train-*和data/test-*路径下。
该数据集包含多个特征,如文本、编码ID、原始ID、宏观信息、宏观编码和纯文本。数据集分为训练集和测试集,分别包含3341和1446个样本。数据集的下载大小为6224234字节,总大小为14464041字节。数据集配置为默认配置,训练集和测试集的数据文件分别存储在data/train-*和data/test-*路径下。
提供机构:
siacus
原始信息汇总
数据集概述
数据集特征
- text: 数据类型为字符串。
- idCoding: 数据类型为64位整数。
- idOrig: 数据类型为字符串。
- macro: 数据类型为字符串。
- macroCode: 数据类型为64位整数。
- plaintext: 数据类型为字符串。
数据集分割
- train: 包含3341个样本,总字节数为10071103。
- test: 包含1446个样本,总字节数为4392938。
数据集大小
- 下载大小: 6224234字节。
- 总大小: 14464041字节。
配置
- default:
- train: 数据文件路径为
data/train-*。 - test: 数据文件路径为
data/test-*。
- train: 数据文件路径为



