naorm/malware-text-db-cyner
收藏Hugging Face2024-01-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/naorm/malware-text-db-cyner
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括Type、Text、Fixed Text、Score等,以及与原始和解码句子相关的信息。数据集主要用于训练,包含5255个样本,总字节数为2110807。
该数据集包含多个特征,包括Type、Text、Fixed Text、Score等,以及与原始和解码句子相关的信息。数据集主要用于训练,包含5255个样本,总字节数为2110807。
提供机构:
naorm
原始信息汇总
数据集概述
数据特征
- Type: 类型,数据类型为字符串(string)
- Text: 文本,数据类型为字符串(string)
- Fixed Text: 固定文本,数据类型为字符串(string)
- Score: 分数,数据类型为浮点数(float64)
- Original Sentence ID: 原始句子ID,数据类型为整数(int64)
- Original Sentence: 原始句子,数据类型为字符串(string)
- Decoded Sentence: 解码句子,数据类型为字符串(string)
- index_level_0: 索引级别0,数据类型为整数(int64)
数据分割
- train: 训练集,包含5255个样本,占用2110807字节
数据集大小
- 下载大小: 751269字节
- 数据集大小: 2110807字节
配置
- default: 默认配置,包含训练集文件路径为
data/train-*



