HydraLM/SkunkData-Corpus-001
收藏Hugging Face2023-09-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/HydraLM/SkunkData-Corpus-001
下载链接
链接失效反馈官方服务:
资源简介:
SkunkData-Corpus数据集包含多种数据特征,如消息内容、消息类型、消息ID、对话ID等,数据类型涵盖字符串、整数和浮点数。数据集主要分为训练集,总字节数为3109254774,包含3278633个示例。下载大小为1470922120字节。
SkunkData-Corpus数据集包含多种数据特征,如消息内容、消息类型、消息ID、对话ID等,数据类型涵盖字符串、整数和浮点数。数据集主要分为训练集,总字节数为3109254774,包含3278633个示例。下载大小为1470922120字节。
提供机构:
HydraLM
原始信息汇总
数据集概述
数据集信息
特征
- message: 类型为字符串
- message_type: 类型为字符串
- message_id: 类型为整数64位
- conversation_id: 类型为整数64位
- dataset_id: 类型为字符串
- unique_conversation_id: 类型为字符串
- cluster: 类型为浮点数64位
- index_level_0: 类型为整数64位
数据分割
- train: 包含3278633个样本,总字节数为3109254774
数据集大小
- 下载大小: 1470922120字节
- 数据集大小: 3109254774字节
配置
- default: 包含训练数据文件路径为
data/train-*



