logikon/oasst1-delib
收藏Hugging Face2023-09-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/logikon/oasst1-delib
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是`OpenAssistant/oasst1`的一个子集,包含英文聊天消息,这些消息被认为包含推理内容。数据集通过关键词pros进行过滤,并包含聊天历史作为额外特征。数据集的创建过程在GitHub上有详细记录。
提供机构:
logikon
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: Apache 2.0
配置
- 配置名称: default
- 数据文件:
- 训练集: data/train-*
- 验证集: data/validation-*
- 数据文件:
数据集信息
- 特征:
- message_id: 字符串
- parent_id: 字符串
- user_id: 字符串
- created_date: 字符串
- text: 字符串
- role: 字符串
- lang: 字符串
- review_count: 整数 (int32)
- review_result: 布尔值
- deleted: 布尔值
- rank: 浮点数 (float64)
- synthetic: 布尔值
- model_name: null
- detoxify: 结构体
- identity_attack: 浮点数 (float64)
- insult: 浮点数 (float64)
- obscene: 浮点数 (float64)
- severe_toxicity: 浮点数 (float64)
- sexual_explicit: 浮点数 (float64)
- threat: 浮点数 (float64)
- toxicity: 浮点数 (float64)
- message_tree_id: 字符串
- tree_state: 字符串
- emojis: 结构体
- count: 整数序列 (int32)
- name: 字符串序列
- labels: 结构体
- count: 整数序列 (int32)
- name: 字符串序列
- value: 浮点数序列 (float64)
- history: 字符串
数据集分割
- 训练集:
- 字节数: 278875
- 样本数: 90
- 验证集:
- 字节数: 18290
- 样本数: 6
数据集大小
- 下载大小: 208227
- 数据集大小: 297165



