mlabonne/SafeBeaverTails
收藏Hugging Face2024-05-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mlabonne/SafeBeaverTails
下载链接
链接失效反馈官方服务:
资源简介:
SafeBeaverTails是PKU-Alignment/BeaverTails数据集的去重和清理版本,其中is_safe==True,并且数据格式为ShareGPT格式。数据集包含一个名为conversations的特征,该特征是一个列表,每个元素包含from和value两个字段,数据类型均为字符串。数据集仅包含一个名为train的分割,该分割的字节大小为40348682.07590368,示例数量为96428。
SafeBeaverTails是PKU-Alignment/BeaverTails数据集的去重和清理版本,其中is_safe==True,并且数据格式为ShareGPT格式。数据集包含一个名为conversations的特征,该特征是一个列表,每个元素包含from和value两个字段,数据类型均为字符串。数据集仅包含一个名为train的分割,该分割的字节大小为40348682.07590368,示例数量为96428。
提供机构:
mlabonne
原始信息汇总
数据集概述
数据集特征
- 名称: conversations
- 字段:
- from: 数据类型为字符串
- value: 数据类型为字符串
- 字段:
数据集分割
- 训练集:
- 示例数量: 96428
- 数据大小: 40348682.07590368字节
数据集大小
- 下载大小: 23715521字节
- 总数据大小: 40348682.07590368字节
配置信息
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 分割: train
- 数据文件:



