communityai/system_identity_remove_preference_chatgpt
收藏Hugging Face2024-04-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/communityai/system_identity_remove_preference_chatgpt
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: identity
dtype: string
- name: system
dtype: string
- name: prompt
dtype: string
- name: chosen
list:
list:
- name: content
dtype: string
- name: role
dtype: string
- name: rejected
list:
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 189699.0
num_examples: 93
download_size: 76085
dataset_size: 189699.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
1. 特征字段:
- 字段名:identity,数据类型:字符串
- 字段名:system,数据类型:字符串
- 字段名:提示词(prompt),数据类型:字符串
- 字段名:chosen,数据类型为列表,列表元素为包含content(内容,字符串类型)与role(角色,字符串类型)的结构体
- 字段名:rejected,数据类型为列表,列表元素为包含content(内容,字符串类型)与role(角色,字符串类型)的结构体
2. 数据划分:
训练集(train):占用字节数189699.0,样本数量93
3. 数据集参数:
下载大小:76085 字节
数据集总大小:189699.0 字节
4. 配置信息:
默认配置(config_name: default):训练集对应数据文件路径为data/train-*
提供机构:
communityai
原始信息汇总
数据集概述
数据集特征
- identity:字符串类型
- system:字符串类型
- prompt:字符串类型
- chosen:列表类型,包含以下子特征:
- content:字符串类型
- role:字符串类型
- rejected:列表类型,包含以下子特征:
- content:字符串类型
- role:字符串类型
数据集分割
- train:训练集
- num_bytes:189699.0字节
- num_examples:93个示例
数据集大小
- download_size:76085字节
- dataset_size:189699.0字节



