vwxyzjn/openhermes-dev__kaist-ai_prometheus-13b-v1.0__1707404986
收藏Hugging Face2024-02-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vwxyzjn/openhermes-dev__kaist-ai_prometheus-13b-v1.0__1707404986
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: model
dtype: 'null'
- name: category
dtype: string
- name: language
dtype: string
- name: custom_instruction
dtype: bool
- name: id
dtype: string
- name: topic
dtype: string
- name: avatarUrl
dtype: 'null'
- name: idx
dtype: 'null'
- name: conversations
list:
- name: from
dtype: string
- name: value
dtype: string
- name: weight
dtype: 'null'
- name: system_prompt
dtype: string
- name: source
dtype: string
- name: model_name
dtype: string
- name: skip_prompt_formatting
dtype: bool
- name: title
dtype: string
- name: hash
dtype: 'null'
- name: views
dtype: 'null'
- name: prompt
dtype: string
- name: token_length
dtype: int64
- name: candidate0
list:
- name: content
dtype: string
- name: role
dtype: string
- name: candidate1
list:
- name: content
dtype: string
- name: role
dtype: string
- name: candidate0_policy
dtype: string
- name: candidate1_policy
dtype: string
- name: rejected
dtype: string
- name: rejected_policy
dtype: string
splits:
- name: train_prefs
num_bytes: 1454598
num_examples: 167
download_size: 859857
dataset_size: 1454598
configs:
- config_name: default
data_files:
- split: train_prefs
path: data/train_prefs-*
---
数据集信息(dataset_info):
特征项(features):
- 名称:模型(model),数据类型:空值(null)
- 名称:类别(category),数据类型:字符串(string)
- 名称:语言(language),数据类型:字符串(string)
- 名称:自定义指令(custom_instruction),数据类型:布尔值(bool)
- 名称:ID(id),数据类型:字符串(string)
- 名称:主题(topic),数据类型:字符串(string)
- 名称:头像链接(avatarUrl),数据类型:空值(null)
- 名称:索引(idx),数据类型:空值(null)
- 名称:对话(conversations),为列表类型,其内部字段:
- 名称:来源(from),数据类型:字符串(string)
- 名称:内容(value),数据类型:字符串(string)
- 名称:权重(weight),数据类型:空值(null)
- 名称:系统提示词(system_prompt),数据类型:字符串(string)
- 名称:来源(source),数据类型:字符串(string)
- 名称:模型名称(model_name),数据类型:字符串(string)
- 名称:跳过提示词格式化(skip_prompt_formatting),数据类型:布尔值(bool)
- 名称:标题(title),数据类型:字符串(string)
- 名称:哈希值(hash),数据类型:空值(null)
- 名称:浏览量(views),数据类型:空值(null)
- 名称:提示词(prompt),数据类型:字符串(string)
- 名称:Token长度(token_length),数据类型:64位整型(int64)
- 名称:候选回复0(candidate0),为列表类型,其内部字段:
- 名称:内容(content),数据类型:字符串(string)
- 名称:角色(role),数据类型:字符串(string)
- 名称:候选回复1(candidate1),为列表类型,其内部字段:
- 名称:内容(content),数据类型:字符串(string)
- 名称:角色(role),数据类型:字符串(string)
- 名称:候选回复0策略(candidate0_policy),数据类型:字符串(string)
- 名称:候选回复1策略(candidate1_policy),数据类型:字符串(string)
- 名称:被拒回复(rejected),数据类型:字符串(string)
- 名称:被拒回复策略(rejected_policy),数据类型:字符串(string)
划分集(splits):
- 名称:训练偏好集(train_prefs),字节数:1454598,样本数量:167
下载大小:859857,数据集总大小:1454598
配置项(configs):
- 配置名称(config_name):默认(default),数据文件(data_files):
- 划分集:train_prefs,路径(path):data/train_prefs-*
提供机构:
vwxyzjn
原始信息汇总
数据集概述
特征信息
- model: 数据类型为
null - category: 数据类型为
string - language: 数据类型为
string - custom_instruction: 数据类型为
bool - id: 数据类型为
string - topic: 数据类型为
string - avatarUrl: 数据类型为
null - idx: 数据类型为
null - conversations: 列表类型,包含以下子特征:
- from: 数据类型为
string - value: 数据类型为
string - weight: 数据类型为
null
- from: 数据类型为
- system_prompt: 数据类型为
string - source: 数据类型为
string - model_name: 数据类型为
string - skip_prompt_formatting: 数据类型为
bool - title: 数据类型为
string - hash: 数据类型为
null - views: 数据类型为
null - prompt: 数据类型为
string - token_length: 数据类型为
int64 - candidate0: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- candidate1: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- candidate0_policy: 数据类型为
string - candidate1_policy: 数据类型为
string - rejected: 数据类型为
string - rejected_policy: 数据类型为
string
数据分割
- train_prefs: 包含 167 个样本,占用 1454598 字节
数据集大小
- 下载大小: 859857 字节
- 数据集大小: 1454598 字节
配置信息
- config_name: default
- data_files:
- split: train_prefs
- path: data/train_prefs-*
- data_files:



