vwxyzjn/openhermes-dev__meta-llama_Llama-2-70b-chat-hf__1707337384
收藏Hugging Face2024-02-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vwxyzjn/openhermes-dev__meta-llama_Llama-2-70b-chat-hf__1707337384
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: model
dtype: 'null'
- name: category
dtype: string
- name: language
dtype: string
- name: custom_instruction
dtype: bool
- name: id
dtype: string
- name: topic
dtype: string
- name: avatarUrl
dtype: 'null'
- name: idx
dtype: 'null'
- name: conversations
list:
- name: from
dtype: string
- name: value
dtype: string
- name: weight
dtype: 'null'
- name: system_prompt
dtype: string
- name: source
dtype: string
- name: model_name
dtype: string
- name: skip_prompt_formatting
dtype: bool
- name: title
dtype: string
- name: hash
dtype: 'null'
- name: views
dtype: 'null'
- name: prompt
dtype: string
- name: token_length
dtype: int64
- name: candidate0
list:
- name: content
dtype: string
- name: role
dtype: string
- name: candidate1
list:
- name: content
dtype: string
- name: role
dtype: string
- name: candidate0_policy
dtype: string
- name: candidate1_policy
dtype: string
- name: llm_as_a_judge_prompt
dtype: string
- name: completion
dtype: string
- name: candidate0_score
dtype: float64
- name: candidate1_score
dtype: float64
- name: chosen
list:
- name: content
dtype: string
- name: role
dtype: string
- name: chosen_policy
dtype: string
- name: rejected
list:
- name: content
dtype: string
- name: role
dtype: string
- name: rejected_policy
dtype: string
splits:
- name: train_prefs
num_bytes: 3200690
num_examples: 167
download_size: 1721699
dataset_size: 3200690
configs:
- config_name: default
data_files:
- split: train_prefs
path: data/train_prefs-*
---
数据集信息:
特征字段列表:
- 字段名:模型,数据类型:空值
- 字段名:类别,数据类型:字符串
- 字段名:语言,数据类型:字符串
- 字段名:自定义指令,数据类型:布尔值
- 字段名:标识符,数据类型:字符串
- 字段名:主题,数据类型:字符串
- 字段名:头像链接,数据类型:空值
- 字段名:索引,数据类型:空值
- 字段名:对话列表,为列表类型,其子字段包括:
- 字段名:来源方,数据类型:字符串
- 字段名:内容,数据类型:字符串
- 字段名:权重,数据类型:空值
- 字段名:系统提示词,数据类型:字符串
- 字段名:数据源,数据类型:字符串
- 字段名:模型名称,数据类型:字符串
- 字段名:跳过提示词格式化,数据类型:布尔值
- 字段名:标题,数据类型:字符串
- 字段名:哈希值,数据类型:空值
- 字段名:浏览量,数据类型:空值
- 字段名:提示词,数据类型:字符串
- 字段名:Token长度,数据类型:64位整数
- 字段名:候选回复0,为列表类型,其子字段包括:
- 字段名:内容,数据类型:字符串
- 字段名:角色,数据类型:字符串
- 字段名:候选回复1,为列表类型,其子字段包括:
- 字段名:内容,数据类型:字符串
- 字段名:角色,数据类型:字符串
- 字段名:候选回复0的策略,数据类型:字符串
- 字段名:候选回复1的策略,数据类型:字符串
- 字段名:大语言模型作为评判者的提示词,数据类型:字符串
- 字段名:生成补全结果,数据类型:字符串
- 字段名:候选回复0的得分,数据类型:64位浮点数
- 字段名:候选回复1的得分,数据类型:64位浮点数
- 字段名:选中回复,为列表类型,其子字段包括:
- 字段名:内容,数据类型:字符串
- 字段名:角色,数据类型:字符串
- 字段名:选中回复的策略,数据类型:字符串
- 字段名:被拒回复,为列表类型,其子字段包括:
- 字段名:内容,数据类型:字符串
- 字段名:角色,数据类型:字符串
- 字段名:被拒回复的策略,数据类型:字符串
数据拆分设置:
- 拆分名称:train_prefs,字节占用量:3200690,样本总数:167
下载总大小:1721699,数据集总大小:3200690
数据集配置项:
- 配置名称:default,数据文件:
- 对应拆分:train_prefs,文件路径:data/train_prefs-*
提供机构:
vwxyzjn
原始信息汇总
数据集概述
数据特征
- model: 数据类型为
null - category: 数据类型为
string - language: 数据类型为
string - custom_instruction: 数据类型为
bool - id: 数据类型为
string - topic: 数据类型为
string - avatarUrl: 数据类型为
null - idx: 数据类型为
null - conversations: 列表类型,包含以下子特征:
- from: 数据类型为
string - value: 数据类型为
string - weight: 数据类型为
null
- from: 数据类型为
- system_prompt: 数据类型为
string - source: 数据类型为
string - model_name: 数据类型为
string - skip_prompt_formatting: 数据类型为
bool - title: 数据类型为
string - hash: 数据类型为
null - views: 数据类型为
null - prompt: 数据类型为
string - token_length: 数据类型为
int64 - candidate0: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- candidate1: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- candidate0_policy: 数据类型为
string - candidate1_policy: 数据类型为
string - llm_as_a_judge_prompt: 数据类型为
string - completion: 数据类型为
string - candidate0_score: 数据类型为
float64 - candidate1_score: 数据类型为
float64 - chosen: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- chosen_policy: 数据类型为
string - rejected: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- rejected_policy: 数据类型为
string
数据分割
- train_prefs: 包含 167 个样本,占用 3200690 字节
数据集大小
- 下载大小: 1721699 字节
- 数据集大小: 3200690 字节
配置
- default: 包含数据文件
data/train_prefs-*,对应分割train_prefs



