vwxyzjn/openhermes-dev__mistralai_Mistral-7B-Instruct-v0.1__1707330518
收藏Hugging Face2024-02-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vwxyzjn/openhermes-dev__mistralai_Mistral-7B-Instruct-v0.1__1707330518
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: model
dtype: 'null'
- name: category
dtype: string
- name: language
dtype: string
- name: custom_instruction
dtype: bool
- name: id
dtype: string
- name: topic
dtype: string
- name: avatarUrl
dtype: 'null'
- name: idx
dtype: 'null'
- name: conversations
list:
- name: from
dtype: string
- name: value
dtype: string
- name: weight
dtype: 'null'
- name: system_prompt
dtype: string
- name: source
dtype: string
- name: model_name
dtype: string
- name: skip_prompt_formatting
dtype: bool
- name: title
dtype: string
- name: hash
dtype: 'null'
- name: views
dtype: 'null'
- name: prompt
dtype: string
- name: token_length
dtype: int64
- name: candidate0
list:
- name: content
dtype: string
- name: role
dtype: string
- name: candidate1
list:
- name: content
dtype: string
- name: role
dtype: string
- name: candidate0_policy
dtype: string
- name: candidate1_policy
dtype: string
- name: candidate0_score
dtype: float64
- name: candidate1_score
dtype: float64
- name: chosen
list:
- name: content
dtype: string
- name: role
dtype: string
- name: chosen_policy
dtype: string
- name: rejected
list:
- name: content
dtype: string
- name: role
dtype: string
- name: rejected_policy
dtype: string
splits:
- name: train_prefs
num_bytes: 2300797
num_examples: 167
download_size: 1365578
dataset_size: 2300797
configs:
- config_name: default
data_files:
- split: train_prefs
path: data/train_prefs-*
---
提供机构:
vwxyzjn
原始信息汇总
数据集信息
特征
- model: 数据类型为
null - category: 数据类型为
string - language: 数据类型为
string - custom_instruction: 数据类型为
bool - id: 数据类型为
string - topic: 数据类型为
string - avatarUrl: 数据类型为
null - idx: 数据类型为
null - conversations: 列表类型,包含以下子特征:
- from: 数据类型为
string - value: 数据类型为
string - weight: 数据类型为
null
- from: 数据类型为
- system_prompt: 数据类型为
string - source: 数据类型为
string - model_name: 数据类型为
string - skip_prompt_formatting: 数据类型为
bool - title: 数据类型为
string - hash: 数据类型为
null - views: 数据类型为
null - prompt: 数据类型为
string - token_length: 数据类型为
int64 - candidate0: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- candidate1: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- candidate0_policy: 数据类型为
string - candidate1_policy: 数据类型为
string - candidate0_score: 数据类型为
float64 - candidate1_score: 数据类型为
float64 - chosen: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- chosen_policy: 数据类型为
string - rejected: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- rejected_policy: 数据类型为
string
数据分割
- train_prefs: 包含 2300797 字节和 167 个样本
数据集大小
- 下载大小: 1365578 字节
- 数据集大小: 2300797 字节
配置
- config_name: default
- data_files:
- split: train_prefs
- path: data/train_prefs-*



