vwxyzjn/openhermes-dev__mistralai_Mistral-7B-Instruct-v0.1__1707330742
收藏Hugging Face2024-02-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vwxyzjn/openhermes-dev__mistralai_Mistral-7B-Instruct-v0.1__1707330742
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,描述了数据的不同属性,如模型、类别、语言、自定义指令等。主要特征是conversations字段,它是一个列表,包含对话的来源、内容和权重。数据集还包含多个候选答案以及被选中和被拒绝的答案,这些答案都有相应的内容和角色。数据集的训练集部分包含167个样本,总大小为2303097字节。
该数据集包含多个字段,描述了数据的不同属性,如模型、类别、语言、自定义指令等。主要特征是conversations字段,它是一个列表,包含对话的来源、内容和权重。数据集还包含多个候选答案以及被选中和被拒绝的答案,这些答案都有相应的内容和角色。数据集的训练集部分包含167个样本,总大小为2303097字节。
提供机构:
vwxyzjn
原始信息汇总
数据集信息
特征
- model: 数据类型为
null - category: 数据类型为
string - language: 数据类型为
string - custom_instruction: 数据类型为
bool - id: 数据类型为
string - topic: 数据类型为
string - avatarUrl: 数据类型为
null - idx: 数据类型为
null - conversations: 列表类型,包含以下子特征:
- from: 数据类型为
string - value: 数据类型为
string - weight: 数据类型为
null
- from: 数据类型为
- system_prompt: 数据类型为
string - source: 数据类型为
string - model_name: 数据类型为
string - skip_prompt_formatting: 数据类型为
bool - title: 数据类型为
string - hash: 数据类型为
null - views: 数据类型为
null - prompt: 数据类型为
string - token_length: 数据类型为
int64 - candidate0: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- candidate1: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- candidate0_policy: 数据类型为
string - candidate1_policy: 数据类型为
string - candidate0_score: 数据类型为
float64 - candidate1_score: 数据类型为
float64 - chosen: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- chosen_policy: 数据类型为
string - rejected: 列表类型,包含以下子特征:
- content: 数据类型为
string - role: 数据类型为
string
- content: 数据类型为
- rejected_policy: 数据类型为
string
数据分割
- train_prefs: 包含 2303097 字节,167 个样本
数据大小
- 下载大小: 1368046 字节
- 数据集大小: 2303097 字节
配置
- default: 包含数据文件
data/train_prefs-*



