vwxyzjn/openhermes-dev__meta-llama_Llama-2-70b-chat-hf__1707337384

Name: vwxyzjn/openhermes-dev__meta-llama_Llama-2-70b-chat-hf__1707337384
Creator: vwxyzjn
Published: 2024-02-07 20:30:55
License: 暂无描述

Hugging Face2024-02-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/vwxyzjn/openhermes-dev__meta-llama_Llama-2-70b-chat-hf__1707337384

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: model dtype: 'null' - name: category dtype: string - name: language dtype: string - name: custom_instruction dtype: bool - name: id dtype: string - name: topic dtype: string - name: avatarUrl dtype: 'null' - name: idx dtype: 'null' - name: conversations list: - name: from dtype: string - name: value dtype: string - name: weight dtype: 'null' - name: system_prompt dtype: string - name: source dtype: string - name: model_name dtype: string - name: skip_prompt_formatting dtype: bool - name: title dtype: string - name: hash dtype: 'null' - name: views dtype: 'null' - name: prompt dtype: string - name: token_length dtype: int64 - name: candidate0 list: - name: content dtype: string - name: role dtype: string - name: candidate1 list: - name: content dtype: string - name: role dtype: string - name: candidate0_policy dtype: string - name: candidate1_policy dtype: string - name: llm_as_a_judge_prompt dtype: string - name: completion dtype: string - name: candidate0_score dtype: float64 - name: candidate1_score dtype: float64 - name: chosen list: - name: content dtype: string - name: role dtype: string - name: chosen_policy dtype: string - name: rejected list: - name: content dtype: string - name: role dtype: string - name: rejected_policy dtype: string splits: - name: train_prefs num_bytes: 3200690 num_examples: 167 download_size: 1721699 dataset_size: 3200690 configs: - config_name: default data_files: - split: train_prefs path: data/train_prefs-* ---

数据集信息：特征字段列表： - 字段名：模型，数据类型：空值 - 字段名：类别，数据类型：字符串 - 字段名：语言，数据类型：字符串 - 字段名：自定义指令，数据类型：布尔值 - 字段名：标识符，数据类型：字符串 - 字段名：主题，数据类型：字符串 - 字段名：头像链接，数据类型：空值 - 字段名：索引，数据类型：空值 - 字段名：对话列表，为列表类型，其子字段包括： - 字段名：来源方，数据类型：字符串 - 字段名：内容，数据类型：字符串 - 字段名：权重，数据类型：空值 - 字段名：系统提示词，数据类型：字符串 - 字段名：数据源，数据类型：字符串 - 字段名：模型名称，数据类型：字符串 - 字段名：跳过提示词格式化，数据类型：布尔值 - 字段名：标题，数据类型：字符串 - 字段名：哈希值，数据类型：空值 - 字段名：浏览量，数据类型：空值 - 字段名：提示词，数据类型：字符串 - 字段名：Token长度，数据类型：64位整数 - 字段名：候选回复0，为列表类型，其子字段包括： - 字段名：内容，数据类型：字符串 - 字段名：角色，数据类型：字符串 - 字段名：候选回复1，为列表类型，其子字段包括： - 字段名：内容，数据类型：字符串 - 字段名：角色，数据类型：字符串 - 字段名：候选回复0的策略，数据类型：字符串 - 字段名：候选回复1的策略，数据类型：字符串 - 字段名：大语言模型作为评判者的提示词，数据类型：字符串 - 字段名：生成补全结果，数据类型：字符串 - 字段名：候选回复0的得分，数据类型：64位浮点数 - 字段名：候选回复1的得分，数据类型：64位浮点数 - 字段名：选中回复，为列表类型，其子字段包括： - 字段名：内容，数据类型：字符串 - 字段名：角色，数据类型：字符串 - 字段名：选中回复的策略，数据类型：字符串 - 字段名：被拒回复，为列表类型，其子字段包括： - 字段名：内容，数据类型：字符串 - 字段名：角色，数据类型：字符串 - 字段名：被拒回复的策略，数据类型：字符串数据拆分设置： - 拆分名称：train_prefs，字节占用量：3200690，样本总数：167 下载总大小：1721699，数据集总大小：3200690 数据集配置项： - 配置名称：default，数据文件： - 对应拆分：train_prefs，文件路径：data/train_prefs-*

提供机构：

vwxyzjn

原始信息汇总

数据集概述

数据特征

model: 数据类型为 null
category: 数据类型为 string
language: 数据类型为 string
custom_instruction: 数据类型为 bool
id: 数据类型为 string
topic: 数据类型为 string
avatarUrl: 数据类型为 null
idx: 数据类型为 null
conversations: 列表类型，包含以下子特征：
- from: 数据类型为 string
- value: 数据类型为 string
- weight: 数据类型为 null
system_prompt: 数据类型为 string
source: 数据类型为 string
model_name: 数据类型为 string
skip_prompt_formatting: 数据类型为 bool
title: 数据类型为 string
hash: 数据类型为 null
views: 数据类型为 null
prompt: 数据类型为 string
token_length: 数据类型为 int64
candidate0: 列表类型，包含以下子特征：
- content: 数据类型为 string
- role: 数据类型为 string
candidate1: 列表类型，包含以下子特征：
- content: 数据类型为 string
- role: 数据类型为 string
candidate0_policy: 数据类型为 string
candidate1_policy: 数据类型为 string
llm_as_a_judge_prompt: 数据类型为 string
completion: 数据类型为 string
candidate0_score: 数据类型为 float64
candidate1_score: 数据类型为 float64
chosen: 列表类型，包含以下子特征：
- content: 数据类型为 string
- role: 数据类型为 string
chosen_policy: 数据类型为 string
rejected: 列表类型，包含以下子特征：
- content: 数据类型为 string
- role: 数据类型为 string
rejected_policy: 数据类型为 string

数据分割

train_prefs: 包含 167 个样本，占用 3200690 字节

数据集大小

下载大小: 1721699 字节
数据集大小: 3200690 字节

配置

default: 包含数据文件 data/train_prefs-*，对应分割 train_prefs

5,000+

优质数据集

54 个

任务类型

进入经典数据集