five

vwxyzjn/openhermes-dev__mistralai_Mistral-7B-Instruct-v0.1__1707330742

收藏
Hugging Face2024-02-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vwxyzjn/openhermes-dev__mistralai_Mistral-7B-Instruct-v0.1__1707330742
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个字段,描述了数据的不同属性,如模型、类别、语言、自定义指令等。主要特征是conversations字段,它是一个列表,包含对话的来源、内容和权重。数据集还包含多个候选答案以及被选中和被拒绝的答案,这些答案都有相应的内容和角色。数据集的训练集部分包含167个样本,总大小为2303097字节。

该数据集包含多个字段,描述了数据的不同属性,如模型、类别、语言、自定义指令等。主要特征是conversations字段,它是一个列表,包含对话的来源、内容和权重。数据集还包含多个候选答案以及被选中和被拒绝的答案,这些答案都有相应的内容和角色。数据集的训练集部分包含167个样本,总大小为2303097字节。
提供机构:
vwxyzjn
原始信息汇总

数据集信息

特征

  • model: 数据类型为 null
  • category: 数据类型为 string
  • language: 数据类型为 string
  • custom_instruction: 数据类型为 bool
  • id: 数据类型为 string
  • topic: 数据类型为 string
  • avatarUrl: 数据类型为 null
  • idx: 数据类型为 null
  • conversations: 列表类型,包含以下子特征:
    • from: 数据类型为 string
    • value: 数据类型为 string
    • weight: 数据类型为 null
  • system_prompt: 数据类型为 string
  • source: 数据类型为 string
  • model_name: 数据类型为 string
  • skip_prompt_formatting: 数据类型为 bool
  • title: 数据类型为 string
  • hash: 数据类型为 null
  • views: 数据类型为 null
  • prompt: 数据类型为 string
  • token_length: 数据类型为 int64
  • candidate0: 列表类型,包含以下子特征:
    • content: 数据类型为 string
    • role: 数据类型为 string
  • candidate1: 列表类型,包含以下子特征:
    • content: 数据类型为 string
    • role: 数据类型为 string
  • candidate0_policy: 数据类型为 string
  • candidate1_policy: 数据类型为 string
  • candidate0_score: 数据类型为 float64
  • candidate1_score: 数据类型为 float64
  • chosen: 列表类型,包含以下子特征:
    • content: 数据类型为 string
    • role: 数据类型为 string
  • chosen_policy: 数据类型为 string
  • rejected: 列表类型,包含以下子特征:
    • content: 数据类型为 string
    • role: 数据类型为 string
  • rejected_policy: 数据类型为 string

数据分割

  • train_prefs: 包含 2303097 字节,167 个样本

数据大小

  • 下载大小: 1368046 字节
  • 数据集大小: 2303097 字节

配置

  • default: 包含数据文件 data/train_prefs-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作