five

vwxyzjn/openhermes-dev__kaist-ai_prometheus-13b-v1.0__1707404986

收藏
Hugging Face2024-02-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vwxyzjn/openhermes-dev__kaist-ai_prometheus-13b-v1.0__1707404986
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: model dtype: 'null' - name: category dtype: string - name: language dtype: string - name: custom_instruction dtype: bool - name: id dtype: string - name: topic dtype: string - name: avatarUrl dtype: 'null' - name: idx dtype: 'null' - name: conversations list: - name: from dtype: string - name: value dtype: string - name: weight dtype: 'null' - name: system_prompt dtype: string - name: source dtype: string - name: model_name dtype: string - name: skip_prompt_formatting dtype: bool - name: title dtype: string - name: hash dtype: 'null' - name: views dtype: 'null' - name: prompt dtype: string - name: token_length dtype: int64 - name: candidate0 list: - name: content dtype: string - name: role dtype: string - name: candidate1 list: - name: content dtype: string - name: role dtype: string - name: candidate0_policy dtype: string - name: candidate1_policy dtype: string - name: rejected dtype: string - name: rejected_policy dtype: string splits: - name: train_prefs num_bytes: 1454598 num_examples: 167 download_size: 859857 dataset_size: 1454598 configs: - config_name: default data_files: - split: train_prefs path: data/train_prefs-* ---

数据集信息(dataset_info): 特征项(features): - 名称:模型(model),数据类型:空值(null) - 名称:类别(category),数据类型:字符串(string) - 名称:语言(language),数据类型:字符串(string) - 名称:自定义指令(custom_instruction),数据类型:布尔值(bool) - 名称:ID(id),数据类型:字符串(string) - 名称:主题(topic),数据类型:字符串(string) - 名称:头像链接(avatarUrl),数据类型:空值(null) - 名称:索引(idx),数据类型:空值(null) - 名称:对话(conversations),为列表类型,其内部字段: - 名称:来源(from),数据类型:字符串(string) - 名称:内容(value),数据类型:字符串(string) - 名称:权重(weight),数据类型:空值(null) - 名称:系统提示词(system_prompt),数据类型:字符串(string) - 名称:来源(source),数据类型:字符串(string) - 名称:模型名称(model_name),数据类型:字符串(string) - 名称:跳过提示词格式化(skip_prompt_formatting),数据类型:布尔值(bool) - 名称:标题(title),数据类型:字符串(string) - 名称:哈希值(hash),数据类型:空值(null) - 名称:浏览量(views),数据类型:空值(null) - 名称:提示词(prompt),数据类型:字符串(string) - 名称:Token长度(token_length),数据类型:64位整型(int64) - 名称:候选回复0(candidate0),为列表类型,其内部字段: - 名称:内容(content),数据类型:字符串(string) - 名称:角色(role),数据类型:字符串(string) - 名称:候选回复1(candidate1),为列表类型,其内部字段: - 名称:内容(content),数据类型:字符串(string) - 名称:角色(role),数据类型:字符串(string) - 名称:候选回复0策略(candidate0_policy),数据类型:字符串(string) - 名称:候选回复1策略(candidate1_policy),数据类型:字符串(string) - 名称:被拒回复(rejected),数据类型:字符串(string) - 名称:被拒回复策略(rejected_policy),数据类型:字符串(string) 划分集(splits): - 名称:训练偏好集(train_prefs),字节数:1454598,样本数量:167 下载大小:859857,数据集总大小:1454598 配置项(configs): - 配置名称(config_name):默认(default),数据文件(data_files): - 划分集:train_prefs,路径(path):data/train_prefs-*
提供机构:
vwxyzjn
原始信息汇总

数据集概述

特征信息

  • model: 数据类型为 null
  • category: 数据类型为 string
  • language: 数据类型为 string
  • custom_instruction: 数据类型为 bool
  • id: 数据类型为 string
  • topic: 数据类型为 string
  • avatarUrl: 数据类型为 null
  • idx: 数据类型为 null
  • conversations: 列表类型,包含以下子特征:
    • from: 数据类型为 string
    • value: 数据类型为 string
    • weight: 数据类型为 null
  • system_prompt: 数据类型为 string
  • source: 数据类型为 string
  • model_name: 数据类型为 string
  • skip_prompt_formatting: 数据类型为 bool
  • title: 数据类型为 string
  • hash: 数据类型为 null
  • views: 数据类型为 null
  • prompt: 数据类型为 string
  • token_length: 数据类型为 int64
  • candidate0: 列表类型,包含以下子特征:
    • content: 数据类型为 string
    • role: 数据类型为 string
  • candidate1: 列表类型,包含以下子特征:
    • content: 数据类型为 string
    • role: 数据类型为 string
  • candidate0_policy: 数据类型为 string
  • candidate1_policy: 数据类型为 string
  • rejected: 数据类型为 string
  • rejected_policy: 数据类型为 string

数据分割

  • train_prefs: 包含 167 个样本,占用 1454598 字节

数据集大小

  • 下载大小: 859857 字节
  • 数据集大小: 1454598 字节

配置信息

  • config_name: default
    • data_files:
      • split: train_prefs
      • path: data/train_prefs-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作