five

gabrielmbmb/ultrafeedback-prompts-ultrajudge-gpt35

收藏
Hugging Face2023-11-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gabrielmbmb/ultrafeedback-prompts-ultrajudge-gpt35
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: input dtype: string - name: generation_model dtype: string - name: generation_prompt dtype: string - name: raw_generation_responses sequence: string - name: generations sequence: string - name: labelling_model dtype: string - name: labelling_prompt list: - name: content dtype: string - name: role dtype: string - name: raw_labelling_response dtype: string - name: rating sequence: int64 - name: areas list: - name: Authenticity & Reliability struct: - name: rating dtype: string - name: rationale dtype: string - name: Clarity & Transparency struct: - name: rating dtype: string - name: rationale dtype: string - name: Compliance with Intent struct: - name: rating dtype: string - name: rationale dtype: string - name: Practical Accuracy struct: - name: rating dtype: string - name: rationale dtype: string splits: - name: train num_bytes: 18658217 num_examples: 1000 download_size: 7709122 dataset_size: 18658217 configs: - config_name: default data_files: - split: train path: data/train-* --- # Dataset Card for "ultrafeedback-prompts-ultrajudge-gpt35" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征字段: - 输入(input):字符串类型 - 生成模型(generation_model):字符串类型 - 生成提示词(generation_prompt):字符串类型 - 原始生成响应(raw_generation_responses):字符串序列 - 生成结果(generations):字符串序列 - 标注模型(labelling_model):字符串类型 - 标注提示词(labelling_prompt):列表结构,包含: - 内容(content):字符串类型 - 角色(role):字符串类型 - 原始标注响应(raw_labelling_response):字符串类型 - 评分(rating):64位整型序列 - 评估维度(areas):列表结构,包含以下四项: - 真实性与可靠性(Authenticity & Reliability):结构体,包含: - 评分(rating):字符串类型 - 评价理由(rationale):字符串类型 - 清晰性与透明性(Clarity & Transparency):结构体,包含评分与评价理由,类型同上 - 意图符合性(Compliance with Intent):结构体,包含评分与评价理由,类型同上 - 实际准确性(Practical Accuracy):结构体,包含评分与评价理由,类型同上 数据拆分: - 训练集(train):数据字节数18658217,样本量1000 下载大小:7709122 字节,数据集存储大小:18658217 字节 配置项: - 默认配置(default):数据文件包含: - 训练集拆分,路径为 data/train-* ## 「ultrafeedback-prompts-ultrajudge-gpt35」数据集卡片 [需补充更多数据集卡片贡献相关信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
gabrielmbmb
原始信息汇总

数据集概述

数据集信息

特征

  • input: 类型为字符串。
  • generation_model: 类型为字符串。
  • generation_prompt: 类型为字符串。
  • raw_generation_responses: 类型为字符串序列。
  • generations: 类型为字符串序列。
  • labelling_model: 类型为字符串。
  • labelling_prompt: 包含以下字段:
    • content: 类型为字符串。
    • role: 类型为字符串。
  • raw_labelling_response: 类型为字符串。
  • rating: 类型为整数序列。
  • areas: 包含以下字段:
    • Authenticity & Reliability: 包含以下字段:
      • rating: 类型为字符串。
      • rationale: 类型为字符串。
    • Clarity & Transparency: 包含以下字段:
      • rating: 类型为字符串。
      • rationale: 类型为字符串。
    • Compliance with Intent: 包含以下字段:
      • rating: 类型为字符串。
      • rationale: 类型为字符串。
    • Practical Accuracy: 包含以下字段:
      • rating: 类型为字符串。
      • rationale: 类型为字符串。

分割

  • train: 包含1000个样本,占用18658217字节。

大小

  • 下载大小: 7709122字节。
  • 数据集大小: 18658217字节。

配置

  • default: 包含训练数据文件,路径为data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作