five

chargoddard/Open-Platypus-Chat-Judged

收藏
Hugging Face2023-08-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chargoddard/Open-Platypus-Chat-Judged
下载链接
链接失效反馈
官方服务:
资源简介:
这是[Open-Platypus-Chat](https://huggingface.co/datasets/chargoddard/Open-Platypus-Chat)数据集,其质量由[TheBloke/OpenOrca-Platypus2-13B-GPTQ](https://huggingface.co/TheBloke/OpenOrca-Platypus2-13B-GPTQ)进行评估。每一行数据都标注了一个1到5分的评分,并附有简短的评分解释。由于评估模型相对较小且是量化模型,这些评分并不完美。这是数据集精炼实验的第一轮迭代,不应将此数据集视为绝对真理。

这是[Open-Platypus-Chat](https://huggingface.co/datasets/chargoddard/Open-Platypus-Chat)数据集,其质量由[TheBloke/OpenOrca-Platypus2-13B-GPTQ](https://huggingface.co/TheBloke/OpenOrca-Platypus2-13B-GPTQ)进行评估。每一行数据都标注了一个1到5分的评分,并附有简短的评分解释。由于评估模型相对较小且是量化模型,这些评分并不完美。这是数据集精炼实验的第一轮迭代,不应将此数据集视为绝对真理。
提供机构:
chargoddard
原始信息汇总

数据集信息

配置名称:best_rated

  • 特征:
    • id: 类型为 string
    • rating: 结构体,包含以下字段:
      • analysis: 类型为 string
      • judge: 类型为 string
      • score: 类型为 int64
    • conversations: 列表,包含以下字段:
      • from: 类型为 string
      • value: 类型为 string
  • 分割:
    • train: 字节数为 16455644.962765958,样本数为 10236
  • 下载大小: 7071171
  • 数据集大小: 16455644.962765958

配置名称:default

  • 特征:
    • id: 类型为 string
    • rating: 结构体,包含以下字段:
      • analysis: 类型为 string
      • judge: 类型为 string
      • score: 类型为 int64
    • conversations: 列表,包含以下字段:
      • from: 类型为 string
      • value: 类型为 string
  • 分割:
    • train: 字节数为 39894811,样本数为 24816
  • 下载大小: 18554361
  • 数据集大小: 39894811

配置名称:worst_rated

  • 特征:
    • id: 类型为 string
    • rating: 结构体,包含以下字段:
      • analysis: 类型为 string
      • judge: 类型为 string
      • score: 类型为 int64
    • conversations: 列表,包含以下字段:
      • from: 类型为 string
      • value: 类型为 string
  • 分割:
    • train: 字节数为 236320.80984042553,样本数为 147
  • 下载大小: 125546
  • 数据集大小: 236320.80984042553

配置文件

  • 配置名称: best_rated
    • 数据文件:
      • split: train
      • path: best_rated/train-*
  • 配置名称: default
    • 数据文件:
      • split: train
      • path: data/train-*
  • 配置名称: worst_rated
    • 数据文件:
      • split: train
      • path: worst_rated/train-*

大小类别

  • 10K<n<100K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作