coseal/CodeUltraFeedback_binarized
收藏Hugging Face2024-03-18 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/coseal/CodeUltraFeedback_binarized
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: instruction
dtype: string
- name: preference
dtype: string
- name: models
sequence: string
- name: responses
list:
- name: model
dtype: string
- name: response
dtype: string
- name: annotations
list:
- name: model
dtype: string
- name: rating
dtype: string
- name: rationale
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
- name: rating_chosen
dtype: int64
- name: rating_rejected
dtype: int64
- name: model_chosen
dtype: string
- name: model_rejected
dtype: string
splits:
- name: train
num_bytes: 122438403
num_examples: 9500
download_size: 52525597
dataset_size: 122438403
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
license: mit
task_categories:
- text-generation
tags:
- AI feedback
- llm-as-a-judge
- code generation
- preference dataset
- coding preferences
- codeultrafeedback
size_categories:
- 1K<n<10K
---
Instructions coming soon
提供机构:
coseal
原始信息汇总
数据集概述
数据集信息
-
特征列表:
instruction: 数据类型为stringpreference: 数据类型为stringmodels: 数据类型为string的序列responses: 列表,包含以下字段:model: 数据类型为stringresponse: 数据类型为string
annotations: 列表,包含以下字段:model: 数据类型为stringrating: 数据类型为stringrationale: 数据类型为string
chosen: 数据类型为stringrejected: 数据类型为stringrating_chosen: 数据类型为int64rating_rejected: 数据类型为int64model_chosen: 数据类型为stringmodel_rejected: 数据类型为string
-
数据分割:
train: 包含 9500 个样本,占用 122438403 字节
-
数据集大小:
- 下载大小: 52525597 字节
- 数据集大小: 122438403 字节
配置信息
- 配置名称:
default - 数据文件:
train: 路径为data/train-*
许可证
- MIT 许可证
任务类别
- 文本生成
标签
- AI反馈
- 大型语言模型作为评判
- 代码生成
- 偏好数据集
- 编码偏好
- CodeUltraFeedback
大小类别
- 1K<n<10K



