five

minfeng-ai/leetcode_preference

收藏
Hugging Face2023-09-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/minfeng-ai/leetcode_preference
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于支持基于Direct Preference Optimization(DPO)的实验,该优化方法在论文《Direct Preference Optimization: Your Language Model is Secretly a Reward Model》中有详细介绍。数据集包含由CodeLLaMA-7b生成的每道LeetCode问题的两个独特解决方案,这些解决方案由人类专家根据其准确性、效率和可读性进行评估和排名。数据集中的每一行包含以下字段:id(唯一标识符)、title(问题官方标题)、description(详细提示)、difficulty(难度分为简单、中等和困难三个等级)、version1(与问题相关的初始AI生成的代码片段)、version2(与同一问题相关的第二AI生成的代码片段)和preference(人类评估的标签,指示Version1和Version2之间的首选代码片段)。

该数据集用于支持基于Direct Preference Optimization(DPO)的实验,该优化方法在论文《Direct Preference Optimization: Your Language Model is Secretly a Reward Model》中有详细介绍。数据集包含由CodeLLaMA-7b生成的每道LeetCode问题的两个独特解决方案,这些解决方案由人类专家根据其准确性、效率和可读性进行评估和排名。数据集中的每一行包含以下字段:id(唯一标识符)、title(问题官方标题)、description(详细提示)、difficulty(难度分为简单、中等和困难三个等级)、version1(与问题相关的初始AI生成的代码片段)、version2(与同一问题相关的第二AI生成的代码片段)和preference(人类评估的标签,指示Version1和Version2之间的首选代码片段)。
提供机构:
minfeng-ai
原始信息汇总

Dataset Card for LeetCode Preference

Dataset Description

Dataset Summary

Usage

python from datasets import load_dataset

dataset = load_dataset("minfeng-ai/leetcode_preference")

Data Fields

  • id: Distinct identifier for each LeetCode question.
  • title: Official title of the LeetCode question.
  • description: Detailed prompt for the question.
  • difficulty: Question complexity categorized as Easy, Medium, or Hard.
  • version1: Initial AI-generated code snippet.
  • version2: Secondary AI-generated code snippet.
  • preference: Human-assessed label indicating the preferred code snippet between Version1 and Version2.
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作