five

HAVIT_QnA_v2

收藏
Hugging Face2026-03-19 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/Masamsa/HAVIT_QnA_v2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两种配置:'code_preference_pairs_dpo'和'default'。'code_preference_pairs_dpo'配置包含4139个训练样本、517个验证样本和518个测试样本,总大小约6.4MB。每个样本包含提示词(prompt)、优选代码(chosen)、次选代码(rejected)等字段,以及源代码问题(source_question)、答案(source_answer)、类别(category)、话题标签(topic_tag)、语言(language)、数据来源(source_split)、错误类型(bug_family)和配对ID(pair_id)等元数据。'default'配置包含相同数量的样本,总大小约1.6MB,采用消息列表格式(messages),每条消息包含内容(content)和角色(role),并附加类别(category)、话题标签(topic_tag)和语言(language)信息。数据集适用于代码偏好学习、对话系统训练等自然语言处理任务。
创建时间:
2026-03-05
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作