HAVIT_QnA_v2
收藏Hugging Face2026-03-19 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/Masamsa/HAVIT_QnA_v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两种配置:'code_preference_pairs_dpo'和'default'。'code_preference_pairs_dpo'配置包含4139个训练样本、517个验证样本和518个测试样本,总大小约6.4MB。每个样本包含提示词(prompt)、优选代码(chosen)、次选代码(rejected)等字段,以及源代码问题(source_question)、答案(source_answer)、类别(category)、话题标签(topic_tag)、语言(language)、数据来源(source_split)、错误类型(bug_family)和配对ID(pair_id)等元数据。'default'配置包含相同数量的样本,总大小约1.6MB,采用消息列表格式(messages),每条消息包含内容(content)和角色(role),并附加类别(category)、话题标签(topic_tag)和语言(language)信息。数据集适用于代码偏好学习、对话系统训练等自然语言处理任务。
创建时间:
2026-03-05



