080-ai/mcq_ps_v1

Name: 080-ai/mcq_ps_v1
Creator: 080-ai
Published: 2024-03-19 23:50:23
License: 暂无描述

Hugging Face2024-03-19 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/080-ai/mcq_ps_v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含1000个多项选择题，这些题目来源于公开的主要源文件，并使用GPT-3.5-Turbo-0125生成。生成过程包括总结文档或获取直接引用，然后基于段落生成问题，并生成多项选择题和正确答案的理由。数据集的局限性在于生成问题的Python脚本和GPT-3.5-Turbo的回复往往使A成为正确答案，这可能导致新训练的模型在选择答案时偏向于A。

提供机构：

080-ai

原始信息汇总

数据集概述

数据集名称: Multiple Choice Questions - Primary Sources
数据集大小: 1000道多项选择题
数据来源: 公开可用的原始文献
生成方法: 使用GPT-3.5-Turbo-0125模型，通过总结文献段落或直接引用，生成多项选择题及正确答案的解释。

限制与注意事项

生成偏差: 生成的多项选择题中，选项"A"作为正确答案的概率较高，可能导致训练模型在猜测时偏向选择"A"。
建议改进: 需要对生成过程进行调整，以确保选项A-D的分布更加随机，避免未来训练数据中出现类似问题。

5,000+

优质数据集

54 个

任务类型

进入经典数据集