080-ai/mcq_ps_v1
收藏Hugging Face2024-03-19 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/080-ai/mcq_ps_v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含1000个多项选择题,这些题目来源于公开的主要源文件,并使用GPT-3.5-Turbo-0125生成。生成过程包括总结文档或获取直接引用,然后基于段落生成问题,并生成多项选择题和正确答案的理由。数据集的局限性在于生成问题的Python脚本和GPT-3.5-Turbo的回复往往使A成为正确答案,这可能导致新训练的模型在选择答案时偏向于A。
该数据集包含1000个多项选择题,这些题目来源于公开的主要源文件,并使用GPT-3.5-Turbo-0125生成。生成过程包括总结文档或获取直接引用,然后基于段落生成问题,并生成多项选择题和正确答案的理由。数据集的局限性在于生成问题的Python脚本和GPT-3.5-Turbo的回复往往使A成为正确答案,这可能导致新训练的模型在选择答案时偏向于A。
提供机构:
080-ai
原始信息汇总
数据集概述
- 数据集名称: Multiple Choice Questions - Primary Sources
- 数据集大小: 1000道多项选择题
- 数据来源: 公开可用的原始文献
- 生成方法: 使用GPT-3.5-Turbo-0125模型,通过总结文献段落或直接引用,生成多项选择题及正确答案的解释。
限制与注意事项
- 生成偏差: 生成的多项选择题中,选项"A"作为正确答案的概率较高,可能导致训练模型在猜测时偏向选择"A"。
- 建议改进: 需要对生成过程进行调整,以确保选项A-D的分布更加随机,避免未来训练数据中出现类似问题。



