sharmaarushi17/HPCPerfOpt-MCQA
收藏Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sharmaarushi17/HPCPerfOpt-MCQA
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多项选择题-答案对。有三个测试文件,根据它们的创建方式分开:test1.csv 是通过手动收集教程等数据创建的,test2.csv 是通过抓取分析工具Codee的文档创建的,test3.csv 是通过ChatGPT生成的多项选择题创建的(需要更新格式并随机化答案)。
许可证:知识共享(Creative Commons,CC)
美观名称:高性能计算性能优化基准测试集(HPCPerfOpt,HPC Performance Optimization Benchmark) # 示例:SQuAD
# 配置项:
# - 单项选择题型(mcq-single)
# - 多项选择题型(mcq-multiple)
# - Rodinia-ChatGPT单项选择题型(rodinia-chatgpt-mcq)
# 数据集信息:
# # 特征项:
# # - 名称:{特征名称_0} # 示例:id
# # 数据类型:{特征数据类型_0} # 示例:int32
# # - 名称:{特征名称_1} # 示例:文本
# # 数据类型:{特征数据类型_1} # 示例:字符串
# # - 名称:{特征名称_2} # 示例:图像
# # 数据类型:{特征数据类型_2} # 示例:图像
# # SQuAD 示例:
# # - 名称:id
# # 数据类型:字符串
# # - 名称:标题
# # 数据类型:字符串
# # - 名称:上下文
# # 数据类型:字符串
# # - 名称:问题
# # 数据类型:字符串
# # - 名称:答案
# # 序列:
# # - 名称:文本
# # 数据类型:字符串
# # - 名称:答案起始位置
# # 数据类型:int32
# 配置名称:mcq-single # Glue 示例:sst2
# 数据集划分:
# - 名称:测试集(test) # 示例:训练集
# # 字节大小:{划分集字节数_0} # SQuAD 示例:79317110
# # 样本数量:{划分集样本数_0} # SQuAD 示例:87599
# # 下载总大小:{数据集下载大小} # SQuAD 示例:35142551
# # 数据集总大小:{数据集大小} # SQuAD 示例:89789763
# # - 配置名称:mcq-multiple
# # 数据文件:
# # - 划分集:测试集
# # 路径:"mcq-multiple.csv"
# # - 配置名称:rodinia-chatgpt
# # 数据文件:
# # - 划分集:测试集
# # 路径:"rodinia-chatgpt-mcq.csv"
# 任务类别:
# - 问答任务(question-answering)
# 标签:
# - 代码(code)
# 规模类别:
# - 样本数少于1000(n<1K)
本数据集包含多项选择题(Multiple Choice Question,MCQ)问答对。
本数据集共包含3个测试文件,按生成方式分类如下:
test1.csv:来自教程等渠道的手动采集数据
test2.csv:从性能分析工具Codee的官方文档中爬取的数据
test3.csv:ChatGPT生成的多项选择题(需优化格式并随机化答案选项)
提供机构:
sharmaarushi17
原始信息汇总
数据集概述
数据集名称
- 名称: HPCPerfOpt (HPC Performance Optimization Benchmark)
数据集配置
- 配置名称: mcq-single
数据集分割
- 分割名称: test
数据集描述
- 描述: 包含多选题答案对的数据集。
- 测试文件:
- test1.csv: 手动从教程等收集的数据
- test2.csv: 从Codee文档中抓取的数据
- test3.csv: ChatGPT生成的多选题(需更新格式并随机化答案)
数据集标签
- 任务类别: 问答
- 标签: 代码
- 大小类别: n<1K



