five

hugfaceguy0001/ChatGPTGroundTruth

收藏
Hugging Face2023-08-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hugfaceguy0001/ChatGPTGroundTruth
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: openrail task_categories: - question-answering language: - en tags: - science pretty_name: ChatGPT ground truth size_categories: - 10K<n<100K configs: - config_name: main_data data_files: "ground_truth.jsonl" --- # ChatGPT ground truth dataset This dataset is generated by ChatGPT and contains factual questions and corresponding answers from 160 subfields across natural and social sciences. Specifically, the dataset covers eight major domains: mathematics, physics, chemistry, biology, medicine, engineering, computer science, and social sciences. Within each domain, 20 specific subfields are selected, with 500 question-answer pairs per subfield, resulting in a total of 80,000 question-answer pairs. The language used in this dataset is English. Accompanying the release of this dataset is the script code used to generate it. # ChatGPT基准事实数据集 本数据集由ChatGPT自动生成,包含自然科学和社会科学的160个细分领域的事实性问题和相应的答案。 具体来说,本数据集涵盖数学、物理、化学、生物学、医学、工程、计算机科学、社会科学八大领域,每个领域选择了20个细分子领域,每个子领域有500个问答对,共80000个问答对。 本数据集的语言为英文。 和本数据集同时发布的还有生成本数据集使用的脚本代码。
提供机构:
hugfaceguy0001
原始信息汇总

ChatGPT ground truth dataset

概述

本数据集由ChatGPT自动生成,包含自然科学和社会科学的160个细分领域的事实性问题和相应的答案。

详细信息

  • 领域覆盖:数学、物理、化学、生物学、医学、工程、计算机科学、社会科学
  • 细分领域数量:每个领域20个细分领域
  • 问答对数量:每个细分领域500个问答对,总计80,000个问答对
  • 语言:英文

文件配置

  • 配置名称:main_data
  • 数据文件:ground_truth.jsonl
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作