National Space Centre Questions Dataset

Name: National Space Centre Questions Dataset
Creator: 莱斯特大学计算与数学科学系
Published: 2024-12-07 01:28:43
License: 暂无描述

arXiv2024-12-07 更新2024-12-10 收录

下载链接：

http://arxiv.org/abs/2412.05200v1

下载链接

链接失效反馈

官方服务：

资源简介：

National Space Centre Questions Dataset是由英国莱斯特国家航天中心收集的访客常见问题数据集。该数据集包含12个问题，涵盖了封闭式、开放式、发散式和通配符问题等多种类型，旨在评估前沿大型语言模型在科学中心问答互动中的适用性。数据集的创建过程包括从访客调查、工作人员培训记录和专家问答活动中收集问题，并筛选出具有代表性的问题。该数据集主要用于研究大型语言模型在教育环境中的应用，特别是如何在保持科学严谨性的同时提高访客的参与度和互动性。

提供机构：

莱斯特大学计算与数学科学系

创建时间：

2024-12-07

搜集汇总

数据集介绍

构建方式

该数据集通过从英国莱斯特国家航天中心收集游客的常见问题构建而成。研究团队从三个主要来源获取问题：游客调查中的问题、工作人员培训中记录的常见问题，以及面向成年太空爱好者的‘问专家’活动中的问题。这些问题经过筛选和分类，最终形成了一个包含12个问题的子集，分为封闭式、开放式、发散式和通配符问题四类，以确保数据集的多样性和代表性。

特点

该数据集的显著特点在于其问题类型的多样性，涵盖了从简单的事实性问题到需要创造性思维的开放性问题。此外，数据集中的问题反映了不同年龄段和知识水平的游客需求，使其在评估大型语言模型在科学中心问答系统中的适用性时具有广泛的应用价值。

使用方法

该数据集主要用于评估前沿大型语言模型（如GPT-4、Claude 3.5和Google Gemini 1.5）在科学中心问答系统中的表现。通过生成标准和创意两种类型的回答，并由航天中心的科学专家进行评估，研究者可以分析模型在准确性、清晰度、吸引力和创造性方面的表现，从而为科学中心的互动教育系统提供优化建议。

背景与挑战

背景概述

国家太空中心问题数据集（National Space Centre Questions Dataset）是由莱斯特大学计算与数学科学系的Jacob Watson、Fabrício Góes、Marco Volpe和Talles Medeiros等人创建的。该数据集旨在评估前沿大型语言模型（LLMs）在科学中心问答互动中的适用性，特别是针对8岁儿童的互动。数据集收集了来自英国莱斯特国家太空中心游客的常见问题，涵盖了封闭式、开放式、发散式和随机问题等多种类型。该研究的主要目标是探索LLMs在教育环境中，特别是在科学中心中，如何平衡创造性与事实准确性，以提升游客的参与度和教育效果。

当前挑战

该数据集面临的挑战主要集中在两个方面：一是如何确保LLMs在生成回答时既能保持高度的科学准确性，又能吸引年轻观众的兴趣；二是数据集构建过程中需要从不同来源（如游客调查、常见问题记录和专家问答活动）收集多样化的问题，确保数据集的广泛性和代表性。此外，LLMs在生成创造性回答时，往往会出现事实准确性下降的问题，如何在保持回答趣味性的同时避免信息失真，是该数据集和相关研究面临的主要技术难题。

常用场景

经典使用场景

National Space Centre Questions Dataset 最经典的使用场景在于评估前沿大型语言模型（LLMs）在科学中心问答交互中的适用性。该数据集通过收集科学中心游客的常见问题，帮助研究人员测试和比较不同LLMs在生成准确且富有创意的回答时的表现。这些问题涵盖了从封闭式问题到开放式问题，再到发散性和奇异问题，旨在全面评估模型在不同类型问题上的响应能力。

实际应用

在实际应用中，National Space Centre Questions Dataset 可用于开发和优化科学中心的互动问答系统。通过分析游客的常见问题，系统可以生成适合不同年龄段和知识水平的回答，从而提升游客的参与度和学习体验。此外，该数据集还可用于培训科学中心的讲解员，帮助他们更好地应对游客的多样化问题。

衍生相关工作

基于该数据集，研究人员可以进一步探索如何通过提示工程（prompt engineering）优化LLMs的输出，以在保持科学准确性的同时提升回答的吸引力和创意。此外，该数据集还可能激发更多关于如何在教育场景中有效利用LLMs的研究，特别是在如何平衡创造力与事实准确性方面的深入探讨。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集