TriviaHG

github2024-05-21 更新2024-05-31 收录

下载链接：

https://github.com/DataScienceUIBK/TriviaHG

下载链接

链接失效反馈

官方服务：

资源简介：

TriviaHG是一个专为问题回答中提示生成而设计的大型数据集。与传统数据集不同，TriviaHG为每个问题提供10个提示而非直接答案，鼓励用户通过批判性思维和推理来找出答案。数据集涵盖了不同类型和难度级别的问题，并分为训练、验证和测试集，以帮助调整和训练大型语言模型，提高提示生成的质量。

TriviaHG is a large-scale dataset specifically designed for prompt generation in question answering. Unlike traditional datasets, TriviaHG provides 10 prompts for each question instead of direct answers, encouraging users to find the answers through critical thinking and reasoning. The dataset covers questions of various types and difficulty levels, and is divided into training, validation, and test sets to assist in fine-tuning and training large language models, thereby improving the quality of prompt generation.

创建时间：

2023-12-23

原始信息汇总

TriviaHG数据集概述

数据集描述

TriviaHG 是一个专为问题回答中的提示生成设计的广泛数据集。与传统数据集不同，TriviaHG 为每个问题提供10个提示而非直接答案，鼓励用户进行批判性思维和推理以得出解决方案。该数据集覆盖了不同难度级别的各种问题类型，并分为训练、验证和测试集，便于大型语言模型的微调和训练，以生成高质量的提示。

数据集结构

TriviaHG 包含多个子数据集，每个子数据集包括训练、验证和测试集：

训练集：链接
验证集：链接
测试集：链接

数据集以JSON文件格式存储，包括训练、验证和测试阶段的相应文件。

数据集统计

部分	问题数量	提示数量
训练	14,645	140,973
验证	1,000	9,638
测试	1,000	9,619

框架与模型部署

数据集的Framework目录包含用于提示生成框架的关键文件，包括用于执行和探索框架代码的Framework.ipynb Jupyter Notebook。用户可通过Google Colab运行此笔记本，深入了解提示生成过程。

微调语言模型

已针对TriviaHG数据集微调了多个大型语言模型，包括LLaMA 7b, LLaMA 13b, 和 LLaMA 70b。这些模型可通过AnyScale.com提供的API函数访问，具体模型ID如下：

LLaMA 7b Finetuned: meta-llama/Llama-2-7b-chat-hf:Hint_Generator:X6odC0D
LLaMA 13b Finetuned: meta-llama/Llama-2-13b-chat-hf:Hint_Generator:ajid9Dr
LLaMA 70b Finetuned: meta-llama/Llama-2-70b-chat-hf:Hint_Generator:NispySP

评估

数据集提供了多种评估方法，包括人类评估回答和质量评估，以及模型性能评估。这些评估方法提供了对生成提示质量和模型效能的深入了解。

实体

Entities 目录包含一个JSON文件，其中包含50,000个实体，用于确定四分位距（IQR）以进行标准化。这些实体对于确保数据分布的稳健性和分析的准确性至关重要。

引用

Mozafari, Jamshid, Anubhav Jangra, and Adam Jatowt. "TriviaHG: A Dataset for Automatic Hint Generation from Factoid Questions." arXiv preprint arXiv:2403.18426 (2024).

搜集汇总

数据集介绍

构建方式

TriviaHG数据集的构建方式独具匠心，专注于从事实性问题中自动生成提示。该数据集不仅涵盖了多种问题类型和难度级别，还为每个问题提供了10个提示，而非直接答案。这种设计旨在激发用户的批判性思维和推理能力。数据集被细分为训练、验证和测试集，每个子集都以JSON文件的形式呈现，便于用户进行模型微调和训练。

使用方法

使用TriviaHG数据集时，用户可以通过访问相应的JSON文件来获取训练、验证和测试数据。数据集的结构清晰，便于直接导入和处理。此外，数据集还提供了微调后的语言模型，如LLaMA 7b、LLaMA 13b和LLaMA 70b，这些模型可以通过AnyScale.com的API进行访问和使用。用户可以通过CURL或Python脚本调用这些模型，生成高质量的提示。

背景与挑战

背景概述

TriviaHG数据集是由Jamshid Mozafari、Anubhav Jangra和Adam Jatowt于2024年创建的，旨在解决自动提示生成的问题。该数据集专注于从事实性问题中生成提示，而非直接提供答案，从而促进用户的批判性思维和推理能力。TriviaHG包含了14,645个训练问题和2,000个验证与测试问题，每个问题附带10个提示，覆盖了多种问题类型和难度级别。该数据集的独特设计不仅推动了大型语言模型的微调，还显著提升了提示生成的质量，对问答系统和教育领域具有深远影响。

当前挑战

TriviaHG数据集在构建过程中面临多项挑战。首先，生成高质量的提示需要复杂的自然语言处理技术，以确保提示的相关性、可读性和无歧义性。其次，数据集的多样性和广泛性要求模型能够处理不同类型和难度的问题，这对模型的泛化能力提出了高要求。此外，数据集的评估依赖于人工标注，这不仅耗时且成本高昂，同时人工标注的主观性也可能影响评估的客观性。最后，微调大型语言模型以适应特定任务，如提示生成，需要大量的计算资源和专业知识，这也是一个显著的挑战。

常用场景

经典使用场景

TriviaHG数据集的经典使用场景在于其独特的提示生成机制。该数据集不仅提供问题，还为每个问题生成10个提示，鼓励用户通过逻辑推理和批判性思维来推导答案。这种设计特别适用于教育和培训领域，帮助学习者在没有直接答案的情况下，通过提示逐步推理出正确答案，从而提升问题解决能力和知识理解深度。

解决学术问题

TriviaHG数据集解决了在自动提示生成领域的常见学术研究问题。传统的问答数据集通常直接提供答案，而TriviaHG通过生成提示，促使研究者探索更复杂的问题解决路径。这不仅推动了自然语言处理技术的发展，还为教育心理学和认知科学提供了新的研究视角，特别是在如何通过提示促进学习者的深度思考和问题解决能力方面。

实际应用

TriviaHG数据集在实际应用中展现出广泛的前景。在教育领域，它可以用于开发智能辅导系统，通过生成提示帮助学生自主学习。在企业培训中，该数据集可用于设计互动式培训模块，提升员工的逻辑思维和问题解决能力。此外，TriviaHG还可应用于娱乐和游戏行业，设计更具挑战性和趣味性的问答游戏，增强用户体验。

数据集最近研究