QA_TVTS_2024_DATASET

Hugging Face2025-08-06 更新2025-08-07 收录

下载链接：

https://huggingface.co/datasets/vnu-llm2023-ftdata/QA_TVTS_2024_DATASET

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了从2024年越南河内国立大学技术大学招生计划自动生成的问答对(Q&A)。这些数据旨在用于评估问答系统在具体语境中的准确性，并能够追溯参考来源。数据集可用于验证教育-招生背景下的LLM模型，并评估LLM的检索、引用和准确回答的能力。

创建时间：

2025-08-06

原始信息汇总

数据集概述：QA_TVTS_2024_DATASET

数据集描述

数据集包含从越南国立大学河内技术大学2024年招生方案中自动生成的问答对（Q&A）。
目标：评估问答系统（QA）在精确上下文中的表现，并支持参考源的追溯。

使用目的

用于验证教育-招生背景下的LLM模型，服务于越南国立大学河内技术大学的招生咨询。
评估LLM在检索、引用和准确回答方面的能力。

数据来源

越南国立大学河内技术大学2024年招生方案，正式发布于学校官网。
由专家根据招生方案结构手动定义的主题列表。

数据生成方法

输入：
- 2024年招生方案的全文。
- 预期问题主题列表（如："XTT-ƯTXT"、"XT THPT QG"、"Xét học bạ"等）。
数据生成提示：
- 设计为标准结构，要求LLM生成问答对，提问者为考生/家长，回答者为招生咨询人员。
- 每个问题仅包含一个意图，难度分为0、1、2级（0级无需推理，1级需1-2步推理，2级需3步以上推理）。
- 回答必须准确、明确，并引用招生方案。
使用的LLM：
- Gemini 2.5 Pro。
- 按主题批量生成。
后处理：
- 检查JSON语法正确性。
- 删除重复问题和不达标回答（模糊、不明确）。
- 删除不必要部分（问候语、回答中的“是/否”开头）。
- 补充缺失的表格引用部分。

数据结构

每行为一个JSON对象，格式如下： json { "id": "<唯一ID>", "question": "<问题内容>", "answer": "<回答内容>", "reference": "<参考文本>", "multi_intent": "<true|false>", "insufficient_context": "<true|false>", "reasoning_level": "<0|1|2>", "topic": "<主题>", "question_type": "<何时|何地|谁|什么|多少|如何>" }

文件格式

200_QA_TVTS_Version_1.json：每行为一个JSON对象（JSON Lines格式）。
README.md：使用说明。
PROMPT_SINH_200_QA_TVTS.md：原始数据生成提示。

搜集汇总

数据集介绍

构建方式

在高等教育招生咨询领域，该数据集基于河内国家大学下属技术大学2024年招生方案全文，通过专家手动定义的主题框架构建。采用Gemini 2.5 Pro大语言模型，依据标准化提示模板批量生成问答对，模拟考生与招生顾问的对话场景。生成过程严格控制问题复杂度，分为无需推理、需1-2步推理及需3步以上推理三个层级，并确保答案精准可追溯。后续经过语法校验、去重过滤及参考文本补全等处理流程，保障数据质量。

使用方法

数据集采用JSON Lines格式存储，每个条目包含问题、答案、参考文本及元数据标注。使用者可通过解析json文件构建检索增强生成评估 pipeline，利用reference字段验证模型输出的可追溯性。multi_intent和reasoning_level字段支持针对复杂推理场景的模型能力分析，而topic分类便于开展领域特异性评估。该数据集主要服务于招生咨询场景的LLM验证，需注意商业用途需获得原始内容授权。

背景与挑战

背景概述

高等教育招生咨询领域的智能化发展催生了专业化问答数据集的构建需求。QA_TVTS_2024_DATASET由河内国家大学下属技术大学于2024年创建，专门针对招生政策问答场景设计。该数据集基于该校官方发布的2024年招生方案文档，采用大语言模型自动生成问答对，旨在推动教育领域问答系统的精确性与可追溯性研究。其核心研究问题聚焦于上下文感知的自动问答能力评估，为招生咨询服务的智能化转型提供了重要数据支撑。

当前挑战

该数据集致力于解决招生政策问答中的多层级推理挑战，包括简单事实检索与复杂逻辑推断问题。构建过程中面临三重技术难点：首先需要确保生成问答对与原始招生方案的语义一致性，避免大语言模型产生幻觉内容；其次需建立精细的推理难度分级体系，准确区分零阶直接检索与多步逻辑推理问题；最后要维护回答的确定性与可追溯性，要求每个答案均附带准确的文件段落引用，这对生成模型的控制能力提出了较高要求。

常用场景

经典使用场景

在教育技术领域，QA_TVTS_2024_DATASET主要应用于评估大语言模型在招生咨询场景中的问答性能。该数据集通过模拟真实考生与招生官员的对话情境，为模型提供精准的上下文理解测试环境，特别适用于检验模型在多层次推理任务中的表现，从直接信息检索到复杂逻辑推断均可覆盖。

解决学术问题

该数据集有效解决了检索增强生成系统中源文档追溯和答案准确性验证的关键学术问题。通过提供带有明确参考段落的问答对，它为研究社区建立了可验证的评估基准，显著提升了对话系统在专业领域输出的可靠性和透明度，对推动可信人工智能发展具有重要价值。

实际应用

在实际应用中，该数据集可直接部署于高校智能招生咨询系统，为考生提供24小时精准的招生政策解答。其结构化的问题分类和推理层级设计，能够支撑不同复杂程度的查询处理，显著减轻人工咨询压力，同时确保信息传递的规范性和一致性。

数据集最近研究