sakharamg/AviationQA
收藏Hugging Face2023-04-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sakharamg/AviationQA
下载链接
链接失效反馈官方服务:
资源简介:
AviationQA是一个合成数据集,包含从12,000份国家运输安全委员会(NTSB)报告中通过模板生成的100万条事实型问答对。这些问答对中的问题答案都是AviationKG中的实体。该数据集有助于研究人员深入了解飞机事故及其预防。
AviationQA is a synthetic dataset containing 1 million factual question-answer pairs generated via templates from 12,000 National Transportation Safety Board (NTSB) reports. The answers to all the question-answer pairs are entities from AviationKG. This dataset enables researchers to gain in-depth insights into aircraft accidents and their prevention.
提供机构:
sakharamg
原始信息汇总
数据集概述
基本信息
- 许可证: cc-by-4.0
- 任务类别: 问答
- 语言: 英语
- 标签:
- 问答
- 航空
- 知识图谱
- 数据集名称: AviationQA
数据集描述
- 来源论文: 《There is No Big Brother or Small Brother: Knowledge Infusion in Language Models for Link Prediction and Question Answering》
- 会议: ICON 2022 主会议
- 数据集创建: 通过使用模板从12,000份国家运输安全委员会(NTSB)报告中生成100万个事实型问答对。
- 数据集用途: 帮助研究人员深入了解飞机事故及其预防。
数据集示例
- 问题: What was the Aircraft Damage of the accident no. ERA22LA162?
- 答案: Substantial
- 问题: Where was the Destination of the accident no. ERA22LA162?
- 答案: Naples, GA (APH)
搜集汇总
数据集介绍

构建方式
AviationQA数据集的构建,采用合成数据的方法,从12,000份国家运输安全委员会(NTSB)报告中,利用模板生成100万对事实型问答(QA)对。这些QA对中的问题设计为答案为AviationKG知识图谱中出现的实体,旨在为研究人员提供关于飞机事故及其预防的洞见。
特点
该数据集的特点在于,它是一个合成数据集,专注于航空领域的事实型问答。AviationQA数据集不仅规模庞大,包含大量QA对,而且其构建基于真实的NTSB报告,确保了数据的真实性和准确性。此外,数据集中的答案均为AviationKG中的实体,便于研究者在知识图谱的背景下进行深入分析。
使用方法
使用AviationQA数据集,研究人员可以将其应用于链接预测和问答任务中,特别是当涉及到航空知识图谱的应用时。数据集以事实型QA对的形式提供,可以直接用于训练和评估语言模型在航空领域的问答能力。用户可以从HuggingFace的数据集库中获取该数据集,并根据具体任务需求进行相应的预处理和使用。
背景与挑战
背景概述
AviationQA数据集,于2022年随着论文'There is No Big Brother or Small Brother: Knowledge Infusion in Language Models for Link Prediction and Question Answering'的发表而诞生。该数据集由12,000份国家运输安全委员会(NTSB)报告合成,包含了100万对基于模板的事实性问题与答案。这些问题与答案的答案均来源于AviationKG知识图谱。AviationQA的构建旨在为研究人员提供航空事故及其预防的深入见解,对于航空知识领域的研究具有显著推动作用。
当前挑战
AviationQA数据集在构建过程中所面临的挑战主要包括:如何确保从NTSB报告中提取的信息的准确性与全面性;如何设计有效的模板以生成与AviationKG知识图谱相匹配的问答对;以及如何处理大规模数据集在存储、处理和分析上的技术难题。此外,在研究领域问题方面,AviationQA数据集所解决的挑战是如何利用知识图谱增强语言模型在链接预测与问题回答任务中的性能,以及如何提高模型在航空事故相关查询中的准确性和效率。
常用场景
经典使用场景
在自然语言处理领域,尤其是知识图谱与问题回答相结合的研究中,AviationQA数据集以其独特的合成问答对,成为探索语言模型知识融合能力的重要资源。该数据集由12,000份国家运输安全委员会报告生成的100万个事实型问答对构成,旨在训练模型对航空事故相关信息的理解与检索。
衍生相关工作
基于AviationQA数据集,研究者们已经开展了一系列相关工作,包括但不限于知识图谱的构建与优化、语言模型的知识融合技术、以及特定领域的问答系统设计等,这些工作进一步推动了航空领域智能化研究的深入发展。
数据集最近研究
最新研究方向
在航空知识图谱领域,最新研究方向体现在sakharamg/AviationQA数据集的构建与应用。该数据集基于12,000份国家运输安全委员会(NTSB)报告,通过模板生成一百万个事实型问答对,旨在为语言模型中的知识融合与链接预测提供研究资源。AviationQA数据集的问世,为探究飞机事故及其预防措施提供了深入洞察,其研究成果已在全球计算语言学会议ICON 2022上发表,彰显了该数据集在本领域的重大影响与意义。
以上内容由遇见数据集搜集并总结生成



