five

lighteval/trivia_qa

收藏
Hugging Face2023-10-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lighteval/trivia_qa
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: default features: - name: question dtype: string - name: question_id dtype: string - name: question_source dtype: string - name: entity_pages sequence: - name: doc_source dtype: string - name: filename dtype: string - name: title dtype: string - name: wiki_context dtype: string - name: search_results sequence: - name: description dtype: string - name: filename dtype: string - name: rank dtype: int32 - name: title dtype: string - name: url dtype: string - name: search_context dtype: string - name: answer struct: - name: aliases sequence: string - name: normalized_aliases sequence: string - name: matched_wiki_entity_name dtype: string - name: normalized_matched_wiki_entity_name dtype: string - name: normalized_value dtype: string - name: type dtype: string - name: value dtype: string splits: - name: train num_bytes: 106882730 num_examples: 138384 - name: validation num_bytes: 14059830 num_examples: 17944 - name: test num_bytes: 3667903 num_examples: 17210 download_size: 63926518 dataset_size: 124610463 - config_name: rc.nocontext features: - name: question dtype: string - name: question_id dtype: string - name: question_source dtype: string - name: entity_pages sequence: - name: doc_source dtype: string - name: filename dtype: string - name: title dtype: string - name: wiki_context dtype: string - name: search_results sequence: - name: description dtype: string - name: filename dtype: string - name: rank dtype: int32 - name: title dtype: string - name: url dtype: string - name: search_context dtype: string - name: answer struct: - name: aliases sequence: string - name: normalized_aliases sequence: string - name: matched_wiki_entity_name dtype: string - name: normalized_matched_wiki_entity_name dtype: string - name: normalized_value dtype: string - name: type dtype: string - name: value dtype: string splits: - name: train num_bytes: 106882730 num_examples: 138384 - name: validation num_bytes: 14059830 num_examples: 17944 - name: test num_bytes: 3667903 num_examples: 17210 download_size: 63926518 dataset_size: 124610463 configs: - config_name: default data_files: - split: test path: data/test-* - split: train path: data/train-* - split: validation path: data/validation-* - config_name: rc.nocontext data_files: - split: train path: rc.nocontext/train-* - split: validation path: rc.nocontext/validation-* - split: test path: rc.nocontext/test-* --- # Dataset Card for "trivia_qa" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: - 配置名称:default 特征: - 字段:问题(question),数据类型(data type):字符串(string) - 字段:问题ID(question_id),数据类型(data type):字符串(string) - 字段:问题来源(question_source),数据类型(data type):字符串(string) - 字段:实体页面(entity_pages),类型:序列(Sequence),其元素为结构体(Struct),包含: - 文档来源(doc_source):数据类型(data type):字符串(string) - 文件名(filename):数据类型(data type):字符串(string) - 标题(title):数据类型(data type):字符串(string) - 维基上下文(wiki_context):数据类型(data type):字符串(string) - 字段:搜索结果(search_results),类型:序列(Sequence),其元素为结构体(Struct),包含: - 描述(description):数据类型(data type):字符串(string) - 文件名(filename):数据类型(data type):字符串(string) - 排名(rank):数据类型(data type):32位整数(int32) - 标题(title):数据类型(data type):字符串(string) - 统一资源定位符(url):数据类型(data type):字符串(string) - 搜索上下文(search_context):数据类型(data type):字符串(string) - 字段:答案(answer),类型:结构体(Struct),包含: - 别名(aliases):字符串序列 - 归一化别名(normalized_aliases):字符串序列 - 匹配的维基实体名称(matched_wiki_entity_name):数据类型(data type):字符串(string) - 归一化匹配维基实体名称(normalized_matched_wiki_entity_name):数据类型(data type):字符串(string) - 归一化值(normalized_value):数据类型(data type):字符串(string) - 类型(type):数据类型(data type):字符串(string) - 值(value):数据类型(data type):字符串(string) 数据集划分: - 划分名称:训练集(train),字节数:106882730,样本数:138384 - 划分名称:验证集(validation),字节数:14059830,样本数:17944 - 划分名称:测试集(test),字节数:3667903,样本数:17210 下载大小:63926518 字节,数据集总大小:124610463 字节 - 配置名称:rc.nocontext 该配置的特征、数据集划分、字节数、样本数、下载大小及数据集总大小均与default配置一致。 配置项: - 配置名称:default,数据文件路径: - 测试集:data/test-* - 训练集:data/train-* - 验证集:data/validation-* - 配置名称:rc.nocontext,数据文件路径: - 训练集:rc.nocontext/train-* - 验证集:rc.nocontext/validation-* - 测试集:rc.nocontext/test-* # 「trivia_qa」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
lighteval
原始信息汇总

数据集概述

配置信息

  • config_name: default

    • features:
      • question: string
      • question_id: string
      • question_source: string
      • entity_pages: sequence
        • doc_source: string
        • filename: string
        • title: string
        • wiki_context: string
      • search_results: sequence
        • description: string
        • filename: string
        • rank: int32
        • title: string
        • url: string
        • search_context: string
      • answer: struct
        • aliases: sequence of string
        • normalized_aliases: sequence of string
        • matched_wiki_entity_name: string
        • normalized_matched_wiki_entity_name: string
        • normalized_value: string
        • type: string
        • value: string
    • splits:
      • train:
        • num_bytes: 106882730
        • num_examples: 138384
      • validation:
        • num_bytes: 14059830
        • num_examples: 17944
      • test:
        • num_bytes: 3667903
        • num_examples: 17210
    • download_size: 63926518
    • dataset_size: 124610463
  • config_name: rc.nocontext

    • features:
      • question: string
      • question_id: string
      • question_source: string
      • entity_pages: sequence
        • doc_source: string
        • filename: string
        • title: string
        • wiki_context: string
      • search_results: sequence
        • description: string
        • filename: string
        • rank: int32
        • title: string
        • url: string
        • search_context: string
      • answer: struct
        • aliases: sequence of string
        • normalized_aliases: sequence of string
        • matched_wiki_entity_name: string
        • normalized_matched_wiki_entity_name: string
        • normalized_value: string
        • type: string
        • value: string
    • splits:
      • train:
        • num_bytes: 106882730
        • num_examples: 138384
      • validation:
        • num_bytes: 14059830
        • num_examples: 17944
      • test:
        • num_bytes: 3667903
        • num_examples: 17210
    • download_size: 63926518
    • dataset_size: 124610463

数据文件路径

  • config_name: default

    • data_files:
      • test: data/test-*
      • train: data/train-*
      • validation: data/validation-*
  • config_name: rc.nocontext

    • data_files:
      • train: rc.nocontext/train-*
      • validation: rc.nocontext/validation-*
      • test: rc.nocontext/test-*
搜集汇总
数据集介绍
main_image_url
构建方式
在知识密集型问答领域,TriviaQA数据集的构建体现了严谨的学术追求。该数据集通过整合维基百科条目与网络搜索结果,构建了包含超过十三万条问答对的丰富语料。每条数据均包含原始问题、唯一标识符、问题来源,并关联了实体页面与搜索引擎返回的上下文文档。答案部分经过精心设计,不仅提供标准值,还收录了多种别名及其规范化形式,确保了评估的鲁棒性。这种多源证据融合的构建方式,为模型提供了从结构化与非结构化文本中推理答案的坚实基础。
使用方法
该数据集主要服务于开放域问答模型的训练与评估。研究者可通过HuggingFace平台便捷加载,利用其标准划分的训练集、验证集和测试集进行实验。在标准配置下,模型需要从关联的维基百科页面或搜索上下文中抽取或生成答案,以此检验阅读理解与信息整合能力。若选用rc.nocontext配置,则直接考察模型基于自身参数化知识的闭卷问答性能。其精细的答案标注支持多种评估指标,如精确匹配或对归一化答案的F1值计算,为全面衡量模型性能提供了可靠基准。
背景与挑战
背景概述
在自然语言处理领域,开放域问答系统的评估长期依赖于高质量、大规模的数据集。TriviaQA数据集由华盛顿大学的研究团队于2017年构建,旨在解决传统问答数据集在复杂阅读理解与事实性知识推理方面的局限性。该数据集的核心研究问题聚焦于如何让机器模型通过多文档证据进行深度推理,从而准确回答涉及广泛常识与琐碎知识的复杂问题。其独特之处在于每个问题均配备了从维基百科页面和网络搜索结果中提取的上下文文档,极大地推动了机器阅读理解与知识密集型问答任务的发展,对后续研究产生了深远影响。
当前挑战
TriviaQA数据集所针对的开放域问答任务,其核心挑战在于模型需具备强大的多文档信息整合与长距离依赖推理能力,以从海量、可能冗余或冲突的文本证据中精准定位答案。问题本身常涉及细粒度实体与复杂关系,要求模型超越表面匹配,进行深层的语义理解。在构建过程中,研究团队面临的主要挑战包括:如何确保所收集问题的多样性与难度分布,以全面评估模型性能;以及如何从异构来源(如维基百科与网络搜索)高效获取并清洗高质量的支撑文档,同时维持答案标注的准确性与一致性,避免引入噪声或偏差。
常用场景
经典使用场景
在开放域问答研究领域,TriviaQA数据集以其大规模、高质量的问答对而著称,常被用于评估和训练阅读理解模型。该数据集通过提供问题、相关文档(如维基百科页面和网络搜索结果)以及标准答案,构建了一个模拟真实知识检索与推理的环境。研究者通常利用该数据集训练模型从多源文本中提取或生成精确答案,从而检验模型在复杂语境下的信息整合与语义理解能力。
解决学术问题
TriviaQA有效应对了传统问答数据集中答案往往局限于单一文档片段的局限性,其设计强调对多文档信息的交叉验证与深层推理。该数据集推动了开放域问答系统在长文档理解、多跳推理以及噪声过滤等方面的研究进展,为解决模型在真实世界知识库中的泛化与鲁棒性问题提供了关键基准。其意义在于促进了问答技术从封闭域向开放域的范式转变,为构建更智能的知识驱动型人工智能奠定了数据基础。
实际应用
在实际应用层面,TriviaQA所支撑的技术可广泛应用于智能助手、教育辅导和知识管理系统。例如,基于该数据集训练的模型能够助力搜索引擎实现更精准的答案直接生成,提升用户获取信息的效率;在教育场景中,可辅助构建自动答疑系统,为学生提供即时、可靠的知识解答。这些应用不仅优化了人机交互体验,也推动了知识服务行业的智能化升级。
数据集最近研究
最新研究方向
在开放域问答领域,TriviaQA数据集作为一项重要基准,持续推动着模型对复杂事实性知识的理解与推理能力。当前研究聚焦于如何利用其丰富的上下文信息,如维基百科页面和网络搜索结果,来增强模型的多源证据整合与长文档理解。随着大语言模型在知识密集型任务中的广泛应用,该数据集被广泛用于评估模型在零样本或少样本设置下的泛化性能,以及探索检索增强生成技术的前沿进展。相关热点事件包括模型在挑战性问答竞赛中的表现,这些进展不仅深化了机器对结构化与非结构化知识的处理机制,也为人机交互系统的实用化奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作