INSAIT-Institute/triviaqa-bgeval
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/INSAIT-Institute/triviaqa-bgeval
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: question_id
dtype: string
- name: question_source
dtype: string
- name: entity_pages
sequence:
- name: doc_source
dtype: string
- name: filename
dtype: string
- name: title
dtype: string
- name: wiki_context
dtype: string
- name: search_results
sequence:
- name: description
dtype: string
- name: filename
dtype: string
- name: rank
dtype: int32
- name: title
dtype: string
- name: url
dtype: string
- name: search_context
dtype: string
- name: answer
struct:
- name: aliases
sequence: string
- name: normalized_aliases
sequence: string
- name: matched_wiki_entity_name
dtype: string
- name: normalized_matched_wiki_entity_name
dtype: string
- name: normalized_value
dtype: string
- name: type
dtype: string
- name: value
dtype: string
splits:
- name: validation
num_bytes: 28295079
num_examples: 17944
download_size: 13929156
dataset_size: 28295079
configs:
- config_name: default
data_files:
- split: validation
path: data/validation-*
---
提供机构:
INSAIT-Institute
原始信息汇总
数据集概述
数据集特征
- 问题 (question)
- 数据类型: 字符串 (string)
- 问题ID (question_id)
- 数据类型: 字符串 (string)
- 问题来源 (question_source)
- 数据类型: 字符串 (string)
- 实体页面 (entity_pages)
- 序列特征:
- 文档来源 (doc_source)
- 数据类型: 字符串 (string)
- 文件名 (filename)
- 数据类型: 字符串 (string)
- 标题 (title)
- 数据类型: 字符串 (string)
- 维基上下文 (wiki_context)
- 数据类型: 字符串 (string)
- 文档来源 (doc_source)
- 序列特征:
- 搜索结果 (search_results)
- 序列特征:
- 描述 (description)
- 数据类型: 字符串 (string)
- 文件名 (filename)
- 数据类型: 字符串 (string)
- 排名 (rank)
- 数据类型: 整数 (int32)
- 标题 (title)
- 数据类型: 字符串 (string)
- URL (url)
- 数据类型: 字符串 (string)
- 搜索上下文 (search_context)
- 数据类型: 字符串 (string)
- 描述 (description)
- 序列特征:
- 答案 (answer)
- 结构特征:
- 别名 (aliases)
- 序列类型: 字符串 (string)
- 标准化别名 (normalized_aliases)
- 序列类型: 字符串 (string)
- 匹配的维基实体名称 (matched_wiki_entity_name)
- 数据类型: 字符串 (string)
- 标准化匹配的维基实体名称 (normalized_matched_wiki_entity_name)
- 数据类型: 字符串 (string)
- 标准化值 (normalized_value)
- 数据类型: 字符串 (string)
- 类型 (type)
- 数据类型: 字符串 (string)
- 值 (value)
- 数据类型: 字符串 (string)
- 别名 (aliases)
- 结构特征:
数据集分割
- 验证集 (validation)
- 字节数: 28295079
- 样本数: 17944
数据集大小
- 下载大小: 13929156 字节
- 数据集大小: 28295079 字节
配置
- 默认配置 (default)
- 数据文件:
- 验证集 (validation)
- 路径: data/validation-*
- 验证集 (validation)
- 数据文件:



