manu/trivia_qa_wiki
收藏Hugging Face2023-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/manu/trivia_qa_wiki
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: question_id
dtype: string
- name: question_source
dtype: string
- name: entity_pages
sequence:
- name: doc_source
dtype: string
- name: filename
dtype: string
- name: title
dtype: string
- name: wiki_context
dtype: string
- name: search_results
sequence:
- name: description
dtype: string
- name: filename
dtype: string
- name: rank
dtype: int32
- name: title
dtype: string
- name: url
dtype: string
- name: search_context
dtype: string
- name: answer
struct:
- name: aliases
sequence: string
- name: normalized_aliases
sequence: string
- name: matched_wiki_entity_name
dtype: string
- name: normalized_matched_wiki_entity_name
dtype: string
- name: normalized_value
dtype: string
- name: type
dtype: string
- name: value
dtype: string
splits:
- name: validation
num_bytes: 430166050
num_examples: 7993
download_size: 234775285
dataset_size: 430166050
---
# Dataset Card for "trivia_qa_wiki_validation"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 字段名称:问题(question),数据类型:字符串(string)
- 字段名称:问题ID(question_id),数据类型:字符串(string)
- 字段名称:问题来源(question_source),数据类型:字符串(string)
- 字段名称:实体页面(entity_pages),数据类型为序列(sequence),包含子字段:
- 子字段名称:文档来源(doc_source),数据类型:字符串(string)
- 子字段名称:文件名(filename),数据类型:字符串(string)
- 子字段名称:标题(title),数据类型:字符串(string)
- 子字段名称:维基上下文(wiki_context),数据类型:字符串(string)
- 字段名称:搜索结果(search_results),数据类型为序列(sequence),包含子字段:
- 子字段名称:描述(description),数据类型:字符串(string)
- 子字段名称:文件名(filename),数据类型:字符串(string)
- 子字段名称:排名(rank),数据类型:32位整型(int32)
- 子字段名称:标题(title),数据类型:字符串(string)
- 子字段名称:统一资源定位符(url),数据类型:字符串(string)
- 子字段名称:搜索上下文(search_context),数据类型:字符串(string)
- 字段名称:答案(answer),数据类型为结构体(struct),包含子字段:
- 子字段名称:别名(aliases),数据类型为字符串序列
- 子字段名称:归一化别名(normalized_aliases),数据类型为字符串序列
- 子字段名称:匹配维基实体名称(matched_wiki_entity_name),数据类型:字符串(string)
- 子字段名称:归一化匹配维基实体名称(normalized_matched_wiki_entity_name),数据类型:字符串(string)
- 子字段名称:归一化值(normalized_value),数据类型:字符串(string)
- 子字段名称:类型(type),数据类型:字符串(string)
- 子字段名称:值(value),数据类型:字符串(string)
数据集划分:
- 划分名称:验证集(validation),字节数:430166050,样本数量:7993
下载大小:234775285
数据集本体大小:430166050
# 「trivia_qa_wiki_validation」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
manu
原始信息汇总
数据集概述
数据集名称
trivia_qa_wiki_validation
数据集特征
- question (字符串类型)
- question_id (字符串类型)
- question_source (字符串类型)
- entity_pages (序列类型)
- doc_source (字符串类型)
- filename (字符串类型)
- title (字符串类型)
- wiki_context (字符串类型)
- search_results (序列类型)
- description (字符串类型)
- filename (字符串类型)
- rank (整数类型,int32)
- title (字符串类型)
- url (字符串类型)
- search_context (字符串类型)
- answer (结构类型)
- aliases (序列,字符串类型)
- normalized_aliases (序列,字符串类型)
- matched_wiki_entity_name (字符串类型)
- normalized_matched_wiki_entity_name (字符串类型)
- normalized_value (字符串类型)
- type (字符串类型)
- value (字符串类型)
数据集分割
- validation
- 数据量: 430166050 字节
- 示例数量: 7993
数据集大小
- 下载大小: 234775285 字节
- 数据集总大小: 430166050 字节



