Thanmay/xquad-hi
收藏Hugging Face2024-06-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Thanmay/xquad-hi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如id、标题、上下文、问题、答案、答案起始位置、类别、聚类、最近聚类和最近页面。这些特征以不同的数据类型存储,包括字符串、整数序列和结构化数据。数据集仅包含一个验证集,大小为36745196字节,包含1190个示例。数据集的下载大小为1189437字节。
The dataset contains multiple features such as id, title, context, question, answers, answer_start, category, cluster, nearest_clusters, and nearest_pages. These features are stored in various data types including strings, integer sequences, and structured data. The dataset includes only a validation set, which is 36745196 bytes in size and contains 1190 examples. The download size of the dataset is 1189437 bytes.
提供机构:
Thanmay
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为字符串。
- title: 数据类型为字符串。
- context: 包含两个子特征:
- en: 数据类型为字符串。
- hi: 数据类型为字符串。
- question: 包含两个子特征:
- en: 数据类型为字符串。
- hi: 数据类型为字符串。
- answers: 包含两个子特征:
- en: 数据类型为字符串序列。
- hi: 数据类型为字符串序列。
- answer_start: 包含两个子特征:
- en: 数据类型为整数序列。
- hi: 数据类型为整数序列。
- category: 数据类型为字符串序列。
数据集分割
- validation:
- 数据大小: 3913548 字节
- 示例数量: 1190
数据集大小
- 下载大小: 533454 字节
- 数据集总大小: 3913548 字节
配置
- config_name: default
- data_files:
- split: validation
- path: data/validation-*



