wanderer2k1/ViQuad2_possibles_question_positive_negatives
收藏Hugging Face2024-07-15 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/wanderer2k1/ViQuad2_possibles_question_positive_negatives
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于问答系统的训练和评估,包含问题、正面上下文以及硬负样本。数据集分为训练集、验证集和测试集,分别包含19238、2653和7301个样本。数据集的总下载大小为65771908字节,总数据集大小为204422358字节。
This dataset is primarily used for training and evaluating question-answering systems, containing questions, positive contexts, and hard negatives. The dataset is divided into training, validation, and test sets, containing 19238, 2653, and 7301 samples respectively. The total download size of the dataset is 65771908 bytes, and the total dataset size is 204422358 bytes.
提供机构:
wanderer2k1
原始信息汇总
数据集概述
数据集特征
- question_id: 问题ID,数据类型为字符串。
- question: 问题内容,数据类型为字符串。
- positive_context_id: 正样本上下文ID,数据类型为字符串。
- positive_context: 正样本上下文内容,数据类型为字符串。
- hard_negative_ids: 硬负样本ID,数据类型为字符串。
- hard_negatives: 硬负样本内容,数据类型为字符串。
数据集划分
- train: 训练集,包含19238个样本,占用135172668字节。
- validation: 验证集,包含2653个样本,占用18215556字节。
- test: 测试集,包含7301个样本,占用51034134字节。
数据集大小
- 下载大小: 65771908字节
- 总大小: 204422358字节
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



