ag2435/qasper
收藏Hugging Face2024-05-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ag2435/qasper
下载链接
链接失效反馈官方服务:
资源简介:
这是一个预处理过的QASPER数据集,包含了默认配置和包含HTML的配置。数据集的使用方式是通过HuggingFace的`load_dataset`函数加载。与原始实现相比,该实现移除了`allennlp`的使用,并添加了基线模型,如QASPER(Longformer Encoder Decoder)和GPT-3.5-Turbo。此外,还替换了特殊标记以适应HuggingFace的Transformer分词器。
这是一个预处理过的QASPER数据集,包含了默认配置和包含HTML的配置。数据集的使用方式是通过HuggingFace的`load_dataset`函数加载。与原始实现相比,该实现移除了`allennlp`的使用,并添加了基线模型,如QASPER(Longformer Encoder Decoder)和GPT-3.5-Turbo。此外,还替换了特殊标记以适应HuggingFace的Transformer分词器。
提供机构:
ag2435
原始信息汇总
数据集概述
数据集配置
-
默认配置
- 训练集:
data/train_instances.json - 验证集:
data/dev_instances.json - 测试集:
data/test_instances.json
- 训练集:
-
包含HTML的配置
- 训练集:
data/train_instances_with_html.json - 验证集:
data/dev_instances_with_html.json - 测试集:
data/test_instances_with_html.json
- 训练集:
数据集使用
python from datasets import load_dataset
dataset = load_dataset("ag2435/qasper")



