mteb/norquad_retrieval
收藏Hugging Face2025-05-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/mteb/norquad_retrieval
下载链接
链接失效反馈官方服务:
资源简介:
NorQuadRetrieval是一个针对挪威维基百科文章的人工问题回答数据集,它是MTEB(大规模文本嵌入基准)的一部分。该数据集包含了为挪威维基百科文章创建的人工问题,用于文本检索任务,特别是多选问答。
NorQuadRetrieval is a dataset of human-created questions for Norwegian Wikipedia passages, which is part of MTEB (Massive Text Embedding Benchmark). The dataset is used for text retrieval tasks, especially multiple-choice question answering.
提供机构:
mteb
原始信息汇总
数据集概述
数据集特征
- id:字符串类型
- context:字符串类型
- question:字符串类型
- answers:结构体类型,包含:
- answer_start:整数序列类型
- text:字符串序列类型
数据集划分
- 训练集:
- 大小:2350752字节
- 示例数:1024
- 验证集:
- 大小:588509字节
- 示例数:256
- 测试集:
- 大小:4687874字节
- 示例数:2048
数据集大小
- 下载大小:3083620字节
- 数据集总大小:7627135字节



