five

masakhane/afriqa-prebuilt-sparse-indexes

收藏
Hugging Face2023-03-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/masakhane/afriqa-prebuilt-sparse-indexes
下载链接
链接失效反馈
官方服务:
资源简介:
Afriqa预建索引是用于预处理的Afriqa Wikipedia段落的预建Lucene倒排索引。该数据集主要用于文本检索任务,支持英语和法语,数据集大小在10万到100万之间。

The Afriqa Pre-built Index is a pre-built Lucene inverted index of preprocessed Afriqa Wikipedia passages. This dataset is primarily designed for text retrieval tasks, supports both English and French, and its size ranges from 100,000 to 1,000,000.
提供机构:
masakhane
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 文本检索
  • 语言: 英语、法语
  • 美观名称: Afriqa Wikipedia 100 Inverted Indices
  • 大小类别: 10万<n<100万

描述

  • 数据集内容: 预处理后的Afriqa Wikipedia段落的预构建Lucene倒排索引
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作