Cohere/wikipedia-22-12-es-embeddings

Name: Cohere/wikipedia-22-12-es-embeddings
Creator: Cohere
Published: 2023-03-22 16:53:23
License: 暂无描述

Hugging Face2023-03-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Cohere/wikipedia-22-12-es-embeddings

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用cohere.ai的`multilingual-22-12`嵌入模型对西班牙语维基百科进行编码，生成了每篇文章的标题、文本及其对应的嵌入向量。该嵌入模型支持100种语言的语义搜索。数据集还提供了加载数据和进行语义搜索的示例代码，并展示了该模型在MIRACL数据集上的性能表现。

提供机构：

Cohere

原始信息汇总

数据集概述

数据集可通过以下Python代码加载： python from datasets import load_dataset docs = load_dataset("Cohere/wikipedia-22-12-es-embeddings", split="train")
也可通过流式加载，无需预先下载： python from datasets import load_dataset docs = load_dataset("Cohere/wikipedia-22-12-es-embeddings", split="train", streaming=True)

5,000+

优质数据集

54 个

任务类型

进入经典数据集