five

krasserm/wikipedia-2023-11-en-index

收藏
Hugging Face2024-06-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/krasserm/wikipedia-2023-11-en-index
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含为`bot-with-plan`项目中的`SearchWikipediaTool`工具提供的索引文件。数据集基于`krasserm/wikipedia-2023-11-en-embed-mxbai-int8-binary`,包含以下文件:`faiss-ubinary.index`(存储二进制嵌入)、`usearch-int8-index`(存储int8嵌入)和`document-url-mappings.sqlite`(存储文档URL到文本块索引的映射)。README还提供了一个代码示例,展示了如何使用这些索引文件与`SearchWikipediaTool`进行交互。

该数据集包含为`bot-with-plan`项目中的`SearchWikipediaTool`工具提供的索引文件。数据集基于`krasserm/wikipedia-2023-11-en-embed-mxbai-int8-binary`,包含以下文件:`faiss-ubinary.index`(存储二进制嵌入)、`usearch-int8-index`(存储int8嵌入)和`document-url-mappings.sqlite`(存储文档URL到文本块索引的映射)。README还提供了一个代码示例,展示了如何使用这些索引文件与`SearchWikipediaTool`进行交互。
提供机构:
krasserm
原始信息汇总

数据集概述

数据集名称

krasserm/wikipedia-2023-11-en-embed-mxbai-int8-binary

数据集内容

  • faiss-ubinary.index: Faiss 索引文件,包含二进制嵌入。
  • usearch-int8-index: usearch 索引文件,包含 int8 嵌入。
  • document-url-mappings.sqlite: SQLite 数据库文件,包含文档URL到文本块索引的映射。

数据集用途

用于 SearchWikipediaTool 工具,支持文本搜索和嵌入模型处理。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作