krasserm/wikipedia-2023-11-en-index
收藏Hugging Face2024-06-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/krasserm/wikipedia-2023-11-en-index
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含为`bot-with-plan`项目中的`SearchWikipediaTool`工具提供的索引文件。数据集基于`krasserm/wikipedia-2023-11-en-embed-mxbai-int8-binary`,包含以下文件:`faiss-ubinary.index`(存储二进制嵌入)、`usearch-int8-index`(存储int8嵌入)和`document-url-mappings.sqlite`(存储文档URL到文本块索引的映射)。README还提供了一个代码示例,展示了如何使用这些索引文件与`SearchWikipediaTool`进行交互。
该数据集包含为`bot-with-plan`项目中的`SearchWikipediaTool`工具提供的索引文件。数据集基于`krasserm/wikipedia-2023-11-en-embed-mxbai-int8-binary`,包含以下文件:`faiss-ubinary.index`(存储二进制嵌入)、`usearch-int8-index`(存储int8嵌入)和`document-url-mappings.sqlite`(存储文档URL到文本块索引的映射)。README还提供了一个代码示例,展示了如何使用这些索引文件与`SearchWikipediaTool`进行交互。
提供机构:
krasserm
原始信息汇总
数据集概述
数据集名称
krasserm/wikipedia-2023-11-en-embed-mxbai-int8-binary
数据集内容
faiss-ubinary.index: Faiss 索引文件,包含二进制嵌入。usearch-int8-index: usearch 索引文件,包含 int8 嵌入。document-url-mappings.sqlite: SQLite 数据库文件,包含文档URL到文本块索引的映射。
数据集用途
用于 SearchWikipediaTool 工具,支持文本搜索和嵌入模型处理。



