stanford-oval/wikipedia_20240801_10-languages_bge-m3_qdrant_index
收藏Hugging Face2024-08-24 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/stanford-oval/wikipedia_20240801_10-languages_bge-m3_qdrant_index
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从10种语言的维基百科HTML转储文件中预处理和分块创建的Qdrant索引。使用的嵌入模型是BAAI/bge-m3。该索引与WikiChat v2.0兼容,旨在通过维基百科的少样本接地来减少大型语言模型聊天机器人的幻觉问题。
This dataset contains a Qdrant index created from preprocessed and chunked Wikipedia HTML dumps in 10 languages. This index is a multilingual Wikipedia search index from the HTML dump of August 1, 2024.
提供机构:
stanford-oval



