LetsChurch/bible-embeddings
收藏Hugging Face2025-09-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LetsChurch/bible-embeddings
下载链接
链接失效反馈官方服务:
资源简介:
Bible Embeddings是一个预训练模型集合,用于将圣经文本转换为向量表示。这些模型可以帮助进行文本相似度计算、分类等任务。README文件中列出了多个预训练模型,包括answerdotai/ModernBERT系列、BAAI/bge系列、ibm-granite/granite-embedding系列、intfloat/e5系列、jinaai/jina-embeddings-v3、nvidia/NV-Embed-V2、sentence-transformers/all-MiniLM-L6-v2、Salesforce/SFR-Embedding-Mistral、text-embedding系列、thenlper/gte系列和voyage-3。
Bible Embeddings is a collection of pre-trained models used for embedding Bible texts into vector representations. These models can be used for tasks such as text similarity calculation and classification. The README file lists various pre-trained models, including answerdotai/ModernBERT series, BAAI/bge series, ibm-granite/granite-embedding series, intfloat/e5 series, jinaai/jina-embeddings-v3, nvidia/NV-Embed-V2, sentence-transformers/all-MiniLM-L6-v2, Salesforce/SFR-Embedding-Mistral, text-embedding series, thenlper/gte series, and voyage-3.
提供机构:
LetsChurch
原始信息汇总
数据集概述
数据集名称
- Bible Embeddings
数据集内容
- 数据集包含了《圣经》中的多个书籍的嵌入信息,如《创世纪》、《出埃及记》和《利未记》等。
- 每个书籍下分为多个章节,每个章节包含一个以
bsb-bge-large-en.json命名的JSON文件。
模型信息
- 数据集使用了多种模型进行嵌入处理,包括但不限于:
- BAAI/bge-large-en:1024维度,BSB大小为899.769 MB。
- BAAI/bge-base-en:768维度,BSB大小为674.226 MB。
- BAAI/bge-small-en:384维度,BSB大小为338.351 MB。
- 以及其他多个模型,详细信息可参考数据集中的模型列表。
查询示例
- 数据集提供了多个查询示例,展示了不同模型对特定查询的响应准确性。
- 示例包括对《圣经》中特定概念的查询,如“God is love”、“They meant bad but God meant good”等,并列出了各个模型返回的相关经文及其相关性评分。



