Sefaria/hebrew_library
收藏Hugging Face2023-11-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sefaria/hebrew_library
下载链接
链接失效反馈官方服务:
资源简介:
Sefaria希伯来图书馆数据的导出。该数据代表了图书馆中标记为希伯来语的版本。数据集包含文本和元数据字段,文本字段表示库中的单个段落的文本,元数据字段包含URL、引用、版本标题、语言代码、文档类别、数据质量和页面排名等信息。
Sefaria希伯来图书馆数据的导出。该数据代表了图书馆中标记为希伯来语的版本。数据集包含文本和元数据字段,文本字段表示库中的单个段落的文本,元数据字段包含URL、引用、版本标题、语言代码、文档类别、数据质量和页面排名等信息。
提供机构:
Sefaria
原始信息汇总
数据集描述
这是Sefaria希伯来语图书馆数据的导出。该数据代表了图书馆中标记为希伯来语的多个版本。
数据结构
| 字段 | 描述 |
|---|---|
| text | 图书馆中单个段落的文本。段落通常代表一个最小单位的文本,通常是一个段落。 |
| metadata | 元数据的字典。具体结构如下。 |
元数据结构
| 字段 | 描述 |
|---|---|
| url | 该段落在Sefaria中的URL |
| ref | 该段落的规范引用。引用是一个独立于版本的唯一人类可读ID。不同版本的段落共享相同的引用。 |
| versionTitle | 该段落所属版本的标题。 |
| lang | 两字母语言代码。 |
| docCategory | 该段落的分类。对应于该段落书籍在Sefaria目录中的位置。 |
| dataQuality | 文本质量的估计。可以是“专业”或“用户”。 |
| pagerank | 使用Sefaria内部链接图计算的该段落的Pagerank。值越高表示该段落被来源更中心地引用。 |



