five

Sefaria/hebrew_library

收藏
Hugging Face2023-11-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sefaria/hebrew_library
下载链接
链接失效反馈
官方服务:
资源简介:
Sefaria希伯来图书馆数据的导出。该数据代表了图书馆中标记为希伯来语的版本。数据集包含文本和元数据字段,文本字段表示库中的单个段落的文本,元数据字段包含URL、引用、版本标题、语言代码、文档类别、数据质量和页面排名等信息。

Sefaria希伯来图书馆数据的导出。该数据代表了图书馆中标记为希伯来语的版本。数据集包含文本和元数据字段,文本字段表示库中的单个段落的文本,元数据字段包含URL、引用、版本标题、语言代码、文档类别、数据质量和页面排名等信息。
提供机构:
Sefaria
原始信息汇总

数据集描述

这是Sefaria希伯来语图书馆数据的导出。该数据代表了图书馆中标记为希伯来语的多个版本。

数据结构

字段 描述
text 图书馆中单个段落的文本。段落通常代表一个最小单位的文本,通常是一个段落。
metadata 元数据的字典。具体结构如下。

元数据结构

字段 描述
url 该段落在Sefaria中的URL
ref 该段落的规范引用。引用是一个独立于版本的唯一人类可读ID。不同版本的段落共享相同的引用。
versionTitle 该段落所属版本的标题。
lang 两字母语言代码。
docCategory 该段落的分类。对应于该段落书籍在Sefaria目录中的位置。
dataQuality 文本质量的估计。可以是“专业”或“用户”。
pagerank 使用Sefaria内部链接图计算的该段落的Pagerank。值越高表示该段落被来源更中心地引用。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作