five

rominf/flibusta

收藏
Hugging Face2023-04-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rominf/flibusta
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集提供了对Flibusta网站上俄语书籍的便捷访问。数据集作者不认可将Flibusta用于非法目的,使用前请阅读“许可信息”。用户可以通过书籍标题加载特定书籍的数据,例如《战争与和平》。数据集包含书籍的作者、ID、文本内容、标题、URL等信息。
提供机构:
rominf
原始信息汇总

数据集概述

数据集名称

Dataset Card for Dataset Name

数据集摘要

本数据集提供方便访问的俄语书籍,托管于Flibusta网站(https://flibusta.is/)。数据集作者不支持将Flibusta用于非法目的,请在使用前阅读“许可信息”。

语言

俄语

数据集结构

数据实例

一个典型的数据实例包括:

  • author: 作者
  • id: 书籍ID
  • text: 文本内容
  • title: 书名
  • url: 书籍URL
  • url_txt: 文本URL

示例: json { author: Толстой Лев Николаевич, id: 169984, text: Том первый..., title: Война и мир. Книга 1, url: https://flibusta.is/b/169984, url_txt: https://flibusta.is/b/169984/txt, }

附加信息

许可信息

书籍存储于https://flibusta.is/,可能因法律原因在您的位置不可访问。请根据当地法律检查是否可以使用此数据集。Apache 2.0许可证仅适用于代码。

引用信息

@ONLINE{flibusta, author = "Флибуста", title = "Флибуста", url = "https://flibusta.is" }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作