five

chuuhtetnaing/mm-lib-book-dataset

收藏
Hugging Face2025-04-01 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/chuuhtetnaing/mm-lib-book-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
MM-Lib缅甸书籍语料库数据集包含从MM-Lib网站提取的437本完整的书籍文本内容和元数据信息。这些书籍的原始文本是从EPUB文件中提取的,并包含了书籍链接、标题、封面图片链接、类别、作者名称、作者描述等元数据。

The MM-Lib Myanmar Book Corpus Dataset consists of 437 books with full-text content and metadata extracted from the MM-Lib website. The raw text content is extracted from EPUB files and includes metadata such as book links, titles, cover image links, categories, author names, and author descriptions.
提供机构:
chuuhtetnaing
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作