five

GriddleDean/mangaupdates

收藏
Hugging Face2024-06-25 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/GriddleDean/mangaupdates
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过爬取[mangaupdates](https://www.mangaupdates.com)网站获得的,包含了一个tar文件,其中包含了每个信息条目的JSON响应。这些数据被解析并添加到一个PostgreSQL数据库中。数据集包含漫画的相关信息,如标题、描述、类型、年份、最新章节、评分、流派、标签、作者、艺术家、出版商等。此外,还包含一些已删除条目的ID。

This dataset was obtained by scraping the [mangaupdates](https://www.mangaupdates.com) website and includes a tar file containing the JSON response for each info entry. The data was parsed and added to a PostgreSQL database. The dataset contains information about manga, such as titles, descriptions, types, year, latest chapter, ratings, genres, tags, authors, artists, publishers, etc. Additionally, it includes IDs of some removed entries.
提供机构:
GriddleDean
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 标签: 漫画, 标签, 类型, 爬取
  • 大小: 10万<数据量<100万

数据来源

数据内容

  • 包含一个tar文件,内含每个信息条目的JSON响应。
  • 部分已删除的条目信息可在“removed ids json”中找到。

数据结构

  • Info表: 包含ID、私有ID、公共ID、论坛ID、URL键、URL名称、标题、描述、图片名称、类型、年份、最新章节、评分、贝叶斯评分、类型、标签、标签投票、标签上传者、状态、授权状态、完成状态、作者、艺术家、原始出版商、英语出版商、出版信息、出版商关系、动画开始和结束日期、最后更新时间等字段。
  • Types表: 存储类型信息。
  • Genres表: 存储类型信息。
  • Tags表: 存储标签信息。
  • People表: 存储人物信息。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作