AniPersonaCaps|动漫角色数据集|数据集数据集
收藏AniPersonaCaps 数据集概述
基本信息
- 许可证: CC BY 4.0
- 任务类别: 图像到文本
- 语言: 英语
- 标签: 动漫、描述、外观、个性、粉丝
- 数据规模: 10K<n<100K
- 别名: multimodal
数据集简介
AniPersonaCaps 是一个包含动漫角色及其详细外观和个性描述的沉浸式数据集。该数据集汇集了来自 1000 多部受欢迎的动漫作品中的 45,000 多个独特角色。数据主要来源于 Fandom Wiki,由全球动漫粉丝精心编写。
数据集更新
- 2024.11.06: AniPersonaCaps 初始版本发布
数据统计
数据集展示了角色创建年份和动漫角色的统计信息。
数据展示
数据集提供两种展示方式:
- 表格视图: 展示角色图像、名称、外观和个性描述。
- JSON 视图: 提供详细的元数据,包括文件名、标题、角色名称、外观描述、个性描述和来源 URL。
预期用途
- 图像描述(外观描述和个性推断)
- 图像文本匹配
- 动漫角色研究
已知问题
- 网络抓取逻辑存在问题,导致一些深度嵌套的角色类别页面被意外排除。
- 数据集内容范围有限,某些动漫作品可能被遗漏。
- 文本内容可能与图像不匹配,特别是当外观描述过长或图像不完整时。
下一步计划
- 更新 AniPersonaCaps
- 即将推出 GamePersonaCaps

CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
全国 1∶200 000 数字地质图(公开版)空间数据库
As the only one of its kind, China National Digital Geological Map (Public Version at 1∶200 000 scale) Spatial Database (CNDGM-PVSD) is based on China' s former nationwide measured results of regional geological survey at 1∶200 000 scale, and is also one of the nationwide basic geosciences spatial databases jointly accomplished by multiple organizations of China. Spatially, it embraces 1 163 geological map-sheets (at scale 1: 200 000) in both formats of MapGIS and ArcGIS, covering 72% of China's whole territory with a total data volume of 90 GB. Its main sources is from 1∶200 000 regional geological survey reports, geological maps, and mineral resources maps with an original time span from mid-1950s to early 1990s. Approved by the State's related agencies, it meets all the related technical qualification requirements and standards issued by China Geological Survey in data integrity, logic consistency, location acc racy, attribution fineness, and collation precision, and is hence of excellent and reliable quality. The CNDGM-PVSD is an important component of China' s national spatial database categories, serving as a spatial digital platform for the information construction of the State's national economy, and providing informationbackbones to the national and provincial economic planning, geohazard monitoring, geological survey, mineral resources exploration as well as macro decision-making.
DataCite Commons 收录