AniPersonaCaps|动漫角色数据集|数据集数据集
收藏AniPersonaCaps 数据集概述
基本信息
- 许可证: CC BY 4.0
- 任务类别: 图像到文本
- 语言: 英语
- 标签: 动漫、描述、外观、个性、粉丝
- 数据规模: 10K<n<100K
- 别名: multimodal
数据集简介
AniPersonaCaps 是一个包含动漫角色及其详细外观和个性描述的沉浸式数据集。该数据集汇集了来自 1000 多部受欢迎的动漫作品中的 45,000 多个独特角色。数据主要来源于 Fandom Wiki,由全球动漫粉丝精心编写。
数据集更新
- 2024.11.06: AniPersonaCaps 初始版本发布
数据统计
数据集展示了角色创建年份和动漫角色的统计信息。
数据展示
数据集提供两种展示方式:
- 表格视图: 展示角色图像、名称、外观和个性描述。
- JSON 视图: 提供详细的元数据,包括文件名、标题、角色名称、外观描述、个性描述和来源 URL。
预期用途
- 图像描述(外观描述和个性推断)
- 图像文本匹配
- 动漫角色研究
已知问题
- 网络抓取逻辑存在问题,导致一些深度嵌套的角色类别页面被意外排除。
- 数据集内容范围有限,某些动漫作品可能被遗漏。
- 文本内容可能与图像不匹配,特别是当外观描述过长或图像不完整时。
下一步计划
- 更新 AniPersonaCaps
- 即将推出 GamePersonaCaps

YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
中国逐日降水数据集(1961-2022,0.1°/0.25°/0.5°)
CHM_PRE数据集基于中国境内及周边1961至今共2839个站点的日降水观测,在传统的“降水背景场 + 降水比值场”的数据集构建思路上,尝试应用月值降水约束和地形特征校正,并依据中国范围内约4万个高密度站点2015–2019年的日降水量插值后数据进行精度评价。经评估认为,CHM_PRE可以较好的表征降水的空间变异性,其日值时间序列与高密度站点日值降水观测结果之间的相关系数中位数为0.78,均方根误差中位数为8.8 mm/d,KGE值中位数为0.69,与目前常用的降水数据集(CGDPA、CN05.1、CMA V2.0)有很好的一致性。 数据集的时间范围为1961年至今,空间分辨率为0.1°、0.25°和0.5°,经纬度范围为18°N–54°N, 72°E–136°E。
国家青藏高原科学数据中心 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录