Anime Face Dataset|动漫图像数据集|图像处理数据集
收藏Anime Face Dataset 概述
数据集基本信息
- 名称: Anime Face Dataset
- 包含内容: 63632张高质量动漫人脸图片
- 来源: 从www.getchu.com网站爬取,使用https://github.com/nagadomi/lbpcascade_animeface算法进行人脸裁剪
- 图片大小: 90 * 90 ~ 120 * 120像素
数据集特点
- 质量: 相比其他数据集(如danbooru),本数据集背景干净,色彩丰富
- 问题: 存在少量裁剪不佳和非人类面孔的图片
使用许可
- 目的: 仅供教育使用
- 引用要求: 使用时需引用数据集来源
数据集更新
- 版权问题: 由于版权问题,数据集已设为私有
- 替代方案: 提供爬虫和后处理脚本供自行爬取
- 未来计划: 将发布新版本的数据集爬取和后处理脚本
贡献方式
- 贡献: 欢迎添加高质量图片或图像标签
源代码
- 可用性: 提供开源的网页爬取和人脸检测代码
- 使用方法: 通过命令行克隆仓库并运行爬取和检测脚本
引用格式
@online{chao2019/online, author = {Brian Chao}, title = {Anime Face Dataset: a collection of high-quality anime faces.}, date = {2019-09-16}, year = {2019}, url = {https://github.com/bchao1/Anime-Face-Dataset} }

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
giovannidemuri__sharegpt-ex50000-seed5_llama8b-er-v573-seed2-hx_256_ngt0.7_tp0.9
该数据集包含了用户与助手之间的对话,其中包含两个字段:用户发言和助手回应,均为字符串类型。训练集大小为38646852字节,共有44096条对话记录。
huggingface 收录
MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
ReferCOCO数据集
ReferCOCO数据集包括refcoco、refcoco+和refcocog三个子集,用于视觉定位任务。数据集包含图像和对应的描述性文本,用于训练和测试模型识别图像中特定对象的能力。
github 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
