有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
VLBiasBench 是一个大规模数据集,由高质量的合成图像组成,旨在全面评估大型视觉-语言模型(LVLMs)中的社会偏见。该数据集包含九个不同的社会偏见类别,包括年龄、残疾状态、性别、国籍、外貌、种族、宗教、职业、社会经济状态以及两个交叉偏见类别(种族×性别,种族×社会经济状态)。
统计项 | 图像数量 | 样本数量 |
---|---|---|
总问题数 | 46,848 | 128,342 |
开放式问题 | 27,991 | 29,348 |
封闭式问题 | 18,857 | 98,994 |
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
Amazon Reviews 2023
该数据集包含用户评论,如评分、评论文本、有用投票等,以及商品元数据,如产品描述、定价、图片等。数据集比以前的版本大245.2%,包含571.54M条评论,并具有更丰富的描述性商品特征和细粒度的时间戳。
github 收录
WeChat Social Network Dataset
该数据集包含了微信社交网络的用户关系数据,包括用户之间的关注关系、互动行为等。数据集旨在帮助研究社交网络的结构和动态变化。
www.aminer.cn 收录
Breast Ultrasound Images (BUSI)
小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。
github 收录
Pet Disease images
Comprehensive Image Dataset for Detecting Pet Diseases Across Multiple Species
kaggle 收录