hallucination-verification dataset|视觉语言模型数据集|幻觉验证数据集
收藏
- 1Generate, but Verify: Reducing Hallucination in Vision-Language Models with Retrospective Resampling加州大学伯克利分校 · 2025年
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
Amazon Reviews 2023
该数据集包含用户评论,如评分、评论文本、有用投票等,以及商品元数据,如产品描述、定价、图片等。数据集比以前的版本大245.2%,包含571.54M条评论,并具有更丰富的描述性商品特征和细粒度的时间戳。
github 收录
ADNI
阿尔茨海默病神经影像研究计划 (ADNI) 是一项多站点研究,旨在改善预防和治疗阿尔茨海默病 (AD) 的临床试验。[1] 这项合作研究结合了私营和公共部门的专业知识和资金,以研究患有AD的受试者,以及那些可能发展成AD和控制没有认知障碍迹象的人。[2] 美国和加拿大63个地点的研究人员通过神经影像学,生化,和遗传生物标记。[2][3] 这些知识有助于找到更好的预防和治疗AD的临床试验。ADNI已经产生了全球性的影响,[4] 首先是通过开发一套标准化的协议,以允许对来自多个中心的结果进行比较,[4] 其次是其数据共享政策,该政策使所有数据在没有禁运的情况下提供给世界各地的合格研究人员。[5] 迄今为止,超过1000份科学出版物使用了ADNI数据。[6] 许多其他与AD和其他疾病相关的计划已经使用ADNI作为模型来设计和实施。[4] ADNI一直在2004年运行,目前2021年获得资助。
OpenDataLab 收录