RAG-RewardBench|生成模型数据集|奖励机制数据集
收藏RAG-RewardBench
数据集概述
RAG-RewardBench 是一个用于评估检索增强生成(Retrieval Augmented Generation, RAG)模型在偏好对齐任务中的奖励模型的基准数据集。
数据集获取
该数据集已发布在 Huggingface 平台上,可通过以下链接访问: Huggingface

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
MUStARD++
MUStARD++是一个多模态讽刺检测数据集,由萨里大学创建,旨在通过语言、语音和视觉线索全面捕捉讽刺现象。数据集包含1202个视频样本,来源于多个流行电视节目,通过手动标注确保高质量的讽刺标签。创建过程中,研究者们通过多轮标注和验证确保数据的准确性和多样性。该数据集主要应用于自动讽刺检测,帮助机器理解并识别讽刺语境,解决讽刺识别中的多模态挑战。
arXiv 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
中国森林病虫害
本数是中国森林病虫害。记录了1998-2000年森林虫害的持续时间、灾害大类、灾种、种类、成因、发生地区、主要受灾体描述、发生面积亩、发生面积公顷、损失立木、直接经济损失、减灾措施描述、灾情描述、灾害等级隶属性。
国家林业和草原科学数据中心 收录
The Rice Annotation Project Database (RAP-DB)
RAP-DB是一个专注于水稻基因组注释的数据库,提供了水稻基因组的详细注释信息,包括基因结构、功能注释、表达数据等。该数据库旨在为水稻研究者提供一个全面的资源,以促进水稻基因组学和遗传学的研究。
rapdb.dna.affrc.go.jp 收录