RLAIF-V-Dataset - 大规模多模态偏好数据集|多模态学习数据集|模型训练数据集
收藏数据集概述:RLAIF-V-Dataset
基本信息
- 许可证:CC-BY-NC-4.0
- 任务类别:视觉问答(Visual Question Answering)
- 语言:英语(en)
- 数据集名称:RLAIF-V-Dataset
- 数据规模:10K < n < 100K
数据集特点
- 数据字段:
ds_name
:数据集名称image
:包含路径和字节的字典,可自动转换为PIL图像question
:输入查询(针对多模态大语言模型)chosen
:针对问题的优选回答rejected
:针对问题的拒绝回答origin_dataset
:图像或问题的原始数据集origin_split
:元信息(包括生成回答对的模型、标注模型、问题类型等)idx
:数据索引image_path
:图像路径
数据集摘要
- 规模:包含83,132个偏好对
- 数据来源:多样化的数据集(MSCOCO、ShareGPT-4V、MovieNet、Google Landmark v2、VQA v2、OKVQA、TextVQA等)
- 用途:通过训练,模型可达到优于开源和专有模型的信任度
相关资源
- 训练模型:
- MiniCPM-V系列:具有与GPT-4V相当性能的端侧多模态大语言模型
- RLAIF-V:具有远超GPT-4V信任度的多模态大语言模型
使用方式
python from datasets import load_dataset data = load_dataset("openbmb/RLAIF-V-Dataset")
引用
bibtex @article{yu2023rlhf, title={Rlhf-v: Towards trustworthy mllms via behavior alignment from fine-grained correctional human feedback}, author={Yu, Tianyu and Yao, Yuan and Zhang, Haoye and He, Taiwen and Han, Yifeng and Cui, Ganqu and Hu, Jinyi and Liu, Zhiyuan and Zheng, Hai-Tao and Sun, Maosong and others}, journal={arXiv preprint arXiv:2312.00849}, year={2023} }
@article{yu2024rlaifv, title={RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness}, author={Tianyu Yu and Haoye Zhang and Qiming Li and Qixin Xu and Yuan Yao and Da Chen and Xiaoman Lu and Ganqu Cui and Yunkai Dang and Taiwen He and Xiaocheng Feng and Jun Song and Bo Zheng and Zhiyuan Liu and Tat-Seng Chua and Maosong Sun}, journal={arXiv preprint arXiv:2405.17220}, year={2024}, }

开源PHM数据集
本文分享了一个全球各大学、研究机构和公司捐赠的PHM(Prognostics and Health Management)开源数据集,涵盖加工制造、轨道交通、能源电力和半导体等行业的多种场景,包含部件级、设备级和产线级数据。用户可以利用这些数据开发智能分析和建模算法,数据集分类包括故障诊断、健康评估和寿命预测。
github 收录
UIEB, U45, LSUI
本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
TT100K - Tsinghua-Tencent 100K
TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。
cg.cs.tsinghua.edu.cn 收录