全态对齐
收藏始智AI2025-01-18 更新2025-01-18 收录
下载链接:
https://wisemodel.cn/datasets/XuyaoWang/align-anything
下载链接
链接失效反馈资源简介:
Align-Anything 是由PKU-Alignment团队开发的一个全模态数据集,它主要解决了当前多模态基础模型在数据可用性和多样性方面的局限性。该数据集包含了200K条数据,涵盖了文本、图像、视频和音频等所有主要模态,其特点包括:
1)支持全模态任务,实现了任意模态之间的双向转换;
2)包含细粒度的偏好标注,针对不同模态设计了特定的评估标准,如指令遵循性、客观规则、清晰度和美观性等;
3)提供了语言反馈机制,通过自然语言对输出进行评价和优化建议;4)构建了跨模态的问答对,支持不同模态之间的丰富交互。数据集的标注采用了GPT-4、Gemini-1.5-Pro以及人工众包的方式,确保了数据质量的可靠性。
数据集的发布为提升多模态模型的指令跟随能力和跨模态交互能力提供了重要支持。
提供机构:
始智AI
创建时间:
2025-01-18
AI搜集汇总
数据集介绍

背景与挑战
背景概述
Align-Anything是一个由PKU-Alignment团队开发的全模态数据集,包含200K条涵盖文本、图像、视频和音频的数据,支持全模态任务并提供细粒度的偏好标注和语言反馈机制。该数据集通过GPT-4、Gemini-1.5-Pro和人工众包进行标注,旨在提升多模态模型的指令跟随能力和跨模态交互能力。
以上内容由AI搜集并总结生成



