Nagase-Kotono/Image-Detailed-Description-Korean
收藏Hugging Face2024-07-14 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/Nagase-Kotono/Image-Detailed-Description-Korean
下载链接
链接失效反馈官方服务:
资源简介:
Image-Detailed-Description-Korean数据集是基于LLaVA-NeXT项目中的High-Quality Knowledge Learning部分,使用Recaptioned Data(ReCap)方法制作的。该数据集旨在提高模型在需要详细图像描述和文档理解任务中的性能。数据集采用了LLaVA格式,并参考了jp1924/OutsideKnowledgebasedMultimodalQAData的图像进行重新标注。
Image-Detailed-Description-Korean数据集是基于LLaVA-NeXT项目中的High-Quality Knowledge Learning部分,使用Recaptioned Data(ReCap)方法制作的。该数据集旨在提高模型在需要详细图像描述和文档理解任务中的性能。数据集采用了LLaVA格式,并参考了jp1924/OutsideKnowledgebasedMultimodalQAData的图像进行重新标注。
提供机构:
Nagase-Kotono
原始信息汇总
数据集概述
数据集描述
该数据集用于视觉问答任务,特别关注于图像详细描述和文档理解。数据集中的重标注数据(ReCap)展示了在需要详细图像描述和文档理解的任务中,模型性能的提升趋势。重标注的描述范围从118K到3M,显示出比原始描述更好的扩展行为,并在各种评估指标上持续提高模型性能。
数据集格式
数据集遵循LLaVA格式,使用方法可参考LLaVA和KoLLaVA。
许可证
数据集的许可证为Apache-2.0,并应遵守Anthropic的商业服务条款。



