tabtoyou/KoLLaVA-CC3M-Pretrain-595K
收藏Hugging Face2023-06-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tabtoyou/KoLLaVA-CC3M-Pretrain-595K
下载链接
链接失效反馈官方服务:
资源简介:
LLaVA Visual Instruct CC3M 595K Pretrain数据集是LLaVA项目公开的CC3M的595K个Visual Instruction数据集的韩语翻译版本。该数据集在构建时使用了Ko-conceptual-captions项目中公开的韩语caption。由于翻译结果可能不够理想,未来可能会使用DeepL进行重新翻译。
LLaVA Visual Instruct CC3M 595K Pretrain数据集是LLaVA项目公开的CC3M的595K个Visual Instruction数据集的韩语翻译版本。该数据集在构建时使用了Ko-conceptual-captions项目中公开的韩语caption。由于翻译结果可能不够理想,未来可能会使用DeepL进行重新翻译。
提供机构:
tabtoyou
原始信息汇总
LLaVA Visual Instruct CC3M 595K Pretrain Dataset Card
数据集概述
- 来源:由LLaVA提供,基于CC3M的595K个视觉指令数据集。
- 语言:数据集已翻译为韩语(ko)。
- 构建方式:使用已有的韩语caption数据集Ko-conceptual-captions构建。
- 翻译质量:目前翻译质量一般,未来可能使用DeepL进行重新翻译。
许可信息
- 许可证:遵循CC-3M。



