five

tabtoyou/KoLLaVA-CC3M-Pretrain-595K

收藏
Hugging Face2023-06-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tabtoyou/KoLLaVA-CC3M-Pretrain-595K
下载链接
链接失效反馈
官方服务:
资源简介:
LLaVA Visual Instruct CC3M 595K Pretrain数据集是LLaVA项目公开的CC3M的595K个Visual Instruction数据集的韩语翻译版本。该数据集在构建时使用了Ko-conceptual-captions项目中公开的韩语caption。由于翻译结果可能不够理想,未来可能会使用DeepL进行重新翻译。

LLaVA Visual Instruct CC3M 595K Pretrain数据集是LLaVA项目公开的CC3M的595K个Visual Instruction数据集的韩语翻译版本。该数据集在构建时使用了Ko-conceptual-captions项目中公开的韩语caption。由于翻译结果可能不够理想,未来可能会使用DeepL进行重新翻译。
提供机构:
tabtoyou
原始信息汇总

LLaVA Visual Instruct CC3M 595K Pretrain Dataset Card

数据集概述

  • 来源:由LLaVA提供,基于CC3M的595K个视觉指令数据集。
  • 语言:数据集已翻译为韩语(ko)。
  • 构建方式:使用已有的韩语caption数据集Ko-conceptual-captions构建。
  • 翻译质量:目前翻译质量一般,未来可能使用DeepL进行重新翻译。

许可信息

  • 许可证:遵循CC-3M
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作