five

AIDC-AI/Ovis-dataset

收藏
Hugging Face2025-03-12 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/AIDC-AI/Ovis-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于训练Ovis的多模态数据集集合。Ovis是一种新颖的多模态大型语言模型架构,旨在结构上对齐视觉和文本嵌入。数据集包含新发布的文件`laion-description-11k.json`、`cc12m-description-1m.json`和`cc12m-qa-387k.json`,这些文件采用CC BY 4.0许可证。其他文件来自公开可用的数据集,受其特定许可条件约束。

This dataset is a collection of multimodal datasets used for training Ovis. Ovis is a novel Multimodal Large Language Model (MLLM) architecture, designed to structurally align visual and textual embeddings. The dataset includes newly released files `laion-description-11k.json`, `cc12m-description-1m.json`, and `cc12m-qa-387k.json`, which are licensed under CC BY 4.0. All other files are from publicly available datasets and are governed by their specific licensing conditions.
提供机构:
AIDC-AI
原始信息汇总

数据集描述

该数据集是一系列用于训练Ovis的多模态数据集集合。Ovis是一种新颖的多模态大型语言模型(MLLM)架构,旨在结构化地对齐视觉和文本嵌入。

许可证

以下文件由我们新发布,并根据CC BY 4.0许可证授权:

  • laion-description-11k.json
  • cc12m-description-1m.json
  • cc12m-qa-387k.json

其他文件来自公开可用的数据集,并受其特定许可条件的约束。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作