AIDC-AI/Ovis-dataset
收藏Hugging Face2025-03-12 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/AIDC-AI/Ovis-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于训练Ovis的多模态数据集集合。Ovis是一种新颖的多模态大型语言模型架构,旨在结构上对齐视觉和文本嵌入。数据集包含新发布的文件`laion-description-11k.json`、`cc12m-description-1m.json`和`cc12m-qa-387k.json`,这些文件采用CC BY 4.0许可证。其他文件来自公开可用的数据集,受其特定许可条件约束。
This dataset is a collection of multimodal datasets used for training Ovis. Ovis is a novel Multimodal Large Language Model (MLLM) architecture, designed to structurally align visual and textual embeddings. The dataset includes newly released files `laion-description-11k.json`, `cc12m-description-1m.json`, and `cc12m-qa-387k.json`, which are licensed under CC BY 4.0. All other files are from publicly available datasets and are governed by their specific licensing conditions.
提供机构:
AIDC-AI
原始信息汇总
数据集描述
该数据集是一系列用于训练Ovis的多模态数据集集合。Ovis是一种新颖的多模态大型语言模型(MLLM)架构,旨在结构化地对齐视觉和文本嵌入。
许可证
以下文件由我们新发布,并根据CC BY 4.0许可证授权:
laion-description-11k.jsoncc12m-description-1m.jsoncc12m-qa-387k.json
其他文件来自公开可用的数据集,并受其特定许可条件的约束。



