BUAADreamer/mllm_demo
收藏Hugging Face2024-05-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/BUAADreamer/mllm_demo
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
license: apache-2.0
size_categories:
- n<1K
task_categories:
- visual-question-answering
dataset_info:
features:
- name: messages
list:
- name: role
dtype: string
- name: content
dtype: string
- name: images
sequence: image
splits:
- name: train
num_bytes: 51897.0
num_examples: 3
download_size: 54128
dataset_size: 51897.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
tags:
- llama-factory
---
This dataset is a demo visual instruct dataset.
You can organize content in the dataset_info.json in [LLaMA Factory](https://github.com/hiyouga/LLaMA-Factory) like this:
```
"mllm_demo_hf": {
"hf_hub_url": "BUAADreamer/mllm_demo",
"formatting": "sharegpt",
"columns": {
"messages": "messages",
"images": "images"
},
"tags": {
"role_tag": "role",
"content_tag": "content",
"user_tag": "user",
"assistant_tag": "assistant"
}
}
```
Then you can use it in [LLaMA Factory](https://github.com/hiyouga/LLaMA-Factory) by specifying --dataset mllm_demo_hf.
提供机构:
BUAADreamer
原始信息汇总
数据集概述
基本信息
- 语言: 英语 (
en) - 许可证: Apache-2.0
- 大小分类: 小于1K (
n<1K) - 任务分类: 视觉问答 (
visual-question-answering)
数据集特征
- 特征名称: messages
- 子特征:
- 名称: role
- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 名称: content
- 数据类型: 字符串 (
string)
- 数据类型: 字符串 (
- 名称: role
- 子特征:
- 特征名称: images
- 数据类型: 图像序列 (
sequence: image)
- 数据类型: 图像序列 (
数据集分割
- 分割名称: train
- 字节数: 51897.0
- 示例数量: 3
数据集大小
- 下载大小: 54128
- 数据集大小: 51897.0
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 分割: train
- 数据文件:
标签
- 标签: llama-factory
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个小规模的演示性视觉指令数据集,专为视觉问答任务设计,包含英语多轮对话和图像内容。它采用Apache 2.0许可证,适用于LLaMA Factory框架,用于训练或测试多模态语言模型,数据示例涉及体育和航天等主题,以支持模型理解图像并生成相关响应。
以上内容由遇见数据集搜集并总结生成



