d0rj/ShareGPT4V-PT-ru
收藏Hugging Face2023-12-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/ShareGPT4V-PT-ru
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: conversations
list:
- name: from
dtype: string
- name: value
dtype: string
- name: image
dtype: string
- name: id
dtype: string
splits:
- name: train
num_bytes: 1315012350
num_examples: 1246901
download_size: 554413159
dataset_size: 1315012350
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
task_categories:
- visual-question-answering
- question-answering
- conversational
language:
- ru
size_categories:
- 1M<n<10M
language_creators:
- translated
multilinguality:
- monolingual
source_datasets:
- Lin-Chen/ShareGPT4V
pretty_name: ShareGPT4V (ru)
paperswithcode_id: sharegpt4v
license: cc-by-nc-4.0
tags:
- chat
- visual-chat
- multimodal-chat
---
# ShareGPT4V-PT-ru
## Dataset Description
- **Paper:** https://huggingface.co/papers/2311.12793
- **Repository** https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V
- **Homepage** https://ShareGPT4V.github.io/
This is translated version of **ShareGPT4V-PT(1.25M)** subset of [Lin-Chen/ShareGPT4V](https://huggingface.co/datasets/Lin-Chen/ShareGPT4V) dataset into Russian.
提供机构:
d0rj
原始信息汇总
数据集概述
数据集信息
特征
- conversations: 包含对话信息
- from: 数据类型为字符串
- value: 数据类型为字符串
- image: 数据类型为字符串
- id: 数据类型为字符串
数据分割
- train:
- 字节数: 1315012350
- 样本数: 1246901
数据大小
- 下载大小: 554413159
- 数据集大小: 1315012350
配置
- default:
- 数据文件:
- train: 路径为
data/train-*
- train: 路径为
- 数据文件:
任务类别
- 视觉问答
- 问答
- 对话
语言
- 俄语
数据创建者
- 翻译
多语言性
- 单语
源数据集
- Lin-Chen/ShareGPT4V
名称
- ShareGPT4V (ru)
论文ID
- sharegpt4v
许可证
- cc-by-nc-4.0
标签
- 聊天
- 视觉聊天
- 多模态聊天
数据集描述
这是 ShareGPT4V-PT(1.25M) 子集的俄语翻译版本,源数据集为 Lin-Chen/ShareGPT4V。



