five

d0rj/ShareGPT4V-ru

收藏
Hugging Face2023-11-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/ShareGPT4V-ru
下载链接
链接失效反馈
官方服务:
资源简介:
这是从Lin-Chen/ShareGPT4V数据集中翻译成俄语的子集,包含102k个样本。数据集的特征包括图像、ID和对话内容。数据集分为训练集,包含102025个样本,总大小为192931273字节。数据集的任务类别包括视觉问答、问答和对话,语言为俄语,属于单语种数据集。数据集的创建者通过翻译生成,源数据集为Lin-Chen/ShareGPT4V。数据集的许可证为cc-by-nc-4.0,标签包括聊天、视觉聊天和多模态聊天。
提供机构:
d0rj
原始信息汇总

数据集概述

数据集信息

特征

  • image: 字符串类型
  • id: 字符串类型
  • conversations: 字符串序列

分割

  • train:
    • 字节数: 192931273
    • 样本数: 102025

大小

  • 下载大小: 82097525
  • 数据集大小: 192931273

配置

  • default:
    • 数据文件:
      • 分割: train
      • 路径: data/train-*

任务类别

  • 视觉问答
  • 问答
  • 对话

语言

  • 俄语

数据创建者

  • 翻译

多语言性

  • 单语

源数据集

  • Lin-Chen/ShareGPT4V

名称

  • ShareGPT4V (ru)

论文ID

  • sharegpt4v

许可证

  • cc-by-nc-4.0

标签

  • 聊天
  • 视觉聊天
  • 多模态聊天
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作