five

d0rj/ShareGPT4V-PT-ru

收藏
Hugging Face2023-12-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/ShareGPT4V-PT-ru
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: conversations list: - name: from dtype: string - name: value dtype: string - name: image dtype: string - name: id dtype: string splits: - name: train num_bytes: 1315012350 num_examples: 1246901 download_size: 554413159 dataset_size: 1315012350 configs: - config_name: default data_files: - split: train path: data/train-* task_categories: - visual-question-answering - question-answering - conversational language: - ru size_categories: - 1M<n<10M language_creators: - translated multilinguality: - monolingual source_datasets: - Lin-Chen/ShareGPT4V pretty_name: ShareGPT4V (ru) paperswithcode_id: sharegpt4v license: cc-by-nc-4.0 tags: - chat - visual-chat - multimodal-chat --- # ShareGPT4V-PT-ru ## Dataset Description - **Paper:** https://huggingface.co/papers/2311.12793 - **Repository** https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V - **Homepage** https://ShareGPT4V.github.io/ This is translated version of **ShareGPT4V-PT(1.25M)** subset of [Lin-Chen/ShareGPT4V](https://huggingface.co/datasets/Lin-Chen/ShareGPT4V) dataset into Russian.
提供机构:
d0rj
原始信息汇总

数据集概述

数据集信息

特征

  • conversations: 包含对话信息
    • from: 数据类型为字符串
    • value: 数据类型为字符串
  • image: 数据类型为字符串
  • id: 数据类型为字符串

数据分割

  • train:
    • 字节数: 1315012350
    • 样本数: 1246901

数据大小

  • 下载大小: 554413159
  • 数据集大小: 1315012350

配置

  • default:
    • 数据文件:
      • train: 路径为 data/train-*

任务类别

  • 视觉问答
  • 问答
  • 对话

语言

  • 俄语

数据创建者

  • 翻译

多语言性

  • 单语

源数据集

  • Lin-Chen/ShareGPT4V

名称

  • ShareGPT4V (ru)

论文ID

  • sharegpt4v

许可证

  • cc-by-nc-4.0

标签

  • 聊天
  • 视觉聊天
  • 多模态聊天

数据集描述

这是 ShareGPT4V-PT(1.25M) 子集的俄语翻译版本,源数据集为 Lin-Chen/ShareGPT4V

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作