five

Oztobuzz/Vi_ShareGPT4V

收藏
Hugging Face2024-04-12 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Oztobuzz/Vi_ShareGPT4V
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置下的数据文件路径、特征、分割信息、下载大小和数据集大小均有所不同。数据集的特征包括id、image、en_conversations和vi_conversations,其中en_conversations和vi_conversations是对话列表,包含from和value两个字段。数据集主要用于训练,每个配置的训练集大小和样本数量也有所不同。

该数据集包含多个配置,每个配置下的数据文件路径、特征、分割信息、下载大小和数据集大小均有所不同。数据集的特征包括id、image、en_conversations和vi_conversations,其中en_conversations和vi_conversations是对话列表,包含from和value两个字段。数据集主要用于训练,每个配置的训练集大小和样本数量也有所不同。
提供机构:
Oztobuzz
原始信息汇总

数据集概述

配置信息

  • 默认配置

    • 数据文件路径:start_from_*/train-*
  • 其他配置

    • 共有14个特定配置,每个配置对应一个特定的数据文件路径,如:
      • start_from_000000019397/train-*
      • start_from_000000019542/train-*
      • start_from_000000020031/train-*
      • ...
      • start_from_000000208476/train-*

数据集特征

  • 通用特征
    • id: 数据类型为字符串
    • image: 数据类型为字符串
    • en_conversations: 列表类型,包含
      • from: 数据类型为字符串
      • value: 数据类型为字符串
    • vi_conversations: 列表类型,包含
      • from: 数据类型为字符串
      • value: 数据类型为字符串

数据集大小

  • 训练集大小

    • 每个配置的训练集大小不同,例如:
      • start_from_000000019397: 训练集大小为47375字节,包含20个示例
      • start_from_000000019542: 训练集大小为231613字节,包含100个示例
      • start_from_000000020031: 训练集大小为45558字节,包含20个示例
      • ...
      • start_from_000000208476: 训练集大小为237917字节,包含100个示例
  • 下载大小

    • 每个配置的下载大小也不同,例如:
      • start_from_000000019397: 下载大小为28572字节
      • start_from_000000019542: 下载大小为116261字节
      • start_from_000000020031: 下载大小为30810字节
      • ...
      • start_from_000000208476: 下载大小为122859字节
  • 数据集总大小

    • 每个配置的数据集总大小等于其训练集大小,例如:
      • start_from_000000019397: 数据集总大小为47375字节
      • start_from_000000019542: 数据集总大小为231613字节
      • start_from_000000020031: 数据集总大小为45558字节
      • ...
      • start_from_000000208476: 数据集总大小为237917字节
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作