Angana192/india_wit

Name: Angana192/india_wit
Creator: Angana192
Published: 2024-07-16 19:24:03
License: 暂无描述

Hugging Face2024-07-16 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/Angana192/india_wit

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集主要用于图像问答任务，包含图像和文本数据。数据集的特征包括id、image、query、answers和json_ans。其中，json_ans是一个结构体，包含conversations、id和image字段。conversations字段是一个列表，包含from和value两个子字段。数据集分为训练集和测试集，训练集包含2730个样本，测试集包含304个样本。

This dataset is primarily used for image question-answering tasks and contains both image and text data. The features of the dataset include id, image, query, answers, and json_ans. The json_ans is a structure containing fields such as conversations, id, and image. The conversations field is a list containing subfields from and value. The dataset is divided into a training set and a test set, with the training set containing 2730 samples and the test set containing 304 samples.

提供机构：

Angana192

原始信息汇总

数据集概述

数据集信息

特征

id: 数据类型为 int64
image: 数据类型为 image
query: 数据类型为 string
answers: 数据类型为 string
json_ans: 结构化数据
- conversations: 列表类型
  - from: 数据类型为 string
  - value: 数据类型为 string
- id: 数据类型为 int64
- image: 数据类型为 string

数据分割

train:
- 字节数: 4909188386.48
- 样本数: 2730
test:
- 字节数: 580981935.0
- 样本数: 304

数据集大小

下载大小: 5250607143 字节
数据集总大小: 5490170321.48 字节

配置

config_name: default
- data_files:
  - train: 路径为 data/train-*
  - test: 路径为 data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集