xDAN-Vision/Websight_Mantis_Data
收藏Hugging Face2024-07-10 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/xDAN-Vision/Websight_Mantis_Data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集可能是一个多模态数据集,包含图像和对话数据。每个样本包含一个唯一的ID、图像数据(以二进制格式存储)、图像路径、对话内容(包括角色和内容)以及数据来源。数据集被分为多个配置(config),每个配置包含训练集,训练集的大小和样本数量也有所不同。
This dataset is likely a multimodal dataset containing images and conversational data. Each sample includes a unique ID, image data (stored in binary format), image path, conversation content (including roles and content), and data source. The dataset is divided into multiple configurations (configs), each containing a training set with varying sizes and numbers of samples.
提供机构:
xDAN-Vision
原始信息汇总
数据集概述
数据集配置
配置 train0
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19637417字节,46908个样本
- 下载大小: 7740889字节
- 数据集大小: 19637417字节
配置 train1
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19677654字节,46908个样本
- 下载大小: 7748598字节
- 数据集大小: 19677654字节
配置 train10
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19769851字节,46891个样本
- 下载大小: 7758897字节
- 数据集大小: 19769851字节
配置 train11
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19805362字节,46890个样本
- 下载大小: 7766616字节
- 数据集大小: 19805362字节
配置 train12
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19806098字节,46890个样本
- 下载大小: 7760985字节
- 数据集大小: 19806098字节
配置 train13
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19835653字节,46890个样本
- 下载大小: 7758942字节
- 数据集大小: 19835653字节
配置 train14
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19764487字节,46890个样本
- 下载大小: 7749094字节
- 数据集大小: 19764487字节
配置 train15
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19771610字节,46890个样本
- 下载大小: 7728137字节
- 数据集大小: 19771610字节
配置 train16
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19743140字节,46890个样本
- 下载大小: 7736271字节
- 数据集大小: 19743140字节
配置 train17
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19852859字节,46890个样本
- 下载大小: 7768360字节
- 数据集大小: 19852859字节
配置 train18
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19769498字节,46890个样本
- 下载大小: 7727809字节
- 数据集大小: 19769498字节
配置 train19
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19783931字节,46890个样本
- 下载大小: 7736612字节
- 数据集大小: 19783931字节
配置 train2
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19684539字节,46908个样本
- 下载大小: 7770000字节
- 数据集大小: 19684539字节
配置 train20
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19759826字节,46890个样本
- 下载大小: 7742268字节
- 数据集大小: 19759826字节
配置 train21
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19799992字节,46890个样本
- 下载大小: 7747632字节
- 数据集大小: 19799992字节
配置 train22
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19781986字节,46890个样本
- 下载大小: 7741863字节
- 数据集大小: 19781986字节
配置 train23
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19807057字节,46890个样本
- 下载大小: 7778138字节
- 数据集大小: 19807057字节
配置 train24
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19790999字节,46890个样本
- 下载大小: 7745936字节
- 数据集大小: 19790999字节
配置 train25
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19715767字节,46890个样本
- 下载大小: 7722343字节
- 数据集大小: 19715767字节
配置 train26
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19779524字节,46890个样本
- 下载大小: 7757799字节
- 数据集大小: 19779524字节
配置 train27
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19771167字节,46890个样本
- 下载大小: 7757283字节
- 数据集大小: 19771167字节
配置 train28
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19795056字节,46890个样本
- 下载大小: 7748213字节
- 数据集大小: 19795056字节
配置 train29
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19749596字节,46890个样本
- 下载大小: 7737005字节
- 数据集大小: 19749596字节
配置 train30
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19722362字节,46890个样本
- 下载大小: 7715138字节
- 数据集大小: 19722362字节
配置 train31
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19755632字节,46890个样本
- 下载大小: 7737756字节
- 数据集大小: 19755632字节
配置 train32
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19842121字节,46890个样本
- 下载大小: 7778126字节
- 数据集大小: 19842121字节
配置 train33
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19799434字节,46890个样本
- 下载大小: 7747569字节
- 数据集大小: 19799434字节
配置 train34
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19810307字节,46890个样本
- 下载大小: 7753244字节
- 数据集大小: 19810307字节
配置 train35
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19761257字节,46890个样本
- 下载大小: 7737011字节
- 数据集大小: 19761257字节
配置 train36
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含19802270字节,46890个样本
- 下载大小: 7754437字节
- 数据集大小: 19802270字节
配置 train37
- 特征:
id: 类型为字符串images: 包含二进制数据和路径字符串conversation: 包含角色和内容字符串source: 类型为字符串
- 分割:
train: 包含15131503字节,4



