LESW/im_dust_0723
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/LESW/im_dust_0723
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含图像和消息两种主要特征。消息特征进一步细分为内容(包括索引、文本和类型)和角色。数据集分为训练集和测试集,每个集合包含29个样本。训练集的总大小为63248839字节,测试集的总大小为62713143字节。整个数据集的下载大小为125966772字节,数据集总大小为125961982字节。
This dataset includes two main features: images and messages. The messages feature is further divided into content (including index, text, and type) and role. The dataset is split into training and test sets, each containing 29 samples. The total size of the training set is 63248839 bytes, and the test set is 62713143 bytes. The entire dataset has a download size of 125966772 bytes and a total dataset size of 125961982 bytes.
提供机构:
LESW
原始信息汇总
数据集概述
基本信息
- 名称: im_dust_0723
- 别名: LESW/im_dust_0723
- 描述: LESW/im_dust_0723 数据集托管在 HF Mirror 上,由 HF Datasets 社区贡献。
- 创建者: SEUNGWOOLEE
- URL: https://hf-mirror.com/datasets/LESW/im_dust_0723
数据集详情
- 格式: Parquet
- 关键词: < 1K, parquet, Image, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- 符合标准: http://mlcommons.org/croissant/1.0
数据分布
-
Git 仓库:
- 名称: repo
- 描述: HF Mirror git 仓库。
- 内容 URL: https://hf-mirror.com/datasets/LESW/im_dust_0723/tree/refs%2Fconvert%2Fparquet
- 编码格式: git+https
- SHA256: https://github.com/mlcommons/croissant/issues/80
-
Parquet 文件集:
- 名称: parquet-files-for-config-default
- 描述: 由 HF Mirror 转换的底层 Parquet 文件(参见: https://hf-mirror.com/docs/datasets-server/parquet)。
- 包含于: repo
- 编码格式: application/x-parquet
- 包含文件: default//.parquet
记录集
- 默认子集:
- 名称: default
- 描述: LESW/im_dust_0723 - default 子集
- 2 个分割: train, test
- 1 个跳过列: messages
- 字段:
- 名称: default/images
- 描述: 来自 HF Mirror Parquet 文件的图像列 images。
- 数据类型: sc:ImageObject
- 来源:
- 文件集: parquet-files-for-config-default
- 提取: 列 images
- 转换: jsonPath bytes



