neoneye/simon-arc-rle-image-v21
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v21
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于图像到文本和文本到图像任务的英语数据集,包含多个版本,每个版本针对不同的图像处理任务进行了调整,如图像旋转、颜色计数、k近邻算法等。图像大小在不同版本中有所变化,范围从1像素到30像素不等。数据集的大小在10K到100K之间。
The simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 21 dataset is primarily used for image-to-text and text-to-image tasks. This dataset includes multiple versions, each focusing on different image processing techniques such as rotation, color counting, and neighboring pixel counting, with image sizes ranging from 1 to 30 pixels. The dataset aims to help language models (LLM) learn and process these specific types of image data more effectively.
提供机构:
neoneye
原始信息汇总
数据集概述
基本信息
- 名称: simon-arc-rle-image-v21
- 别名: neoneye/simon-arc-rle-image-v21, simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 21
- 创建者: Simon Strandgaard
- 关键词: image-to-text, text-to-image, English, mit, 100K - 1M, json, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- 许可证: MIT
- URL: https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v21
描述
- 版本1: 数据集项目类型均匀分布,LLM在某些类型上表现良好,但旋转图像存在问题。图像大小在1到10像素之间。
- 版本2: 数据集项目主要为旋转图像,这是LLM难以处理的部分。图像大小在1到5像素之间,有助于验证损失的改善。
- 版本3: 主要关注...(详细描述见数据集页面)
数据分布
- Git仓库:
- 名称: repo
- 描述: HF Mirror git仓库
- 内容URL: https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v21/tree/refs%2Fconvert%2Fparquet
- 编码格式: git+https
- Parquet文件集:
- 名称: parquet-files-for-config-default
- 描述: 由HF Mirror转换的底层Parquet文件(详见: https://hf-mirror.com/docs/datasets-server/parquet)
- 编码格式: application/x-parquet
- 包含: default//.parquet
记录集
- 默认子集:
- 名称: default
- 描述: neoneye/simon-arc-rle-image-v21 - default subset
- 字段:
- instruction:
- 名称: default/instruction
- 描述: HF Mirror parquet文件中的instruction列
- 数据类型: Text
- input:
- 名称: default/input
- 描述: HF Mirror parquet文件中的input列
- 数据类型: Text
- output:
- 名称: default/output
- 描述: HF Mirror parquet文件中的output列
- 数据类型: Text
- instruction:



