five

neoneye/simon-arc-rle-image-v13

收藏
Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v13
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于图像到文本和文本到图像的任务,语言为英语。数据集的大小在10K到100K之间。每个版本的更新主要集中在图像大小、旋转图像、颜色计数、邻居像素匹配等方面,目的是提高模型在处理这些任务时的性能。

The simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 13 is a dataset focused on image-to-text and text-to-image tasks. It contains multiple versions, each optimized for different image sizes and processing focuses. For example, version 13 primarily focuses on image compression (`compres_x`, `compres_y`, `compres_xy`) with image sizes ranging from 1 to 10 pixels. The dataset aims to assist large language models (LLM) in learning and processing various types of image data, particularly rotated and compressed images.
提供机构:
neoneye
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别:
    • 图像到文本
    • 文本到图像
  • 语言: 英语
  • 数据集名称: simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 13
  • 数据集大小: 10K<n<100K
  • 配置:
    • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data.jsonl

版本更新

Version 1

  • 数据项类型: 各类型数据项分布均匀。
  • 图像尺寸: 1到10像素。
  • 问题: 旋转图像导致问题。

Version 2

  • 数据项类型: 多数为旋转图像。
  • 图像尺寸: 1到5像素。
  • 改进: 验证损失有所改善。

Version 3

  • 重点: count_same_color_as_center_with_8neighbors_nowrap 和图像尺寸1-6。
  • 问题: 仍存在 count_same_color_as_center_with_8neighbors_nowrap 的困难。

Version 4

  • 图像尺寸: 1到5像素。
  • 新增: same_color_inside_3x3_area_nowrap
  • 改进: 略有帮助,但计数邻居仍有不足。

Version 5

  • 新增: pixels_with_k_matching_neighbors,k参数为1-8。
  • 图像尺寸: 1-6。
  • 改进: 有助于改善邻居像素计数。

Version 6

  • 权重: 所有变换权重相同。
  • 图像尺寸: 1-11。

Version 7

  • 重点: 直方图和k近邻。
  • 图像尺寸: 1-12。
  • 改进: LLM已掌握。

Version 8

  • 重点: 直方图和k近邻。
  • 图像尺寸: 5-20。

Version 9

  • 重点: 直方图和k近邻。
  • 图像尺寸: 10-30。

Version 10

  • 权重: 所有变换权重相同。
  • 图像尺寸: 宽度10-30,高度2-5。

Version 11

  • 权重: 所有变换权重相同。
  • 图像尺寸: 宽度2-5,高度10-30。

Version 12

  • 重点: k近邻。
  • 图像尺寸: 宽度2-5,高度10-30。

Version 13

  • 重点: compres_x, compres_y, compres_xy
  • 图像尺寸: 1-10。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作