five

neoneye/simon-arc-rle-image-v15

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v15
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于图像到文本和文本到图像任务的英语数据集,数据集大小在10K到100K之间。数据集的不同版本针对图像大小、旋转图像、颜色计数、直方图和k近邻等任务进行了多次调整,目的是优化大语言模型(LLM)在这些任务上的表现。

simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 15 is a dataset designed for image-to-text and text-to-image tasks. It includes multiple versions, each addressing different image processing issues such as rotated images, counting colors similar to the center with neighboring pixels, etc. The image sizes range from 1 to 30 pixels, with version 15 specifically focusing on histograms and k-nearest neighbors, with image sizes of 10-30 pixels.
提供机构:
neoneye
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别:
    • 图像到文本
    • 文本到图像
  • 语言: 英语
  • 数据集名称: simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 15
  • 数据集大小: 10K<n<100K
  • 配置:
    • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data.jsonl

版本信息

Version 1

  • 数据项类型: 各类型数据项分布均匀
  • 图像尺寸: 1-10像素
  • 问题: 旋转图像导致问题

Version 2

  • 数据项类型: 多数为旋转图像
  • 图像尺寸: 1-5像素
  • 改进: 验证损失有所改善

Version 3

  • 重点: count_same_color_as_center_with_8neighbors_nowrap
  • 图像尺寸: 1-6像素
  • 问题: 仍存在一定困难

Version 4

  • 图像尺寸: 1-5像素
  • 新增: same_color_inside_3x3_area_nowrap
  • 改进: 略有帮助,但计数仍不理想

Version 5

  • 新增: pixels_with_k_matching_neighbors (k参数: 1-8)
  • 图像尺寸: 1-6像素
  • 改进: 有助于改善邻近像素计数

Version 6

  • 图像尺寸: 1-11像素

Version 7

  • 重点: 直方图和k-nearest neighbors
  • 图像尺寸: 1-12像素
  • 改进: LLM已掌握

Version 8

  • 重点: 直方图和k-nearest neighbors
  • 图像尺寸: 5-20像素

Version 9

  • 重点: 直方图和k-nearest neighbors
  • 图像尺寸: 10-30像素

Version 10

  • 图像尺寸: 宽度10-30像素,高度2-5像素

Version 11

  • 图像尺寸: 宽度2-5像素,高度10-30像素

Version 12

  • 重点: k-nearest neighbors
  • 图像尺寸: 宽度2-5像素,高度10-30像素

Version 13

  • 重点: compres_x, compres_y, compres_xy
  • 图像尺寸: 1-10像素

Version 14

  • 重点: 直方图和k-nearest-neighbors
  • 图像尺寸: 5-20像素

Version 15

  • 重点: 直方图和k-nearest-neighbors
  • 图像尺寸: 10-30像素
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作