five

neoneye/simon-arc-rle-image-v7

收藏
Hugging Face2024-07-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v7
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于图像到文本和文本到图像任务的数据集,主要包含不同版本的图像处理任务。每个版本都针对LLM在处理旋转图像、颜色计数和邻居像素匹配等问题上的困难进行了优化。图像大小在不同版本中有所变化,主要集中在1到12像素之间。数据集的目标是通过不断调整图像大小和任务类型,提高LLM在这些任务上的表现。

simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 7 is a dataset primarily used for image-to-text and text-to-image tasks. It contains various types of images with sizes ranging from 1 to 12 pixels. The dataset has versions from 1 to 7, each focusing on different aspects and improvements such as handling rotated images, adjusting image sizes, color counting, and neighboring pixel counting. The dataset is in English and has a size between 10K and 100K.
提供机构:
neoneye
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别:
    • 图像到文本
    • 文本到图像
  • 语言: 英语
  • 数据集名称: simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 7
  • 数据集大小: 10K<n<100K
  • 配置:
    • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data.jsonl

版本更新

Version 1

  • 描述: 数据集项类型分布较为均匀。LLM在某些类型上表现良好,但旋转图像存在问题。
  • 图像大小: 1到10像素

Version 2

  • 描述: 数据集项主要为旋转图像,以解决LLM在此类图像上的困难。
  • 图像大小: 1到5像素
  • 效果: 验证损失有所改善。

Version 3

  • 描述: 主要关注count_same_color_as_center_with_8neighbors_nowrap和图像大小1-6。LLM在此类任务上表现不佳,可能由于图像尺寸过大。
  • 图像大小: 1到6像素

Version 4

  • 描述: 再次尝试使用更小的图像,图像大小为1到5像素。添加了same_color_inside_3x3_area_nowrap,可能与count_same_color_as_center_with_8neighbors_nowrap有协同作用。
  • 图像大小: 1到5像素
  • 效果: 略有帮助,但仍未达到理想的邻居计数效果。

Version 5

  • 描述: 添加了pixels_with_k_matching_neighbors,k参数在1-8之间,以改进邻居像素计数。
  • 图像大小: 1到6像素
  • 效果: 确实有助于改进邻居像素计数。

Version 6

  • 描述: 所有变换的权重相同。
  • 图像大小: 1到11像素

Version 7

  • 描述: 重点关注直方图和k-最近邻算法。
  • 图像大小: 1到12像素
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作