five

neoneye/simon-arc-rle-image-v3

收藏
Hugging Face2024-07-13 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专注于图像到文本和文本到图像的转换任务,主要包含英文内容。数据集经历了三个版本的更新,每个版本都针对图像大小和类型进行了调整。Version 1中,数据集项类型较为均衡,但旋转图像导致问题,图像大小在1到10像素之间。Version 2中,大多数数据集项为旋转图像,图像大小缩小到1到5像素,这有助于减少验证损失。Version 3中,主要关注`count_same_color_as_center_with_8neighbors_nowrap`和图像大小1-6像素,因为LLM在过去可能因图像过大而难以处理。

This dataset focuses on image-to-text and text-to-image conversion tasks, primarily containing English content. The dataset has undergone three versions of updates, each adjusting image sizes and types. In Version 1, the dataset items are somewhat evenly of each type, but rotated images are causing problems, with image sizes between 1 and 10 pixels. In Version 2, the majority of dataset items are rotated images, with image sizes reduced to between 1 and 5 pixels, which helped a lot on the validation loss. In Version 3, the main focus is on `count_same_color_as_center_with_8neighbors_nowrap` and image sizes of 1-6 pixels, as the LLM has struggled with larger image sizes in the past.
提供机构:
neoneye
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别:
    • 图像到文本
    • 文本到图像
  • 语言: 英语
  • 数据集名称: simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 3
  • 数据集规模: 10K<n<100K

配置信息

  • 配置名称: default
  • 数据文件:
    • 分割: train
    • 路径: data.jsonl

版本信息

Version 1

  • 数据项分布: 各类型数据项分布较为均匀。
  • 图像尺寸: 1到10像素。
  • 问题: 旋转图像导致问题。

Version 2

  • 数据项分布: 大部分数据项为旋转图像。
  • 图像尺寸: 1到5像素。
  • 改进: 验证损失显著改善。

Version 3

  • 主要关注点: count_same_color_as_center_with_8neighbors_nowrap
  • 图像尺寸: 1到6像素。
  • 问题: 过去由于图像尺寸过大导致LLM难以处理。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作