five

neoneye/simon-arc-rle-image-v21

收藏
Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v21
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于图像到文本和文本到图像任务的英语数据集,包含多个版本,每个版本针对不同的图像处理任务进行了调整,如图像旋转、颜色计数、k近邻算法等。图像大小在不同版本中有所变化,范围从1像素到30像素不等。数据集的大小在10K到100K之间。

The simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 21 dataset is primarily used for image-to-text and text-to-image tasks. This dataset includes multiple versions, each focusing on different image processing techniques such as rotation, color counting, and neighboring pixel counting, with image sizes ranging from 1 to 30 pixels. The dataset aims to help language models (LLM) learn and process these specific types of image data more effectively.
提供机构:
neoneye
原始信息汇总

数据集概述

基本信息

  • 名称: simon-arc-rle-image-v21
  • 别名: neoneye/simon-arc-rle-image-v21, simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 21
  • 创建者: Simon Strandgaard
  • 关键词: image-to-text, text-to-image, English, mit, 100K - 1M, json, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
  • 许可证: MIT
  • URL: https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v21

描述

  • 版本1: 数据集项目类型均匀分布,LLM在某些类型上表现良好,但旋转图像存在问题。图像大小在1到10像素之间。
  • 版本2: 数据集项目主要为旋转图像,这是LLM难以处理的部分。图像大小在1到5像素之间,有助于验证损失的改善。
  • 版本3: 主要关注...(详细描述见数据集页面)

数据分布

  • Git仓库:
    • 名称: repo
    • 描述: HF Mirror git仓库
    • 内容URL: https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v21/tree/refs%2Fconvert%2Fparquet
    • 编码格式: git+https
  • Parquet文件集:
    • 名称: parquet-files-for-config-default
    • 描述: 由HF Mirror转换的底层Parquet文件(详见: https://hf-mirror.com/docs/datasets-server/parquet)
    • 编码格式: application/x-parquet
    • 包含: default//.parquet

记录集

  • 默认子集:
    • 名称: default
    • 描述: neoneye/simon-arc-rle-image-v21 - default subset
    • 字段:
      • instruction:
        • 名称: default/instruction
        • 描述: HF Mirror parquet文件中的instruction列
        • 数据类型: Text
      • input:
        • 名称: default/input
        • 描述: HF Mirror parquet文件中的input列
        • 数据类型: Text
      • output:
        • 名称: default/output
        • 描述: HF Mirror parquet文件中的output列
        • 数据类型: Text
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作