five

neoneye/simon-arc-rle-task-v3

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-task-v3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个关于抽象与推理的图像到文本和文本到图像任务的数据集,包含多个版本。Version 1的数据集项目类型较为均衡,图像大小在1到10像素之间,但复杂性较高。Version 2主要包含直方图数据,图像大小在1到5像素之间。Version 3则专注于颜色交集和并集的配对比较。

This dataset is an image-to-text and text-to-image task dataset focused on abstraction and reasoning, with multiple versions. Version 1 has somewhat evenly distributed dataset items with image sizes between 1 and 10 pixels, but the complexity is high. Version 2 primarily contains histogram data with image sizes between 1 and 5 pixels. Version 3 focuses on pair comparisons for color intersection and color union.
提供机构:
neoneye
原始信息汇总

数据集概述

基本信息

  • 名称: simon-arc-rle-task-v3
  • 别名: neoneye/simon-arc-rle-task-v3, simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) task version 3
  • 创建者: Simon Strandgaard
  • 关键词: image-to-text, text-to-image, English, mit, 100K - 1M, json, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
  • 许可证: MIT
  • URL: https://hf-mirror.com/datasets/neoneye/simon-arc-rle-task-v3

描述

该数据集经历了多个版本的迭代:

版本 1

  • 数据项类型均匀分布。
  • LLM验证损失先下降后上升,可能是数据集复杂度过高。
  • 图像大小在1到10像素之间。

版本 2

  • 数据项主要为直方图。
  • 图像更小,大小在1到5像素之间。
  • 观察LLM在此版本上的表现。

版本 3

  • 聚焦于成对比较。
  • 详细描述见数据集页面:https://hf-mirror.com/datasets/neoneye/simon-arc-rle-task-v3

数据结构

数据集包含以下字段:

  • default/instruction: 来自HF Mirror parquet文件的instruction列,数据类型为文本。
  • default/input: 来自HF Mirror parquet文件的input列,数据类型为文本。
  • default/output: 来自HF Mirror parquet文件的output列,数据类型为文本。

数据分布

数据集包含两个主要部分:

  • repo: HF Mirror git仓库,包含数据集的源文件。
  • parquet-files-for-config-default: 由HF Mirror转换的Parquet文件,包含数据集的具体数据。

符合标准

数据集符合MLCommons Croissant 1.0标准。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作