five

neoneye/simon-arc-lab-histogram-v8

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-lab-histogram-v8
下载链接
链接失效反馈
官方服务:
资源简介:
数据集simons ARC (抽象与推理语料库) 实验室直方图版本8包含图像到文本和文本到图像的任务,使用英语,数据量在10K到100K之间。从版本1到版本8,计数器的范围从1-20增加到1-800。

The dataset simons ARC (abstraction & reasoning corpus) lab histogram version 8 includes tasks from image-to-text and text-to-image categories, using English, with a data size between 10K and 100K. The range of counters increases from 1-20 to 1-800 across versions 1 to 8.
提供机构:
neoneye
原始信息汇总

数据集概述

基本信息

  • 名称: simon-arc-lab-histogram-v8
  • 别名: neoneye/simon-arc-lab-histogram-v8, simons ARC (abstraction & reasoning corpus) lab histogram version 8
  • 创建者: Simon Strandgaard
  • 许可证: MIT
  • 关键词: image-to-text, text-to-image, English, mit, 100K - 1M, json, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
  • URL: https://hf-mirror.com/datasets/neoneye/simon-arc-lab-histogram-v8

描述

数据集包含多个版本的计数器范围:

  • 版本1: 计数器范围 1-20
  • 版本2: 计数器范围 1-50
  • 版本3: 计数器范围 1-100
  • 版本4: 计数器范围 1-200,增加了 Histogram.remove_other_colors()
  • 版本5: 修正了计数器范围,现在是 1-100
  • 版本6: 计数器范围 1-200

数据格式

  • 分布:
    • Git 仓库:
      • 名称: repo
      • 描述: HF Mirror git 仓库
      • 内容 URL: https://hf-mirror.com/datasets/neoneye/simon-arc-lab-histogram-v8/tree/refs%2Fconvert%2Fparquet
      • 编码格式: git+https
    • Parquet 文件集:
      • 名称: parquet-files-for-config-default
      • 描述: 由 HF Mirror 转换的底层 Parquet 文件
      • 包含于: repo
      • 编码格式: application/x-parquet
      • 包含文件: default//.parquet

数据字段

  • 默认子集:
    • 字段1:
      • 名称: default/instruction
      • 描述: HF Mirror parquet 文件中的 instruction 列
      • 数据类型: 文本
    • 字段2:
      • 名称: default/input
      • 描述: HF Mirror parquet 文件中的 input 列
      • 数据类型: 文本
    • 字段3:
      • 名称: default/output
      • 描述: HF Mirror parquet 文件中的 output 列
      • 数据类型: 文本

符合标准

  • 标准: http://mlcommons.org/croissant/1.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作