five

yajuniverse/BlinkCode

收藏
Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/yajuniverse/BlinkCode
下载链接
链接失效反馈
官方服务:
资源简介:
BlinkCode是一个创新的基准测试,旨在评估多模态大语言模型(MLLMs)的编码能力,特别是那些具备视觉功能的代理。该基准测试包含1000个编码问题,分为9个不同的任务,旨在测试复杂推理、规划、工具使用和基于视觉信息的交互细化等能力。数据集的特征包括id、path、decoded_image、type、ocr_result、query、function_name、evaluation_function和reference_answer。数据集分为多个部分,如Webpage、Matplotlib、HumanEval_V等,每个部分都有相应的字节数和示例数。

BlinkCode是一个创新的基准测试,旨在评估多模态大语言模型(MLLMs)的编码能力,特别是那些具备视觉功能的代理。该基准测试包含1000个编码问题,分为9个不同的任务,旨在测试复杂推理、规划、工具使用和基于视觉信息的交互细化等能力。数据集的特征包括id、path、decoded_image、type、ocr_result、query、function_name、evaluation_function和reference_answer。数据集分为多个部分,如Webpage、Matplotlib、HumanEval_V等,每个部分都有相应的字节数和示例数。
提供机构:
yajuniverse
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 许可证: MIT
  • 数据集大小: 94,026,621.0 字节
  • 下载大小: 93,259,232 字节
  • 任务类别:
    • 图像到文本
    • 问答
    • 文本生成
  • 标签:
    • 代码生成
    • 多模态
    • 视觉编程
    • 代理
    • 编码技能
    • 多模态问答

数据集结构

特征

  • id: 整数类型
  • path: 字符串类型
  • decoded_image: 图像类型
  • type: 字符串类型
  • ocr_result: 字符串类型
  • query: 字符串类型
  • function_name: 字符串类型
  • evaluation_function: 字符串类型
  • reference_answer: 字符串类型

数据分割

  • Webpage: 122 个样本, 8,062,895.0 字节
  • Matplotlib: 110 个样本, 6,548,766.0 字节
  • HumanEval_V: 120 个样本, 3,611,252.0 字节
  • MBPP_V: 120 个样本, 2,485,117.0 字节
  • GSM8K_V: 114 个样本, 5,077,670.0 字节
  • MATH_V: 91 个样本, 15,046,826.0 字节
  • SVG: 106 个样本, 384,696.0 字节
  • TikZ: 100 个样本, 7,813,902.0 字节
  • VP: 117 个样本, 44,995,497.0 字节

配置

  • config_name: default
    • 数据文件:
      • Webpage: data/Webpage-*
      • Matplotlib: data/Matplotlib-*
      • HumanEval_V: data/HumanEval_V-*
      • MBPP_V: data/MBPP_V-*
      • GSM8K_V: data/GSM8K_V-*
      • MATH_V: data/MATH_V-*
      • SVG: data/SVG-*
      • TikZ: data/TikZ-*
      • VP: data/VP-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作