Chart2Text (Chart Summarization Dataset)
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Chart2Text
下载链接
链接失效反馈官方服务:
资源简介:
Chart2Text 是一个数据集,该数据集于 2020 年 3 月上旬从 statista.com 的 23,382 个可免费访问的页面中抓取,总共产生 8,305 个图表和相关摘要。对于每个图表,下载了图表图像、基础数据表、标题、轴标签和描述统计数据的人工编写摘要。
Chart2Text is a dataset that was scraped from 23,382 freely accessible web pages on statista.com in early March 2020, yielding a total of 8,305 charts and their associated summaries. For each chart, the chart image, underlying data table, title, axis labels, and human-written summaries of descriptive statistics were downloaded.
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍

背景与挑战
背景概述
Chart2Text是一个图表摘要数据集,包含从statista.com抓取的8,305个图表,每个图表都配有图像、数据表、标题、轴标签和人工编写的文本摘要。该数据集由约克大学于2020年发布,主要用于支持图表到文本生成的自然语言处理研究,具有多模态和人工标注的特点。
以上内容由遇见数据集搜集并总结生成



