five

Pixmo-docs

收藏
github2024-12-06 更新2024-12-16 收录
下载链接:
https://github.com/allenai/pixmo-docs
下载链接
链接失效反馈
官方服务:
资源简介:
Pixmo-docs数据集生成系统,支持生成合成图表、表格、图示等。该数据集通过多种管道生成,包括使用Matplotlib、Plotly、Vega-Lite等工具生成图表,使用Graphviz、Mermaid、TikZ等工具生成图示,以及使用LaTeX和HTML生成表格和文档。

The Pixmo-docs Dataset Generation System supports the generation of synthetic charts, tables, diagrams and other visual artifacts. This dataset is built through multiple pipelines: charts are generated using tools such as Matplotlib, Plotly and Vega-Lite; diagrams are created with Graphviz, Mermaid, TikZ and other similar utilities; and tables as well as documents are produced via LaTeX and HTML.
创建时间:
2024-11-27
原始信息汇总

Pixmo-docs 数据集

概述

Pixmo-docs 数据集支持生成合成图表、表格、图示等多种类型的文本丰富图像。该数据集由 AllenAI 发布,旨在通过多种渲染器和编程语言生成不同类型的图像。

安装

  • 使用 Conda 创建并激活虚拟环境: bash conda create --name pixmo-doc python=3.10 conda activate pixmo-doc pip install -r requirements.txt

  • 导出 API 密钥: bash export OPENAI_API_KEY=your-api-key export ANTHROPIC_API_KEY=your-api-key export HF_TOKEN=your-api-key # 仅在需要上传数据集到 Hugging Face Hub 时使用

  • 安装额外依赖包:

    • LaTeX:根据操作系统参考 官方 LaTeX 网站

    • Mermaid:使用 npm 安装 Mermaid CLI: bash npm install -g @mermaid-js/mermaid-cli

    • HTML:安装 Playwright: bash pip install playwright playwright install

    • mlpfinance: bash pip install mpl_finance<=0.10.1 mplfinance<=0.12.10b0

快速开始

  • 使用 main.py 脚本生成数据集,支持的参数包括:

    • -p:指定使用的管道(Pipeline)。
    • -t:指定生成的数据类型。
    • -n:指定生成的样本数量。
    • -m:指定数据集的名称。

    例如: python python main.py -p "MatplotlibChartPipeline" -n 5 -m "matplotlib_test" -t "bar chart"

    将使用 MatplotlibChartPipeline 生成 5 个条形图,并保存为名为 "matplotlib_test" 的数据集。

管道(Pipelines)

Pixmo-docs 提供了 13 个管道,用于生成四类主要的文本丰富图像:图表、图示、表格和文档。每个管道使用不同的渲染器或编程语言生成图像。

图表(Chart)

  • MatplotlibChartPipeline:使用 Matplotlib 生成图表,如条形图、折线图等。
  • PlotlyChartPipeline:使用 Plotly 生成图表。
  • VegaLiteChartPipeline:使用 Vega-Lite 生成图表。
  • LaTeXChartPipeline:使用 TikZ 生成简单图表。
  • HTMLChartPipeline:使用 HTML 和 CSS 生成简单图表。

图示(Diagram)

  • GraphvizDiagramPipeline:使用 Graphviz 生成图示,如有向图、树等。
  • MermaidDiagramPipeline:使用 Mermaid 生成图示,如流程图、序列图等。
  • LaTeXDiagramPipeline:使用 TikZ 生成图示。

表格(Table)

  • LaTeXTablePipeline:适用于复杂结构的表格。
  • HTMLTablePipeline:仅适用于简单表格。
  • PlotlyTablePipeline:仅适用于简单表格。

文档(Document)

  • LaTeXDocumentPipeline:适用于多种类型的文档,如报告、文章等。
  • HTMLDocumentPipeline:可以创建具有复杂样式和结构的文档。

引用

如果使用该代码进行工作,请引用以下论文: bibtex @article{deitke2024molmo, title={Molmo and pixmo: Open weights and open data for state-of-the-art multimodal models}, author={Deitke, Matt and Clark, Christopher and Lee, Sangho and Tripathi, Rohun and Yang, Yue and Park, Jae Sung and Salehi, Mohammadreza and Muennighoff, Niklas and Lo, Kyle and Soldaini, Luca and others}, journal={arXiv preprint arXiv:2409.17146}, year={2024} }

搜集汇总
数据集介绍
main_image_url
构建方式
Pixmo-docs数据集通过集成多种生成管道构建,涵盖了图表、图解、表格和文档四大类。具体而言,该数据集利用了Matplotlib、Plotly、Vega-Lite、LaTeX、HTML等多种工具和编程语言,分别生成不同类型的图像。每个管道针对特定类型的数据生成进行了优化,确保了数据集的多样性和复杂性。通过这些管道,用户可以生成如条形图、折线图、流程图、复杂结构表格等多种类型的合成图像,从而为多模态数据研究提供了丰富的资源。
特点
Pixmo-docs数据集的显著特点在于其多样化的生成管道和广泛的应用场景。该数据集不仅支持生成多种类型的图表、图解、表格和文档,还通过不同的渲染工具和编程语言,确保了生成的图像在视觉和结构上的多样性。此外,数据集的生成过程高度可定制,用户可以根据需求选择特定的管道和数据类型,生成符合研究或应用需求的合成数据。这种灵活性和多样性使得Pixmo-docs成为多模态数据研究中的重要资源。
使用方法
使用Pixmo-docs数据集时,用户首先需要通过安装相关依赖和配置API密钥来准备环境。随后,通过运行`main.py`脚本,用户可以指定生成管道、数据类型和样本数量,生成所需的合成数据。例如,用户可以通过`MatplotlibChartPipeline`生成条形图,或通过`LaTeXDocumentPipeline`生成复杂结构的文档。此外,用户还可以同时使用多个管道生成不同类型的数据,进一步扩展数据集的多样性。详细的参数设置和使用方法可参考`main.py`脚本中的说明。
背景与挑战
背景概述
Pixmo-docs数据集由AllenAI机构主导开发,旨在支持合成图表、表格、图示等多种文本丰富图像的生成。该数据集的核心研究问题围绕如何高效生成高质量的合成图像,以支持多模态模型的训练与评估。Pixmo-docs的创建不仅为图像生成领域提供了新的工具和资源,还为相关研究领域如机器学习、计算机视觉等提供了丰富的数据支持。通过整合多种生成管道,Pixmo-docs展示了其在多模态数据生成方面的创新性和实用性,预计将对未来的多模态模型研究产生深远影响。
当前挑战
Pixmo-docs数据集在构建过程中面临多项挑战。首先,合成图像的多样性和复杂性要求开发多种生成管道,如Matplotlib、Plotly、Vega-Lite等,这增加了技术实现的复杂度。其次,确保生成的图像在视觉和语义上的一致性与准确性是一个持续的挑战,尤其是在处理复杂结构如表格和文档时。此外,数据集的生成过程依赖于多种外部工具和API,如LaTeX和Mermaid,这要求开发者具备跨领域的技术能力,并确保这些工具的兼容性和稳定性。最后,如何在大规模生成过程中保持数据的高质量和多样性,也是Pixmo-docs面临的一个重要挑战。
常用场景
经典使用场景
Pixmo-docs数据集的经典使用场景主要集中在生成合成图像,尤其是图表、表格、图示和文档等文本丰富的图像。通过多种渲染器和编程语言,如Matplotlib、Plotly、Vega-Lite、Graphviz和Mermaid等,该数据集能够生成高度多样化的视觉内容。例如,研究者可以利用MatplotlibChartPipeline生成柱状图、折线图等,或使用MermaidDiagramPipeline创建流程图和序列图。这些生成的图像可广泛应用于数据可视化、教育材料制作以及自动化文档生成等领域。
衍生相关工作
Pixmo-docs数据集的发布催生了一系列相关研究和工作,尤其是在多模态学习和数据可视化领域。例如,研究者利用该数据集生成的图像数据进行多模态模型的训练,探索图像与文本之间的复杂关系。此外,该数据集还启发了在自动化文档生成和教育技术领域的创新应用,如智能教学系统和自动化报告生成工具的开发。这些衍生工作不仅扩展了数据集的应用范围,还推动了相关技术的进步。
数据集最近研究
最新研究方向
在信息可视化与文档生成领域,Pixmo-docs数据集凭借其支持合成图表、表格、图示等多模态内容的特性,成为前沿研究的热点。该数据集通过集成多种生成管道,如Matplotlib、Plotly、Vega-Lite等,为研究者提供了丰富的工具集,以探索复杂数据的可视化表达。近年来,随着多模态学习与生成式AI的快速发展,Pixmo-docs在自动化文档生成、数据驱动的决策支持系统等领域展现出巨大潜力。其生成的合成数据不仅为机器学习模型提供了高质量的训练样本,还为跨领域的可视化研究提供了新的实验平台。此外,Pixmo-docs的开放性与多样性,使其在推动学术界与工业界的合作中发挥了重要作用,特别是在提升文档自动化处理与信息可视化的效率方面,具有深远的意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作