chart-misinformation-detection/bar_graph_improved_captioning

Name: chart-misinformation-detection/bar_graph_improved_captioning
Creator: chart-misinformation-detection
Published: 2024-07-28 21:22:29
License: 暂无描述

Hugging Face2024-07-28 更新2025-04-26 收录

下载链接：

https://hf-mirror.com/datasets/chart-misinformation-detection/bar_graph_improved_captioning

下载链接

链接失效反馈

官方服务：

资源简介：

I refined the llm prompt to produce more focused captions for bar graphs. Also used an llm to generate datasets across various domains. --- dataset_info: features: - name: id dtype: string - name: image dtype: image - name: title dtype: string - name: caption dtype: string - name: chart_type dtype: string - name: domain dtype: string - name: is_misleading dtype: class_label: names: '0': 'No' '1': 'Yes' - name: misleading_feature dtype: string splits: - name: train num_bytes: 61368636.0 num_examples: 448 - name: validation num_bytes: 7586895.0 num_examples: 56 - name: test num_bytes: 7814668.0 num_examples: 56 download_size: 64731351 dataset_size: 76770199.0 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - split: test path: data/test-* ---

笔者优化了大语言模型（Large Language Model, LLM）的提示词，以生成更贴合柱状图的精准说明文本。同时借助大语言模型生成了覆盖多领域的数据集。 --- 数据集信息：特征字段： - 字段名：id，数据类型：字符串 - 字段名：image，数据类型：图像 - 字段名：title，数据类型：字符串 - 字段名：caption，数据类型：字符串 - 字段名：chart_type，数据类型：字符串 - 字段名：domain，数据类型：字符串 - 字段名：is_misleading，数据类型：类别标签，类别映射：0对应‘否’，1对应‘是’ - 字段名：misleading_feature，数据类型：字符串数据集划分： - 划分名称：train（训练集），占用字节数：61368636.0，样本数量：448 - 划分名称：validation（验证集），占用字节数：7586895.0，样本数量：56 - 划分名称：test（测试集），占用字节数：7814668.0，样本数量：56 下载总大小：64731351 数据集总大小：76770199.0 配置项： - 配置名称：default（默认配置），数据文件对应如下： - 训练集：data/train-* - 验证集：data/validation-* - 测试集：data/test-* ---

提供机构：

chart-misinformation-detection

5,000+

优质数据集

54 个

任务类型

进入经典数据集