five

Chinese Pun Rebus Art Dataset|中文双关语艺术数据集|视觉模型评估数据集

收藏
github2024-06-12 更新2024-06-14 收录
中文双关语艺术
视觉模型评估
下载链接:
https://github.com/zhang-tuo-pdf/Pun-Rebus-Art-Benchmark
下载链接
链接失效反馈
资源简介:
这是一个多模态数据集,用于理解和评估中文双关语艺术,包含艺术作品图像和相关的真实信息,用于评估大型视觉模型的能力。

This is a multimodal dataset designed for understanding and evaluating the art of Chinese puns. It includes images of artworks and related authentic information, aimed at assessing the capabilities of large vision models.
创建时间:
2024-06-10
原始信息汇总

数据集概述

  • 数据集名称:Chinese Pun Rebus Art Dataset
  • 数据集目的:用于评估语言模型对中文谐音画艺术的理解能力。
  • 数据集内容
    • 艺术作品图像
    • 地真信息
    • 三种基本任务的评分器
    • 基于GPT-4, Gemini, Claude 3, Qwen-VL模型的基准评估代码

数据下载

  • 图像下载:通过运行bash download_images.sh命令下载纯艺术作品图像。
  • 答案表下载答案表链接,包含数据集中每个故事的类别和关键元素信息。

使用方法

  • 基准评估代码:提供基于GPT-4, Gemini, Claude 3, Qwen-VL模型的评估代码,每个模型家族针对三种基本任务提供三个阅读器文件。
  • 评分器使用:在scorer文件夹中运行相应的Python脚本进行评分,需确保doc_file指向响应文本文件路径。

联系方式

  • 作者:Tuo Zhang, Tiantian Feng
  • 邮箱:tuozhang@usc.edu, tiantiaf@usc.edu
AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建中国谜语艺术数据集的过程中,研究团队精心收集了大量具有文化特色的谜语艺术作品,并对其进行了细致的标注。这些作品不仅涵盖了丰富的视觉元素,还包含了与之对应的文字描述,旨在全面捕捉谜语艺术的多元表达。通过这种方式,数据集不仅为机器学习模型提供了丰富的训练素材,也为后续的研究和应用奠定了坚实的基础。
使用方法
使用该数据集时,用户可以通过提供的下载链接获取艺术作品的图像和相应的标注信息。为了评估模型的性能,研究团队还提供了基于GPT-4、Gemini、Claude 3和Qwen-VL等模型的基准评估代码。用户可以通过运行这些代码,对模型的响应进行评估,并根据结果进行进一步的优化和调整。此外,数据集还提供了独立的评分器,用于对模型的输出进行详细的分析和评分。
背景与挑战
背景概述
中国谐音谜语艺术数据集(Chinese Pun Rebus Art Dataset)是由张拓、冯天田等研究人员于2024年创建,旨在通过多模态数据集推动对中国谐音谜语艺术的理解。该数据集不仅包含艺术作品的图像,还提供了详细的标注信息,涵盖了故事的类别和关键元素。这一数据集的开发,标志着对中国传统文化深度挖掘的新阶段,为研究者提供了丰富的资源,以探索和评估语言模型在处理复杂文化内容时的能力。
当前挑战
该数据集在构建过程中面临的主要挑战包括:首先,如何准确捕捉和标注谐音谜语艺术中的多重文化元素,确保数据的高质量与一致性。其次,如何设计有效的评估机制,以衡量不同语言模型在理解和生成谐音谜语艺术内容方面的表现。此外,数据集的多样性和复杂性也对模型的泛化能力提出了高要求,需要研究者不断优化和调整评估方法,以适应不同模型的特性。
常用场景
经典使用场景
在中华文化的深厚底蕴中,双关语和谜语艺术(Pun Rebus Art)作为一种独特的表达形式,承载了丰富的文化内涵。Chinese Pun Rebus Art Dataset 数据集通过提供大量的双关语和谜语艺术作品及其详细注释,为研究者提供了一个宝贵的资源。该数据集的经典使用场景包括但不限于:利用这些艺术作品进行多模态学习模型的评估,通过图像和文本的结合,探索模型对双关语和谜语的理解能力。此外,研究者还可以利用该数据集开发新的评估工具,以更精确地衡量模型在处理复杂语言现象时的表现。
解决学术问题
在语言学和人工智能领域,理解和生成双关语和谜语一直是极具挑战性的研究课题。Chinese Pun Rebus Art Dataset 数据集通过提供丰富的多模态数据,为解决这一学术难题提供了新的途径。该数据集不仅帮助研究者更好地理解双关语和谜语的结构和意义,还促进了多模态学习模型的发展,使得模型能够更准确地处理和生成这类复杂的语言现象。此外,该数据集还为跨文化交流研究提供了宝贵的资源,有助于揭示不同文化背景下双关语和谜语的异同。
实际应用
在实际应用中,Chinese Pun Rebus Art Dataset 数据集具有广泛的应用前景。例如,在教育领域,该数据集可以用于开发互动式学习工具,帮助学生更好地理解和欣赏双关语和谜语艺术,从而提升语言学习的效果。在文化传播领域,该数据集可以用于制作文化教育节目或互动展览,向公众展示中华文化的独特魅力。此外,该数据集还可以应用于人工智能产品的开发,如智能对话系统或语言生成模型,提升这些产品在处理复杂语言现象时的表现。
数据集最近研究
最新研究方向
在中华文化深度挖掘的背景下,中国谜语艺术数据集(Chinese Pun Rebus Art Dataset)的研究正朝着多模态理解和跨文化传播的方向发展。该数据集不仅为研究者提供了丰富的图像和文本资源,还通过结合GPT-4、Gemini、Claude 3和Qwen-VL等先进模型,推动了文化内容解析与生成技术的前沿探索。这些研究不仅有助于提升机器对复杂文化符号的理解能力,还为跨文化交流提供了新的工具和视角,从而在全球化背景下增强了中华文化的传播力和影响力。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

MIDV-500

该数据集包含使用移动设备拍摄的不同文档图像,这些图像通常具有投影变形。数据集分为训练和测试两部分,其中训练部分包含30种文档类型,测试部分包含20种,在应用神经网络之前,所有图像都被缩放到统一的宽度,宽度为400像素。该数据集的任务是进行消失点检测。

arXiv 收录

全国兴趣点(POI)数据

  POI(Point of Interest),即兴趣点,一个POI可以是餐厅、超市、景点、酒店、车站、停车场等。兴趣点通常包含四方面信息,分别为名称、类别、坐标、分类。其中,分类一般有一级分类和二级分类,每个分类都有相应的行业的代码和名称一一对应。  POI包含的信息及其衍生信息主要包含三个部分:

CnOpenData 收录

DAGM 2016

DAGM 2016数据集是一个用于工业图像分类的公开数据集,主要用于检测和分类工业零件中的缺陷。该数据集包含多个类别的图像,每类图像都有正常和缺陷两种状态。

resources.mpi-inf.mpg.de 收录