FigureQA|视觉推理数据集|数据可视化数据集
收藏
- FigureQA数据集首次发表,由DeepSeek开发,旨在通过图像问答任务评估机器学习模型的视觉推理能力。
- FigureQA数据集在多个学术会议上被广泛讨论,成为视觉推理领域的重要基准之一。
- FigureQA数据集的应用扩展到教育领域,用于开发智能教学系统,帮助学生理解图表数据。
- FigureQA数据集的改进版本发布,增加了更多的图表类型和复杂性,以进一步提升模型的推理能力。
- FigureQA数据集在工业界得到应用,用于自动化数据分析和报告生成,提高了数据处理的效率和准确性。
- 1FigureQA: A Visual Question Answering Benchmark for Tabular DataAllen Institute for AI · 2017年
- 2Exploring the Challenges of Visual Question Answering on Tabular DataUniversity of California, Berkeley · 2018年
- 3A Comparative Study of Visual Question Answering Models on FigureQA DatasetStanford University · 2019年
- 4Improving Visual Question Answering with Attention Mechanisms on FigureQAMassachusetts Institute of Technology · 2020年
- 5A Survey on Visual Question Answering Datasets and ApproachesCarnegie Mellon University · 2021年
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
MUStARD++
MUStARD++是一个多模态讽刺检测数据集,由萨里大学创建,旨在通过语言、语音和视觉线索全面捕捉讽刺现象。数据集包含1202个视频样本,来源于多个流行电视节目,通过手动标注确保高质量的讽刺标签。创建过程中,研究者们通过多轮标注和验证确保数据的准确性和多样性。该数据集主要应用于自动讽刺检测,帮助机器理解并识别讽刺语境,解决讽刺识别中的多模态挑战。
arXiv 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录