openkg/MHaluBench|多模态模型数据集|幻觉检测数据集
收藏数据集概述
基本信息
- 许可证: MIT
- 任务类别: 文本生成
- 语言: 英语
- 标签: 代码
- 美观名称: MHaluBench
- 大小类别: 1K<n<10K
配置详情
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: MHaluBench_train.json
- 分割: val
- 路径: MHaluBench_val-v0.1.json
- 分割: train
- 数据文件:
数据集统计
- 数据集: MHaluBench
- 内容: 包含图像到文本和文本到图像生成的内容,旨在严格评估多模态幻觉检测器的进展。
- 详细统计: 请参见下图。
框架说明
- 框架: UniHD
- 目标: 针对图像到文本和文本到图像任务,系统地处理多模态幻觉识别。
- 具体说明: 请参见下图。
版本信息
- 验证集版本:
- v0.1: 用于UniHD论文的数据。
- v0.2: 修改了图像6dfc3ab66883fd8c.jpg和图像COCO_val2014_000000009727.jpg中的第五个声明标签。
引用
- 请引用我们的仓库,如果您在工作中使用了EasyDetect。

Coffee_Shop_Sales
该数据集包含了咖啡店的详细交易信息,包括交易ID、日期、时间、店铺编号、位置、产品类别、类型、名称、价格、月份、日期、星期和小时等属性。数据集用于分析咖啡店的销售情况,如收入和交易量的变化趋势。
github 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
koen430/relevant_selected_stock_news
该数据集包含通过GPT-3.5-turbo筛选出的新闻文章,旨在用于微调大型语言模型,以预测新闻发布后的股票价格变动。数据集包括多个特征,如股票代码、提示、文本、URL、结果、相关性、令牌计数等,并分为训练集、验证集和测试集。
hugging_face 收录
ISIC 2018
ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。
challenge2018.isic-archive.com 收录