AmbiK|机器人模糊性检测数据集|自然语言处理数据集
收藏AmbiK数据集概述
数据集简介
- 名称: AmbiK (Ambiguous Tasks in Kitchen Environment)
- 目的: 为厨房环境中的机器人提供模糊指令数据集,用于统一比较模糊检测方法
- 特点:
- 完全文本形式
- 通过LLMs辅助收集并经过人工验证
- 包含1000对模糊任务及其明确对应任务
数据类型与结构
- 任务类型:
- 模糊任务
- 明确任务(直接明确和间接明确)
- 分类:
- 人类偏好 (Human Preferences)
- 常识知识 (Common Sense Knowledge)
- 安全性 (Safety)
数据字段
- 环境描述:
- Environment short: 自然语言描述
- Environment full: 对象列表形式
- 任务描述:
- Unambiguous direct: 使用对象确切名称的明确任务
- Unambiguous indirect: 重新表述的明确任务
- Ambiguous task: 与明确直接任务对应的模糊任务
- 模糊信息:
- Ambiguity type: 消除模糊所需的知识类型
- Ambiguity shortlist/Variants: 消除模糊的对象集合(仅偏好类型)
- Question: 消除模糊的澄清问题
- Answer: 澄清问题的答案
- 任务计划:
- Plan for unambiguous task: 明确任务的详细计划
- Plan for ambiguous task: 模糊任务的详细计划
- Start of ambiguity: 模糊开始的计划点编号
数据集规模
- 总任务数: 2000(1000对模糊与明确任务)
- 校准数据: 100个示例 (
ambik_calibrate_100.csv
) - 测试数据: 900个示例 (
ambik_test_900.csv
),或400个示例 (ambik_test_400.csv
)
实验运行说明
- 准备:
- 测试LofreeCP方法需下载
en_core_web_md
模型
- 测试LofreeCP方法需下载
- 校准:
- 运行
<experiment folder>/calibrate.py
进行校准
- 运行
- 测试:
- 运行
<experiment folder>/pipeline.py
进行测试 - 结果保存在新文件夹
<CP value>_<LLM1>_<LLM2>
中
- 运行
仓库结构
ambik_dataset
: 包含AmbiK数据的.csv文件configs
: 包含用于更改LLMs及其参数的.yaml文件utils
: 包含指标计算和LLM启动的代码- 实验方法文件夹 (
knowno
,lofree
,LAP
,binary
,nohelp
): 包含运行实验的代码 requirements.txt
: 实验使用的Python库版本

- 1AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment俄罗斯莫斯科人工智能研究院 · 2025年
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录
RETQA
RETQA是由北京师范大学创建的第一个大规模开放领域中文表格问答数据集,专门针对房地产领域。该数据集包含4932个表格和20762个问答对,涵盖16个子领域,涉及房产信息、房地产公司财务信息和土地拍卖信息。数据集通过从中国八个主要城市的公开数据源收集并清洗整理,每个表格都配有摘要标题以辅助检索。RETQA的创建过程包括表格收集、问答对生成、意图和槽标签注释以及查询重写和质量控制。该数据集主要用于解决房地产领域的开放域和长表格问答问题,推动表格问答技术的发展。
arXiv 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
Chinese-Poetry-Corpus
本语料库收集自互联网,包含了从先秦到当代的古诗词数据,以CSV格式进行存储。经过去重后,包含诗词共计1014508首。古诗词按朝代进行划分,存储于文件夹下,命名规则为朝代.csv。每首诗词数据包含五个字段,分别为标题、朝代、作者、体裁、内容。
github 收录
Yahoo Finance Historical Data
该数据集包含来自Yahoo Finance的历史股票数据,涵盖了股票的开盘价、收盘价、最高价、最低价、成交量等信息。数据集的时间跨度从2000年1月至今,提供了全球多个市场的股票数据。
finance.yahoo.com 收录