xingkunliuxtracta/nlu_evaluation_data
收藏Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/xingkunliuxtracta/nlu_evaluation_data
下载链接
链接失效反馈官方服务:
资源简介:
NLU Evaluation Data数据集包含来自对话领域的短语句,标注了对应的意图和场景。数据集共有25,715个非零样本,涵盖了18个场景和68个意图。数据集最初通过众包方式收集,并标注了意图和命名实体,用于评估商业NLU系统如RASA、IBM Watson、Microsoft LUIS和Google Dialogflow。此版本的数据集仅包含意图标注。数据集的结构包括文本、标签和场景三个字段,标签对应68个唯一的意图。数据集的创建目的是为了广泛覆盖和比较流行的NLU服务,包含的意图和场景数量远超之前的评估数据集。
NLU Evaluation Data数据集包含来自对话领域的短语句,标注了对应的意图和场景。数据集共有25,715个非零样本,涵盖了18个场景和68个意图。数据集最初通过众包方式收集,并标注了意图和命名实体,用于评估商业NLU系统如RASA、IBM Watson、Microsoft LUIS和Google Dialogflow。此版本的数据集仅包含意图标注。数据集的结构包括文本、标签和场景三个字段,标签对应68个唯一的意图。数据集的创建目的是为了广泛覆盖和比较流行的NLU服务,包含的意图和场景数量远超之前的评估数据集。
提供机构:
xingkunliuxtracta
原始信息汇总
数据集概述
名称: NLU Evaluation Data
语言: 英语
许可证: CC-BY-4.0
多语言性: 单语种
大小: 10K<n<100K
来源: 原始数据
任务类别: 文本分类
任务ID: 意图分类, 多类分类
数据集结构
特征:
- text: 字符串类型
- scenario: 字符串类型
- label: 分类标签,对应68个意图
意图标签映射:
- 0: alarm_query
- 1: alarm_remove
- 2: alarm_set
- ...
- 67: weather_query
数据分割:
- train: 25,715个样本
数据集创建
注释创建者: 专家生成
语言创建者: 专家生成
注释过程: 通过Amazon Mechanical Turk收集真实用户数据,设计任务以捕捉不同场景下的请求。
许可证: 创意共享署名4.0国际许可(CC BY 4.0)



