five

xingkunliuxtracta/nlu_evaluation_data

收藏
Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/xingkunliuxtracta/nlu_evaluation_data
下载链接
链接失效反馈
官方服务:
资源简介:
NLU Evaluation Data数据集包含来自对话领域的短语句,标注了对应的意图和场景。数据集共有25,715个非零样本,涵盖了18个场景和68个意图。数据集最初通过众包方式收集,并标注了意图和命名实体,用于评估商业NLU系统如RASA、IBM Watson、Microsoft LUIS和Google Dialogflow。此版本的数据集仅包含意图标注。数据集的结构包括文本、标签和场景三个字段,标签对应68个唯一的意图。数据集的创建目的是为了广泛覆盖和比较流行的NLU服务,包含的意图和场景数量远超之前的评估数据集。

NLU Evaluation Data数据集包含来自对话领域的短语句,标注了对应的意图和场景。数据集共有25,715个非零样本,涵盖了18个场景和68个意图。数据集最初通过众包方式收集,并标注了意图和命名实体,用于评估商业NLU系统如RASA、IBM Watson、Microsoft LUIS和Google Dialogflow。此版本的数据集仅包含意图标注。数据集的结构包括文本、标签和场景三个字段,标签对应68个唯一的意图。数据集的创建目的是为了广泛覆盖和比较流行的NLU服务,包含的意图和场景数量远超之前的评估数据集。
提供机构:
xingkunliuxtracta
原始信息汇总

数据集概述

名称: NLU Evaluation Data

语言: 英语

许可证: CC-BY-4.0

多语言性: 单语种

大小: 10K<n<100K

来源: 原始数据

任务类别: 文本分类

任务ID: 意图分类, 多类分类

数据集结构

特征:

  • text: 字符串类型
  • scenario: 字符串类型
  • label: 分类标签,对应68个意图

意图标签映射:

  • 0: alarm_query
  • 1: alarm_remove
  • 2: alarm_set
  • ...
  • 67: weather_query

数据分割:

  • train: 25,715个样本

数据集创建

注释创建者: 专家生成

语言创建者: 专家生成

注释过程: 通过Amazon Mechanical Turk收集真实用户数据,设计任务以捕捉不同场景下的请求。

许可证: 创意共享署名4.0国际许可(CC BY 4.0)

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作