xingkunliuxtracta/nlu_evaluation_data

Name: xingkunliuxtracta/nlu_evaluation_data
Creator: xingkunliuxtracta
Published: 2024-01-18 11:10:41
License: 暂无描述

Hugging Face2024-01-18 更新2024-05-25 收录

下载链接：

https://hf-mirror.com/datasets/xingkunliuxtracta/nlu_evaluation_data

下载链接

链接失效反馈

官方服务：

资源简介：

NLU Evaluation Data数据集包含来自对话领域的短语句，标注了对应的意图和场景。数据集共有25,715个非零样本，涵盖了18个场景和68个意图。数据集最初通过众包方式收集，并标注了意图和命名实体，用于评估商业NLU系统如RASA、IBM Watson、Microsoft LUIS和Google Dialogflow。此版本的数据集仅包含意图标注。数据集的结构包括文本、标签和场景三个字段，标签对应68个唯一的意图。数据集的创建目的是为了广泛覆盖和比较流行的NLU服务，包含的意图和场景数量远超之前的评估数据集。

提供机构：

xingkunliuxtracta

原始信息汇总

数据集概述

名称: NLU Evaluation Data

语言: 英语

许可证: CC-BY-4.0

多语言性: 单语种

大小: 10K<n<100K

来源: 原始数据

任务类别: 文本分类

任务ID: 意图分类, 多类分类

数据集结构

特征:

text: 字符串类型
scenario: 字符串类型
label: 分类标签，对应68个意图

意图标签映射:

0: alarm_query
1: alarm_remove
2: alarm_set
...
67: weather_query

数据分割:

train: 25,715个样本

数据集创建

注释创建者: 专家生成

语言创建者: 专家生成

注释过程: 通过Amazon Mechanical Turk收集真实用户数据，设计任务以捕捉不同场景下的请求。

许可证: 创意共享署名4.0国际许可(CC BY 4.0)

5,000+

优质数据集

54 个

任务类型

进入经典数据集