li2017dailydialog/daily_dialog|对话系统数据集|情感分析数据集
收藏数据集概述
数据集摘要
DailyDialog 是一个高质量的多轮对话数据集,具有以下特点:
- 语言为人工编写,噪声较少。
- 对话反映了日常交流方式,涵盖了各种日常生活的主题。
- 数据集经过手动标注,包含交流意图和情感信息。
支持的任务和排行榜
- 任务类别:文本分类
- 任务ID:多标签分类
语言
- 语言:英语
数据集结构
数据实例
一个 validation 数据实例的示例如下: json { "act": [2, 1, 1, 1, 1, 2, 3, 2, 3, 4], "dialog": ["Good afternoon . This is Michelle Li speaking , calling on behalf of IBA . Is Mr Meng available at all ? ", " This is Mr Meng ...",], "emotion": [0, 0, 0, 0, 0, 0, 0, 0, 0, 0] }
数据字段
所有数据分割中的数据字段相同:
dialog:一个string特征的list。act:一个分类标签的list,可能值包括__dummy__(0),inform(1),question(2),directive(3) 和commissive(4)。emotion:一个分类标签的list,可能值包括no emotion(0),anger(1),disgust(2),fear(3),happiness(4),sadness(5) 和surprise(6)。
数据分割
| name | train | validation | test |
|---|---|---|---|
| default | 11118 | 1000 | 1000 |
数据集创建
数据集来源
- 数据集创建者:专家生成
- 语言创建者:发现
- 源数据集:原始
数据集大小
- 大小类别:10K<n<100K
- 下载大小:4475921 字节
- 数据集大小:8626502 字节
许可证信息
DailyDialog 数据集的许可证为 CC BY-NC-SA 4.0。
引用信息
bibtex @InProceedings{li2017dailydialog, author = {Li, Yanran and Su, Hui and Shen, Xiaoyu and Li, Wenjie and Cao, Ziqiang and Niu, Shuzi}, title = {DailyDialog: A Manually Labelled Multi-turn Dialogue Dataset}, booktitle = {Proceedings of The 8th International Joint Conference on Natural Language Processing (IJCNLP 2017)}, year = {2017} }

中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
UAVDT Dataset
The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.
datasetninja.com 收录
集装箱数据集
集装箱数据集,包含3500张1080p集装箱图像以及其编码区的xml标注
AI_Studio 收录
GVJahnavi/Crops_set
该数据集包含图像和标签两个主要特征。图像特征的数据类型为图像,标签特征的数据类型为类标签,具体包括20种不同的植物病害和健康状态,如玉米的灰斑病、普通锈病、北方叶枯病,以及番茄的细菌性斑点病、早疫病、晚疫病等。数据集分为训练集和测试集,训练集包含25384个样本,测试集包含6346个样本。数据集的下载大小为514893426字节,总大小为474216412.07000005字节。
hugging_face 收录
