MC-EIU|人机交互数据集|情感与意图分析数据集
收藏MC-EIU 数据集分析
数据集下载
- 百度云链接: 链接
- 提取码获取: 论文接受结果公布后,通过电子邮件联系作者获取。
数据集分析
数据可视化
- 图1: 情感与意图在MC-EIU数据集中的相关性可视化。每个圆圈代表特定“情感-意图”对的样本数量。较大的圆圈表示更多的样本和更高的相关性。
相关性分析
- 数据集: MC-EIU-English 和 MC-EIU-Mandarin
- 矩阵表示: 创建了两个7×9的二维矩阵,每个元素代表每个“情感-意图”对的样本数量。
- 可视化方法: 使用样本数量作为半径,在相应的矩阵位置上绘制圆圈。
观察结果
- 情感与意图的关系: 情感和意图并非严格的一对一对应关系,不同的意图对特定情感的影响不同,反之亦然。
- 例如,“Hap-Sym”与“Hap-Agr”相比,后者出现频率更高,表明“Agreeing”更可能驱动“Happy”的表达。
- 数据集差异: 英语数据集中的情感与意图的相关性比普通话数据集更为复杂。
- 例如,“Sur”情感在英语数据集中与所有意图类别相关联,而在普通话数据集中仅与6个意图类别(“Que”, “Agr”, “Con”, “Sug”, “Wis”, 和 “Neu”)相关联。
- 模型性能: 由于这种复杂关系,模型在英语数据集上的表现相对低于普通话数据集。

- 1Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset内蒙古大学 · 2024年
开源PHM数据集
本文分享了一个全球各大学、研究机构和公司捐赠的PHM(Prognostics and Health Management)开源数据集,涵盖加工制造、轨道交通、能源电力和半导体等行业的多种场景,包含部件级、设备级和产线级数据。用户可以利用这些数据开发智能分析和建模算法,数据集分类包括故障诊断、健康评估和寿命预测。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
XJTU-SY Bearing Datasets
XJTU-SY轴承数据集由西安交通大学设计科学与基础部件研究所和浙江长兴Sumyoung科技有限公司提供。数据集包含了15个滚动轴承从运行到故障的完整数据,这些数据是通过进行多次加速退化实验获得的。这些数据集公开可用,任何人都可以使用它们来验证滚动轴承的预测算法。
github 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录