MentalManip|精神操纵数据集|对话分析数据集
收藏数据集概述
数据集名称
- MentalManip: 用于对话中精神操控的细粒度分析的数据集。
数据集来源
- 该数据集是ACL24接受论文MentalManip: A Dataset For Fine-grained Analysis of Mental Manipulation in Conversations的一部分,旨在解决自然语言处理领域中关于精神操控语言识别的资源和研究稀缺问题。
数据集内容
- 包含4,000个经过标注的电影对话,用于全面分析精神操控,包括操控技巧和受害者的脆弱性。
数据集结构
- mentalmanip_dataset目录下包含以下三个数据集:
- mentalManip_detailed.csv: 包含每个对话及其三个标注者的详细信息。
- mentalmanip_con.csv: 使用共识协议策略得到的最终标签。
- mentalmanip_maj.csv: 使用多数协议策略得到的最终标签。
数据集应用
- 用于评估和改进模型在识别和分类操控性对话内容方面的性能。
数据集访问
- 数据集可通过此处获取。
数据集统计分析
- 提供代码用于生成论文中的统计图表,包括技巧和脆弱性的分布图、情感分数分布图等。
引用信息
- 引用格式: bibtex @inproceedings{MentalManip, title={MentalManip: A Dataset For Fine-grained Analysis of Mental Manipulation in Conversations}, author={Yuxin Wang, Ivory Yang, Saeed Hassanpour, Soroush Vosoughi}, booktitle={the Association for Computational Linguistics}, year={2024} }

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录