five

MiMe-MeMo/MeMo-Dataset-SA

收藏
Hugging Face2024-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MiMe-MeMo/MeMo-Dataset-SA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于19世纪斯堪的纳维亚女性作家文学作品的情感分类研究。数据集包含训练集、开发集和测试集,每个文件包含两列,分别是句子和情感标注(1=正面,0=中性,2=负面)。该数据集旨在验证或反驳一个文学假设,即该时期女性作家的写作以负面情感为特征。

该数据集用于19世纪斯堪的纳维亚女性作家文学作品的情感分类研究。数据集包含训练集、开发集和测试集,每个文件包含两列,分别是句子和情感标注(1=正面,0=中性,2=负面)。该数据集旨在验证或反驳一个文学假设,即该时期女性作家的写作以负面情感为特征。
提供机构:
MiMe-MeMo
原始信息汇总

历史丹麦和挪威文学文本的情感分类

描述

本项目描述了对19世纪斯堪的纳维亚女性作家小说进行情感分类的文学分析研究。我们创建了一个数据集,训练和评估情感分类方法,并使用预训练的语言模型来确认和反驳一个文学假设,即该时期女性作家的写作具有负面情感特征。该数据集和训练模型预计将对未来分析历史丹麦和挪威文学文本具有价值。

数据集

数据集上传到dataset目录,结构如下:

  1. train_set.txt: 包含用于情感分析的带注释训练文本的TXT文件。
  2. dev_set.txt: 包含用于情感分析的带注释开发文本的TXT文件。
  3. test_set.txt: 包含用于情感分析的带注释测试文本的TXT文件。

每个文件包含两列(制表符分隔),第一列是句子,第二列是情感注释(1=正面,0=中性,2=负面)。

使用方法

要使用数据集和代码,请按照以下步骤操作:

  1. 克隆或下载此GitHub仓库。
  2. 访问dataset目录中的数据集文件和Python代码文件。
  3. 使用数据集文件进行情感分析模型的训练、开发和测试。
  4. 使用您喜欢的IDE或Python环境运行Python代码文件,了解如何加载、预处理和分析历史文本数据。

许可证

本仓库中的数据集和代码在Creative Commons Attribution 4.0 International license下发布。

引用

有关情感注释和分类的更多详细信息,请参阅以下论文

@inproceedings{allaith2023sentiment, title={Sentiment Classification of Historical Literary in {D}anish and {N}orwegian Texts}, author={Ali Al-Laith and Kirstine Nielsen Degn and Alexander Conroy and Bolette S. Pedersen and Jens Bjerring-Hansen and Daniel Hershcovich}, booktitle={The 24rd Nordic Conference on Computational Linguistics}, year={2023}, url={https://openreview.net/forum?id=dszKbb2GH3} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作