five

MobASA

收藏
github2022-07-04 更新2024-05-31 收录
下载链接:
https://github.com/DFKI-NLP/sim3s-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个新颖的德语推文数据集,标注了与公共交通相关性和无障碍旅行相关的情感。数据集关注于因残疾、年龄或携带幼儿而行动受限的乘客的重要话题。

This is a novel dataset of German tweets, annotated for relevance to public transportation and sentiments related to accessible travel. The dataset focuses on the important topic of passengers with limited mobility due to disabilities, age, or traveling with young children.
创建时间:
2022-06-16
原始信息汇总

数据集概述

数据集名称

MobASA: Corpus for Aspect-based Sentiment Analysis and Social Inclusion in the Mobility Domain

描述

MobASA是一个德语语料库,包含与公共交通相关的推文,并针对无障碍旅行的相关方面进行了情感标注。该数据集关注因残疾、年龄或携带幼儿而行动受限的乘客的重要话题。

用途

  • 作为面向方面的情感分析的训练或测试语料库。
  • 有助于构建包容性的公共交通系统。

格式

数据以XML格式提供,遵循GermEval Task 2017 - Shared Task on Aspect-based Sentiment的描述格式。

许可证

数据集遵循CC-BY 4.0许可。

引用信息

@InProceedings{gabryszak-thomas:2022:CSRNLP1, author = {Gabryszak, Aleksandra and Thomas, Philippe}, title = {MobASA: Corpus for Aspect-based Sentiment Analysis and Social Inclusion in the Mobility Domain}, booktitle = {Proceedings of the First Computing Social Responsibility Workshop within the 13th Language Resources and Evaluation Conference}, month = {June}, year = {2022}, address = {Marseille, France}, publisher = {European Language Resources Association}, pages = {35--39}, abstract = {In this paper we show how aspect-based sentiment analysis might help public transport companies to improve their social responsibility for accessible travel. We present MobASA: a novel German-language corpus of tweets annotated with their relevance for public transportation, and with sentiment towards aspects related to barrier-free travel. We identified and labeled topics important for passengers limited in their mobility due to disability, age, or when travelling with young children. The data can be used to identify hurdles and improve travel planning for vulnerable passengers, as well as to monitor a perception of transportation businesses regarding the social inclusion of all passengers. The data is publicly available under: https://github.com/DFKI-NLP/sim3s-corpus}, url = {http://www.lrec-conf.org/proceedings/lrec2022/workshops/CSRNLP1/pdf/2022.csrnlp1-1.5.pdf} }

搜集汇总
数据集介绍
main_image_url
构建方式
MobASA数据集的构建过程聚焦于收集与分析德语推文,这些推文与公共交通领域的情感分析及社会包容性密切相关。研究团队通过识别并标注与无障碍旅行相关的情感方面,特别关注了因残疾、年龄或携带幼童而行动受限的乘客需求。数据以XML格式提供,遵循了2017年GermEval任务中描述的格式标准,确保了数据的规范性和可扩展性。
特点
MobASA数据集的特点在于其专注于公共交通领域的无障碍旅行情感分析,涵盖了多样化的乘客群体需求。数据集不仅标注了推文与公共交通的相关性,还深入分析了与无障碍旅行相关的情感极性。这种细粒度的标注方式为研究者提供了丰富的情感分析视角,同时也为公共交通系统的包容性设计提供了数据支持。
使用方法
MobASA数据集的使用方法灵活多样,主要适用于面向方面的情感分析任务。研究者可以利用该数据集训练或测试模型,以识别公共交通领域中的情感倾向及无障碍旅行的相关议题。此外,数据集还可用于监测公共交通企业在社会包容性方面的表现,为政策制定者提供数据驱动的决策支持。数据以XML格式提供,便于集成到现有的自然语言处理流程中。
背景与挑战
背景概述
MobASA数据集由Aleksandra Gabryszak和Philippe Thomas于2022年创建,旨在通过基于方面的情感分析(Aspect-based Sentiment Analysis, ABSA)提升公共交通系统的社会包容性。该数据集包含德语推文,标注了与无障碍出行相关的情感信息,重点关注因残疾、年龄或携带幼儿而行动受限的乘客需求。MobASA的发布为公共交通公司提供了识别障碍、优化旅行规划的工具,同时监测公众对交通企业社会包容性的感知。该数据集在2022年语言资源与评估会议(LREC)的社会责任计算研讨会上首次亮相,成为推动无障碍出行研究的重要资源。
当前挑战
MobASA数据集面临多方面的挑战。首先,在领域问题方面,基于方面的情感分析需要精确识别推文中与无障碍出行相关的具体方面,并准确标注情感极性,这对自然语言处理技术提出了较高要求。其次,数据构建过程中,推文的多样性和语言复杂性增加了标注难度,尤其是在德语语境下,情感表达的细微差别和上下文依赖关系需要高度专业的标注团队。此外,确保数据集的代表性和平衡性,涵盖不同群体和场景的无障碍出行需求,也是构建过程中的重要挑战。这些挑战共同推动了MobASA在技术和方法论上的创新。
常用场景
经典使用场景
MobASA数据集在公共交通领域的应用尤为突出,特别是在无障碍出行方面。该数据集通过对德语推文的标注,捕捉了与无障碍出行相关的情感倾向,为公共交通公司提供了宝贵的数据支持。通过分析这些数据,研究者能够识别出影响特定群体(如老年人、残疾人或带小孩的家庭)出行的关键因素,从而优化服务设计。
衍生相关工作
MobASA数据集的发布催生了一系列相关研究,特别是在情感分析和社会责任领域。例如,基于该数据集的研究工作探索了如何利用情感分析技术提升公共交通系统的社会包容性。此外,一些研究还结合机器学习算法,开发了自动化工具,用于实时监测和评估公共交通服务的无障碍水平,进一步推动了该领域的技术进步。
数据集最近研究
最新研究方向
在移动性领域,MobASA数据集为基于方面的情感分析(Aspect-based Sentiment Analysis, ABSA)提供了独特的视角,特别是在无障碍出行和社会包容性方面。该数据集通过标注与公共交通相关的推文,捕捉了因残疾、年龄或携带幼儿而行动受限的乘客的情感倾向。近年来,随着社会对包容性交通系统的需求日益增长,MobASA数据集在帮助公共交通公司识别障碍、优化旅行规划以及监测公众对交通企业社会责任的感知方面发挥了重要作用。此外,该数据集还为自然语言处理领域的研究者提供了丰富的语料资源,推动了情感分析技术在公共服务领域的应用与创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作