five

Turkish Tourism ABSA Dataset

收藏
github2022-03-08 更新2024-05-31 收录
下载链接:
https://github.com/salurumut/Turkish-Aspect-Based-Sentiment-Analysis-Corpus-for-Smart-Tourism
下载链接
链接失效反馈
官方服务:
资源简介:
土耳其旅游ABSA数据集是一个大型人工标注数据集,旨在为土耳其方面情感分析(ABSA)研究做出贡献。数据集中的方面术语从TripAdvisor上34个土耳其旅游中心的评论中提取,每个方面术语由7位标注者标注,通过多数投票确定最终的方面术语和地面实况标签。数据集中包含4482个显式方面术语和21691个隐式方面术语。

The Turkish Tourism ABSA dataset is a large-scale, manually annotated dataset designed to contribute to research in aspect-based sentiment analysis (ABSA) for Turkish. The aspect terms in the dataset are extracted from reviews of 34 Turkish tourist centers on TripAdvisor. Each aspect term is annotated by seven annotators, with the final aspect terms and ground truth labels determined through majority voting. The dataset contains 4,482 explicit aspect terms and 21,691 implicit aspect terms.
创建时间:
2021-07-10
原始信息汇总

数据集概述

数据集名称

Turkish-Aspect-Based-Sentiment-Analysis-Corpus-for-Smart-Tourism

数据集描述

该数据集是一个大型手动标注的土耳其语基于方面的情感分析(ABSA)数据集,专门为智能旅游领域设计。数据集中的方面术语是从土耳其34个旅游中心的TripAdvisor评论中提取的。每个方面术语由7位标注者进行标注,通过多数投票确定最终的方面术语和地面实况标签。

数据集统计

  • 明确方面术语:4482个
  • 隐含方面术语:21691个

引用信息

若该数据集对您的研究有帮助,请引用以下论文:

M. U. Salur and İ. Aydin, "An Annotated Turkish Aspect Based Sentiment Analysis Corpus for Smart Tourism," 2021 Innovations in Intelligent Systems and Applications Conference (ASYU), 2021, pp. 1-6, doi: 10.1109/ASYU52992.2021.9599037.

论文引用格式

@INPROCEEDINGS{9599037, author={Salur, Mehmet Umut and Aydin, İlhan}, booktitle={2021 Innovations in Intelligent Systems and Applications Conference (ASYU)}, title={An Annotated Turkish Aspect Based Sentiment Analysis Corpus for Smart Tourism}, year={2021}, pages={1-6}, doi={10.1109/ASYU52992.2021.9599037} }

搜集汇总
数据集介绍
main_image_url
构建方式
Turkish Tourism ABSA Dataset的构建基于TripAdvisor平台上土耳其34个旅游中心的用户评论。研究团队从这些评论中提取了显式和隐式的方面术语,并由7名标注者进行人工标注。为确保标注的准确性,采用多数投票法确定最终的方面术语及其情感标签。数据集共包含4482个显式方面术语和21691个隐式方面术语,为土耳其语基于方面的情感分析研究提供了高质量的标注数据。
使用方法
Turkish Tourism ABSA Dataset适用于土耳其语基于方面的情感分析研究。研究者可通过分析显式和隐式方面术语的情感标签,探索用户对旅游中心不同方面的情感倾向。数据集还可用于训练和评估情感分析模型,特别是针对土耳其语的模型。使用该数据集时,建议引用相关论文以尊重研究团队的贡献,并遵循数据集的许可协议。
背景与挑战
背景概述
Turkish Tourism ABSA Dataset是由Mehmet Umut Salur和İlhan Aydin于2021年创建的一个大规模手动标注数据集,旨在推动土耳其语基于方面的情感分析(ABSA)研究。该数据集基于TripAdvisor上土耳其34个旅游中心的评论,提取了4482个显式方面术语和21691个隐式方面术语,并由7名标注者进行标注,最终通过多数投票确定标签。该数据集为智能旅游领域的情感分析提供了重要资源,并在2021年智能系统与应用创新会议(ASYU)上发布,得到了土耳其科学技术研究委员会(TÜBİTAK)的资助。
当前挑战
Turkish Tourism ABSA Dataset的构建面临多方面的挑战。首先,情感分析领域本身具有复杂性,尤其是在处理土耳其语这种形态丰富的语言时,如何准确识别和标注显式与隐式方面术语成为一大难题。其次,数据集的标注过程依赖于多名标注者的主观判断,尽管采用了多数投票机制,但标注一致性仍可能受到影响。此外,旅游评论的多样性和语言表达的灵活性进一步增加了数据清洗和标注的难度。这些挑战不仅体现在数据集的构建过程中,也对其在智能旅游领域的应用提出了更高的技术要求。
常用场景
经典使用场景
Turkish Tourism ABSA Dataset 主要用于土耳其语基于方面的情感分析研究,特别是在智能旅游领域。该数据集通过从土耳其34个旅游中心的TripAdvisor评论中提取方面术语,并经过7位标注者的标注,确保了数据的多样性和准确性。研究者可以利用该数据集进行情感分类、方面提取等任务,从而深入理解游客对旅游服务的具体情感反馈。
解决学术问题
该数据集解决了土耳其语情感分析研究中数据稀缺的问题,尤其是在基于方面的情感分析领域。通过提供大量手动标注的显式和隐式方面术语,研究者可以更准确地训练和评估情感分析模型。这不仅推动了土耳其语自然语言处理技术的发展,还为智能旅游系统的情感分析提供了可靠的数据支持。
实际应用
在实际应用中,Turkish Tourism ABSA Dataset 可以用于开发智能旅游推荐系统,帮助旅游服务提供商更好地理解游客的反馈。通过分析游客对酒店、景点、餐饮等方面的情感倾向,旅游企业可以优化服务策略,提升游客体验。此外,该数据集还可用于旅游目的地的市场分析,帮助决策者制定更有效的营销策略。
数据集最近研究
最新研究方向
近年来,土耳其旅游领域的情感分析研究逐渐成为自然语言处理(NLP)领域的热点之一。Turkish Tourism ABSA Dataset作为一个大规模的手工标注数据集,为土耳其语基于方面的情感分析(ABSA)研究提供了重要支持。该数据集通过TripAdvisor评论提取了34个土耳其旅游中心的相关方面术语,并由7名标注者进行标注,确保了数据的多样性和准确性。当前研究主要聚焦于如何利用该数据集提升智能旅游系统的情感分析能力,特别是在处理显式和隐式方面术语的识别与分类上。此外,结合深度学习模型,研究者们正探索如何更高效地处理土耳其语的复杂语法结构,以提升情感分析的精度和效率。该数据集的应用不仅推动了土耳其语NLP技术的发展,也为全球多语言情感分析研究提供了宝贵的参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作