five

FoodReviewSentiment|情感分析数据集|食品评论数据集

收藏
huggingface2024-08-23 更新2024-12-12 收录
情感分析
食品评论
下载链接:
https://huggingface.co/datasets/infinite-dataset-hub/FoodReviewSentiment
下载链接
链接失效反馈
资源简介:
FoodReviewSentiment数据集是从多个社交媒体平台收集的食品评论文本集合。每个评论根据其对食品的情感进行分类,标签包括'正面'、'负面'、'配送问题'和'与食品评论无关'。该数据集可用于情感分析和了解公众对食品产品的看法。
创建时间:
2024-08-23
原始信息汇总

FoodReviewSentiment

标签: sentiment analysis, food, social media

注意: 这是一个AI生成的数据集,其内容可能不准确或虚假。

数据集描述:

FoodReviewSentiment 数据集是从各种社交媒体平台收集的食品评论文本数据集合。每个评论根据对食品的情感和内容的相关性进行分类。标签包括 Positive(正面)、Negative(负面)、Delivery Problem(配送问题)和 Unrelated(不相关)。该数据集可用于情感分析和了解公众对食品产品的意见。

CSV内容预览:

Title,Review,Label "The Chicken Pasta at Bella Italia is divine, truly satisfying!","This place never disappoints. A must-try for any pasta lover!","Positive" "Disappointed with the pizza from Pizzarossa. Burnt crust and bland toppings.","Never going back to Pizzarossa after this terrible experience.","Negative" "Ordered sushi from Sakura Delights, and it took forever to arrive!","My patience was tested as I waited over an hour for my order.","Delivery Problem" "Checking out the latest smartphones on TechTalk forum.", "The new Galaxy phone has some impressive features, but Im still on the fence about it.","Unrelated" "Had the most amazing salad at Green Garden Café, the freshness was unmatched!","I always get my best meals here. Definitely coming back for more salads!","Positive"

数据来源:

该数据集使用 Infinite Dataset Hub 和 microsoft/Phi-3-mini-4k-instruct 生成,查询为 social media images related to food review. labels are: positive, negative, delivery problem, unrelevent to food review。

  • 数据集生成页面: https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub?q=social+media+images+related+to+food+review.+labels+are:+positive,+negative,+delivery+problem,+unrelevent+to+food+review&dataset=FoodReviewSentiment&tags=sentiment+analysis,+food,+social+media
  • 模型: https://huggingface.co/microsoft/Phi-3-mini-4k-instruct
  • 更多数据集: https://huggingface.co/datasets?other=infinite-dataset-hub
AI搜集汇总
数据集介绍
main_image_url
构建方式
FoodReviewSentiment数据集是通过Infinite Dataset Hub平台,结合microsoft/Phi-3-mini-4k-instruct模型生成的合成数据集。该数据集模拟了来自不同社交媒体平台的食品评论数据,涵盖了用户对食品的情感倾向及其与食品评论的相关性。每条评论被标注为‘正面’、‘负面’、‘配送问题’或‘无关’等类别,旨在为情感分析任务提供多样化的文本资源。
特点
FoodReviewSentiment数据集的特点在于其多样化的情感标签和广泛的食品评论主题。数据集不仅包含对食品的直接评价,还涵盖了与配送相关的问题,以及一些与食品无关的内容,从而为情感分析模型提供了更全面的训练场景。此外,数据集的合成性质使其能够快速扩展,适应不同研究需求,但其内容可能存在一定的准确性问题,需谨慎使用。
使用方法
FoodReviewSentiment数据集适用于情感分析、自然语言处理等领域的研究。研究人员可以通过加载CSV文件,提取‘Review’和‘Label’字段,构建情感分类模型。由于数据集包含多种情感标签,用户可以根据需求选择特定类别进行训练和测试。此外,数据集的合成性质使其适合用于模型预训练或数据增强,但需注意其潜在的不准确性,建议在实际应用中结合真实数据进行验证。
背景与挑战
背景概述
FoodReviewSentiment数据集是一个专注于食品评论情感分析的合成数据集,由Infinite Dataset Hub与微软的Phi-3-mini-4k-instruct模型合作生成。该数据集收集了来自多个社交媒体平台的食品评论文本,每条评论根据情感倾向和内容相关性被标注为‘正面’、‘负面’、‘配送问题’或‘无关’。其核心研究问题在于通过情感分析技术,深入理解公众对食品产品的态度与反馈。该数据集为食品行业的情感分析研究提供了新的数据资源,有助于推动消费者行为分析与市场趋势预测的发展。
当前挑战
FoodReviewSentiment数据集在解决食品评论情感分析问题时面临多重挑战。首先,由于数据来源于社交媒体,评论内容可能包含大量非结构化信息,如俚语、缩写和表情符号,这增加了情感分类的复杂性。其次,数据集的合成性质可能导致部分内容不准确或虚假,影响模型的训练效果。此外,标注过程中可能存在主观性,尤其是在区分‘配送问题’与‘负面’评论时,边界模糊的情况较为常见。这些挑战要求研究者在数据预处理和模型训练中采取更为精细的策略,以确保分析结果的可靠性。
常用场景
经典使用场景
在情感分析领域,FoodReviewSentiment数据集被广泛应用于分析社交媒体上用户对食品的评价。通过该数据集,研究人员可以深入挖掘用户对特定食品的情感倾向,从而为食品行业提供有价值的市场反馈。数据集中的标签如‘Positive’、‘Negative’、‘Delivery Problem’和‘Unrelated’为情感分类任务提供了清晰的指导,使得模型能够更准确地识别和分类用户的情感表达。
解决学术问题
FoodReviewSentiment数据集解决了情感分析领域中的关键问题,特别是在食品评论的情感分类任务中。通过提供多样化的情感标签,该数据集帮助研究人员克服了传统情感分析模型在处理复杂情感表达时的局限性。此外,数据集的生成方式也为研究合成数据在情感分析中的应用提供了新的视角,推动了该领域的技术进步。
衍生相关工作
基于FoodReviewSentiment数据集,许多经典的研究工作得以展开。例如,研究人员利用该数据集开发了更高效的情感分析模型,能够更准确地识别用户对食品的情感倾向。此外,该数据集还激发了关于合成数据在情感分析中应用的研究,推动了情感分析技术的进一步发展。这些工作不仅丰富了情感分析领域的研究成果,也为实际应用提供了强有力的技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

TT100K - Tsinghua-Tencent 100K

TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。

cg.cs.tsinghua.edu.cn 收录