VADER Sentiment Analysis|情感分析数据集|社交媒体文本数据集
收藏
- VADER Sentiment Analysis首次发表在《Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP)》上,由C.J. Hutto和Eric Gilbert共同开发。
- VADER Sentiment Analysis首次应用于社交媒体情感分析,展示了其在处理非正式文本和表情符号方面的有效性。
- VADER Sentiment Analysis被集成到Python的NLTK库中,使得更多研究者和开发者能够方便地使用该工具进行情感分析。
- VADER Sentiment Analysis在多个情感分析竞赛中表现优异,进一步验证了其在情感分析领域的实用性和准确性。
- VADER Sentiment Analysis的改进版本发布,增加了对多语言文本的支持,扩展了其应用范围。
- 1VADER: A Parsimonious Rule-based Model for Sentiment Analysis of Social Media TextGeorgia Institute of Technology · 2014年
- 2Sentiment Analysis of Twitter Data Using VADER and TextBlobUniversity of California, Berkeley · 2018年
- 3A Comparative Study of Sentiment Analysis Techniques on Social Media DataUniversity of Manchester · 2020年
- 4Sentiment Analysis of Customer Reviews Using VADER and BERTStanford University · 2021年
- 5Sentiment Analysis in Social Media: A SurveyUniversity of Southern California · 2019年
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
yahoo-finance-data
该数据集包含从Yahoo! Finance、Nasdaq和U.S. Department of the Treasury获取的财务数据,旨在用于研究和教育目的。数据集包括公司详细信息、高管信息、财务指标、历史盈利、股票价格、股息事件、股票拆分、汇率和每日国债收益率等。每个数据集都有其来源、简要描述以及列出的列及其数据类型和描述。数据定期更新,并以Parquet格式提供,可通过DuckDB进行查询。
huggingface 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录