IMDB Dataset|电影评价数据集|电影排名数据集
收藏
- IMDB Dataset首次发布,包含50,000条电影评论,分为正面和负面评价,用于情感分析研究。
- IMDB Dataset被广泛应用于自然语言处理领域的情感分析和文本分类任务,成为该领域的基准数据集之一。
- 研究者开始利用IMDB Dataset进行深度学习模型的训练,特别是在BERT等预训练语言模型上的应用,显著提升了情感分析的准确性。
- IMDB Dataset的使用扩展到多语言情感分析和跨文化研究,促进了全球范围内情感分析技术的发展。
- IMDB Dataset的数据质量和多样性得到进一步验证,成为学术界和工业界广泛认可的标准数据集。
- 1Learning Word Vectors for Sentiment AnalysisStanford University · 2011年
- 2Deep Residual Learning for Image RecognitionMicrosoft Research · 2016年
- 3BERT: Pre-training of Deep Bidirectional Transformers for Language UnderstandingGoogle AI Language · 2019年
- 4Attention is All You NeedGoogle Brain · 2017年
- 5XLNet: Generalized Autoregressive Pretraining for Language UnderstandingCarnegie Mellon University, Google Brain · 2019年
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
CAP-DATA
CAP-DATA数据集由长安大学交通学院的研究团队创建,包含11,727个交通事故视频,总计超过2.19百万帧。该数据集不仅标注了事故发生的时间窗口,还提供了详细的文本描述,包括事故前的实际情况、事故类别、事故原因和预防建议。数据集的创建旨在通过结合视觉和文本信息,提高交通事故预测的准确性和解释性,从而支持更安全的驾驶决策系统。
arXiv 收录
长江干流实时水位观测数据集(2024年)
该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。
国家地球系统科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录