five

IMDB Dataset of 50K Movie Reviews|电影评论数据集|情感分析数据集

收藏
www.kaggle.com2019-03-09 更新2025-01-21 收录
电影评论
情感分析
下载链接:
https://www.kaggle.com/lakshmi25npathi/imdb-dataset-of-50k-movie-reviews
下载链接
链接失效反馈
资源简介:
IMDB dataset having 50K movie reviews for natural language processing or Text analytics. This is a dataset for binary sentiment classification containing substantially more data than previous benchmark datasets. We provide a set of 25,000 highly polar movie reviews for training and 25,000 for testing. So, predict the number of positive and negative reviews using either classification or deep learning algorithms. For more dataset information, please go through the following link, http://ai.stanford.edu/~amaas/data/sentiment/

IMDB 数据集,包含 50,000 篇电影评论,适用于自然语言处理或文本分析。该数据集专为二元情感分类设计,其数据量远超以往基准数据集。我们提供了 25,000 篇具有高度极性的电影评论用于训练,以及 25,000 篇用于测试。因此,您可以使用分类或深度学习算法预测正面和负面评论的数量。欲了解更多数据集信息,请参阅以下链接,http://ai.stanford.edu/~amaas/data/sentiment/。
提供机构:
www.kaggle.com
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CKMImageNet

CKMImageNet是一个旨在推进AI驱动的环境感知无线通信和感知研究的综合数据集,由东南大学国家移动通信研究实验室提供。该数据集整合了位置特定的通道知识数据、高保真环境地图及其视觉表示。CKMImageNet支持多种AI驱动的方法进行通道知识图(CKM)构建,包含监督和非监督、判别和生成AI方法。数据集利用先进的射线追踪技术构建,确保了高保真度和环境准确性。它为AI模型学习环境感知传播模式提供了基础工具,可应用于6G系统的网络规划、资源分配等领域。

arXiv 收录

HotpotQA

HotpotQA 是收集在英语维基百科上的问答数据集,包含大约 113K 众包问题,这些问题的构建需要两篇维基百科文章的介绍段落才能回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作人员认为这些句子是回答问题所必需的支持事实。 HotpotQA 提供了多种推理策略,包括涉及问题中缺失实体的问题、交叉问题(什么满足属性 A 和属性 B?)和比较问题,其中两个实体通过一个共同属性进行比较等。在少文档干扰设置中,QA 模型有 10 个段落,保证能找到黄金段落;在开放域全维基设置中,模型只给出问题和整个维基百科。模型根据其答案准确性和可解释性进行评估,其中前者被测量为具有完全匹配 (EM) 和 unigram F1 的预测答案和黄金答案之间的重叠,后者关注预测的支持事实句子与人类注释的匹配程度(Supporting Fact EM/F1)。该数据集还报告了一个联合指标,它鼓励系统同时在两项任务上表现良好。 来源:通过迭代查询生成回答复杂的开放域问题

OpenDataLab 收录

MedHK23/CCA

CCA数据集包含200个描绘冠状动脉疾病的CTA图像案例,其中20个用于训练,180个用于测试。图像以0.5毫米的等向分辨率采集,并由四位放射科医生进行标注,确保每个案例由三位不同的医生独立标注,最后由第四位医生选择最佳标注。

hugging_face 收录

IXI Dataset

IXI数据集包含近600张来自正常健康受试者的MRI图像,包括T1、T2、PD加权图像、MRA图像和扩散加权图像。数据集在Hammersmith医院、Guy’s医院和Institute of Psychiatry使用不同系统进行扫描。

github 收录

DeepMIMO dataset

DeepMIMO数据集是一个公开的数据集生成框架,用于模拟多种无线通信环境。该数据集特别适用于大规模MIMO和毫米波应用,通过精确的射线追踪数据构建信道模型。数据集包含多个场景,每个场景都有详细的参数设置,如频率、带宽、基站天线配置等。这些参数可以根据研究需求进行调整,以生成符合特定研究目的的数据集。DeepMIMO数据集广泛用于无线通信系统的定位和性能评估研究,特别是在5G及未来通信技术中。

arXiv 收录