IMDB Dataset of 50K Movie Reviews|电影评论数据集|情感分析数据集
收藏CKMImageNet
CKMImageNet是一个旨在推进AI驱动的环境感知无线通信和感知研究的综合数据集,由东南大学国家移动通信研究实验室提供。该数据集整合了位置特定的通道知识数据、高保真环境地图及其视觉表示。CKMImageNet支持多种AI驱动的方法进行通道知识图(CKM)构建,包含监督和非监督、判别和生成AI方法。数据集利用先进的射线追踪技术构建,确保了高保真度和环境准确性。它为AI模型学习环境感知传播模式提供了基础工具,可应用于6G系统的网络规划、资源分配等领域。
arXiv 收录
HotpotQA
HotpotQA 是收集在英语维基百科上的问答数据集,包含大约 113K 众包问题,这些问题的构建需要两篇维基百科文章的介绍段落才能回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作人员认为这些句子是回答问题所必需的支持事实。 HotpotQA 提供了多种推理策略,包括涉及问题中缺失实体的问题、交叉问题(什么满足属性 A 和属性 B?)和比较问题,其中两个实体通过一个共同属性进行比较等。在少文档干扰设置中,QA 模型有 10 个段落,保证能找到黄金段落;在开放域全维基设置中,模型只给出问题和整个维基百科。模型根据其答案准确性和可解释性进行评估,其中前者被测量为具有完全匹配 (EM) 和 unigram F1 的预测答案和黄金答案之间的重叠,后者关注预测的支持事实句子与人类注释的匹配程度(Supporting Fact EM/F1)。该数据集还报告了一个联合指标,它鼓励系统同时在两项任务上表现良好。 来源:通过迭代查询生成回答复杂的开放域问题
OpenDataLab 收录
MedHK23/CCA
CCA数据集包含200个描绘冠状动脉疾病的CTA图像案例,其中20个用于训练,180个用于测试。图像以0.5毫米的等向分辨率采集,并由四位放射科医生进行标注,确保每个案例由三位不同的医生独立标注,最后由第四位医生选择最佳标注。
hugging_face 收录
IXI Dataset
IXI数据集包含近600张来自正常健康受试者的MRI图像,包括T1、T2、PD加权图像、MRA图像和扩散加权图像。数据集在Hammersmith医院、Guy’s医院和Institute of Psychiatry使用不同系统进行扫描。
github 收录
DeepMIMO dataset
DeepMIMO数据集是一个公开的数据集生成框架,用于模拟多种无线通信环境。该数据集特别适用于大规模MIMO和毫米波应用,通过精确的射线追踪数据构建信道模型。数据集包含多个场景,每个场景都有详细的参数设置,如频率、带宽、基站天线配置等。这些参数可以根据研究需求进行调整,以生成符合特定研究目的的数据集。DeepMIMO数据集广泛用于无线通信系统的定位和性能评估研究,特别是在5G及未来通信技术中。
arXiv 收录