NETEMVocabulary|英语考试数据集|词汇分析数据集
收藏考研词汇词频排序数据集概述
数据集描述
- 词汇来源:《2024年全国硕士研究生招生考试英语(一)考试大纲词汇表》,共包含5530个词汇。
- 词频统计:基于四六级、考研英语、专四专八约200套试卷文本,对词汇表进行词频排序。
- 排序方法:采用词形还原策略,与实际试卷呈现略有差异。
- 高频词汇:前2444个单词出现40次以上,平均每做5套试卷能遇到一次。
- 数据准确性:释义经过人工初步校对,确保准确性。对于有其他拼写的单词,一并列出。
数据存储
- 数据文件:
netem_full_list.json
存储所有数据,并已转换成netem_full_list.sql
文件。
数据集使用
- 数据集许可证:基于 CC BY-NC-SA 4.0 共享。

IR-500K
IR-500K是一个大型红外数据集,包含500,000张红外图像,涵盖了各种场景和物体在不同环境条件下的图像。
github 收录
MIMIC-IV数据库
MIMIC全称是Medical Information Mart for Intensive Care, 是一个重症医学数据库。2003年,在NIH的资助下,来自贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)、麻省理工(MIT)、牛津大学和麻省总医院(MGH)的急诊科医生、重症科医生、计算机科学专家等共同建立的一个数据库。
github 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
Solar Radiation Data
该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。
www.nrel.gov 收录