medical-o1-reasoning-SFT-orpo|医学文本生成数据集|自然语言处理数据集
收藏
日食计算器
此日食计算器能够查询公元前3000至后3000年范围内的日食信息,生成每次日食的覆盖区、中心区范围数据,展示日食带的地图;并可根据用户在地图上点击的坐标在线计算该地日食各阶段时间、食分等观测信息。
国家天文科学数据中心 收录
CHiME-5
CHiME-5是关于自动语音识别处理技术的数据集。该数据集来自第5个CHiME挑战,包括在真实家庭环境中进行远程多麦克风会话的任务。从晚餐场景中提取语音素材,数据集获得自然对话语音数据,并由6个Kinect麦克风阵列和4个双耳麦克风对记录。 数据集包含单阵列轨道与多阵列轨道语言建模,以及用于阵列同步,语音增强,常规和端到端ASR的数据收集过程,任务和基线系统。
OpenDataLab 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
UAV123
从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。
OpenDataLab 收录
中国30m土地利用数据集(1990-2020年)
数据以美国陆地卫星Landsat遥感影像作为主要信息源,通过人工目视解译构建的中国国家尺度多时期土地利用/土地覆盖专题数据库数据采用二级分类系统,一级分为耕地、林地、草地、水域、建设用地和未利用土地6类,二级在一级类型基础上进一步分为25个类型
国家地球系统科学数据中心 收录
