CCDC 1973647: Experimental Crystal Structure Determination|晶体结构数据集|材料化学数据集
收藏CAS 滑坡数据集:用于山体滑坡检测深度学习的大规模多传感器数据集
在这项工作中,我们提出了CAS滑坡数据集,这是一个用于基于深度学习的滑坡检测的大规模多传感器数据集,由中国科学院(CAS)山地灾害与环境研究所的人工智能小组开发。该数据集旨在解决滑坡识别中遇到的挑战。随着气候变化和地震导致的山体滑坡发生率增加,人们越来越需要一个精确而全面的数据集来支持快速有效的山体滑坡识别。与现有数据集的数据集大小、覆盖范围、传感器类型和分辨率限制相比,CAS 滑坡数据集包括 20,958 张图像,整合了来自 <> 个地区的卫星和无人机数据。为了确保可靠性和适用性,我们建立了一种稳健的方法来评估数据集的质量。我们建议使用CAS滑坡数据集作为构建滑坡识别模型的基准,并促进深度学习技术的发展。研究人员可以利用该数据集获得增强的预测、监测和分析能力,从而推进自动滑坡检测。如果您打算使用我们的数据集,请通过引用我们在您的项目中的工作来感谢我们的研究。
DataCite Commons 收录
CurveLanes
CurveLanes是一个新的基准车道检测数据集,具有150K个车道图像,适用于交通车道检测中的曲线和多车道等困难场景。它是在中国多个城市的真实城市和高速公路场景中收集的。它是迄今为止最大的车道检测数据集,并为社区建立了更具挑战性的基准。 我们将整个数据集150K分为三个部分: train:100K,val: 20K和testing: 30K。该数据集中的大多数图像的分辨率为2650 × 1440。 对于每个图像,我们使用自然的三次样条线手动注释图像中的所有通道。所有图像都经过精心选择,以使大多数图像至少包含一个曲线车道。在这个数据集中可以找到更困难的场景,例如s形曲线、Y形车道、夜间和多车道 (车道线的数量超过4条)。
OpenDataLab 收录
CSL-Daily
CSL-Daily (Chinese Sign Language Corpus) is a large-scale continuous SLT dataset. It provides both spoken language translations and gloss-level annotations. The topic revolves around people's daily lives (e.g., travel, shopping, medical care), the most likely SLT application scenario.
Papers with Code 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
Institutional and news media tweet dataset for COVID-19 social science research
本数据集名为‘Institutional and news media tweet dataset for COVID-19 social science research’,由巴塞罗那自治大学社会心理学系创建。该数据集收集了69个机构和新闻媒体的Twitter数据,涵盖政府、国际组织及北美、欧洲和亚洲的新闻媒体。数据集通过Twitter REST API从2020年3月12日开始收集,每周更新,旨在为危机沟通、公共关系等社会科学研究提供有价值的数据。数据集的创建过程涉及从不同类别的新闻媒体账户中提取和整理信息,确保数据的多样性和时效性。
arXiv 收录
