DAVIS (Densely Annotated VIdeo Segmentation)|视频分割数据集|计算机视觉数据集
收藏
- DAVIS数据集首次发表,提供了密集标注的视频分割数据,旨在推动视频分割技术的发展。
- DAVIS Challenge在CVPR(计算机视觉与模式识别会议)上首次举办,吸引了全球研究者的关注和参与。
- DAVIS数据集更新至2017版本,增加了更多的视频样本和更精细的标注,进一步提升了数据集的质量和多样性。
- DAVIS Challenge继续在CVPR上举办,成为视频分割领域的重要赛事,推动了相关技术的快速发展。
- DAVIS数据集再次更新,引入了新的挑战和任务,如半监督和无监督视频分割,扩展了数据集的应用范围。
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
中国高分辨率高质量PM2.5数据集(2000-2023)
ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。
国家青藏高原科学数据中心 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
SDM-Car
SDM-Car数据集由武汉大学和中国空间技术研究院联合开发,旨在解决卫星视频中低辐射强度下暗淡移动车辆的检测问题。该数据集包含99个高质量卫星视频,覆盖多种场景,如沙漠、城市、港口等,提供了1469948个精确标注的车辆实例。数据集通过珞珈3-01卫星的视频凝视成像模式收集,空间分辨率为0.75米,帧率为6/8 fps。数据集的创建过程包括手动标注和自动化工具辅助标注,最终生成了大量针对暗淡车辆的标注。该数据集的应用领域包括数字城市、智能交通和智能监控,旨在提升卫星视频中暗淡车辆的检测精度。
arXiv 收录