汕头市潮阳区政数局拟上线关于人社局、农业局“粤商通”特色服务事项清单信息|政府服务数据集|企业支持数据集
收藏XS-Video
XS-Video数据集是由中国科学院自动化研究所MAIS实验室提出的一个大规模现实世界短视频传播数据集。该数据集收集了来自中国五大平台(抖音、快手、西瓜视频、今日头条、哔哩哔哩)的117720个短视频,包含381926个样本和535个话题,覆盖了从发布后的互动信息,如观看、点赞、分享、收藏、粉丝和评论等。数据集通过跨平台指标对齐方法,对视频的长期传播影响力进行评分,分为0到9级,旨在为短视频传播研究提供全面的互动信息和内容特征。
arXiv 收录
威斯康星乳腺癌数据分析及自动诊断
数据集bc_data.csv:来自威斯康星乳腺癌数据库(Wisconsin Breast Cancer Database),主要记录了569个病例的32个属性。
阿里云天池 收录
Electrical-Lines-Defect-Detection
该数据集是针对电力线路缺陷检测的,包含了由APEPDCL线路工人使用移动相机捕获的图片,并由Sampath Balaji团队整理。数据集以CC BY 4.0许可证发布,旨在促进开源合作、可重现性和人工智能的实践学习。数据集分为两个模块:目标检测和分类。目标检测模块遵循YOLOv12格式,分类模块由文件夹和CSV文件组成,都提供了训练、验证和测试数据集。
huggingface 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
China Kadoorie Biobank (CKB)
China Kadoorie Biobank(CKB)是一项大规模的前瞻性队列研究数据库,旨在通过长期跟踪调查收集中国人群的健康相关信息,包括生活方式、环境暴露、生物样本以及疾病发生发展情况,为慢性病的病因研究和防控策略制定提供科学依据。
www.ckbiobank.org 收录
