developerh/test|文本分类数据集
收藏数据集任务类别
- 文本分类
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
alpacaGPT4_llama8b-v120-jb-seed2-alpaca_512_ngt0.7_tp0.9
该数据集包含了用户和助手之间的对话,具有用户和助手发言的文本特征,以及一个索引级别特征。数据集分为训练集,共有52001条对话记录。
huggingface 收录
UAVid
UAVId 是一个高分辨率的无人机语义分割数据集作为补充,它带来了新的挑战,包括大规模变化、运动物体识别和时间一致性保持。 UAV 数据集由 30 个视频序列组成,这些视频序列在倾斜视图中捕获 4K 高分辨率图像。总共有 300 张图像被密集标记为 8 个类别,用于语义标记任务。
OpenDataLab 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
Human Protein Atlas
Human Protein Atlas数据集包含了人类蛋白质的详细信息,包括蛋白质在不同组织和细胞类型中的表达模式、亚细胞定位、蛋白质相互作用等。该数据集还提供了大量的图像数据,展示了蛋白质在组织切片中的定位。
www.proteinatlas.org 收录