清远市连南瑶族自治县民政局办件过程公开信息|政务服务数据集|数据开放数据集
收藏PRBench
PRBench是一个大规模专家标注的专业领域高风险推理基准测试数据集,当前版本覆盖法律和金融领域。包含1,100个专家编写的跨金融和法律领域的对话,19,356个专家策划的评估标准(每个任务10-30条),覆盖114个国家、47个美国司法管辖区和25个专业主题,并包含最具挑战性任务的硬子集(Finance-300, Legal-250)。
github 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
DIPSEER: A Dataset for In-Person Student Emotion and Engagement Recognition in the Wild
DIPSEER是一个用于识别学生情绪和参与度的数据集,包含图像、标签和传感器数据。
github 收录
yuvidhepe/us-accidents-updated
这是一个覆盖美国49个州的全国性交通事故数据集,数据收集自2016年2月至2023年3月,通过多种交通API实时收集。目前数据集中包含约770万条交通事故记录,可用于实时交通事故预测、热点位置研究、伤亡分析以及环境因素对事故发生的影响研究等。
hugging_face 收录
PASCAL VOC 2007
这个挑战的目标是从现实场景中的许多视觉对象类别中识别对象(即不是预先分割的对象)。它基本上是一个监督学习问题,因为它提供了一组标记图像的训练集。已选择的 20 个对象类别是: 人:人 动物:鸟、猫、牛、狗、马、羊 交通工具:飞机、自行车、船、公共汽车、汽车、摩托车、火车 室内:瓶子、椅子、餐桌、盆栽、沙发、电视/显示器 将有两个主要比赛和两个较小规模的“品酒师”比赛。内容:提供的训练数据由一组图像组成;每个图像都有一个注释文件,为图像中存在的 20 个类别之一中的每个对象提供一个边界框和对象类别标签。请注意,来自多个类的多个对象可能出现在同一图像中。
OpenDataLab 收录
