islamrokon/Test
收藏数据集概述
配置
- 默认配置:
- 训练数据:
- 路径:
data/train-*
- 路径:
- 测试数据:
- 路径:
data/test-*
- 路径:
- 训练数据:
数据特征
- 问题:
- 数据类型:字符串
- 答案:
- 数据类型:字符串
- 输入ID:
- 数据类型:整数序列(int32)
- 注意力掩码:
- 数据类型:整数序列(int32)
- 标签:
- 数据类型:整数序列(int64)
数据分割
- 训练集:
- 字节数:17012.625
- 样本数:14
- 测试集:
- 字节数:2430.375
- 样本数:2
数据大小
- 下载大小:17101字节
- 数据集大小:19443.0字节
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
SVAMP
在解决基础应用数学问题时,模型往往主要依赖于浅层启发式方法,而非进行深度推理。因此,一个更具挑战性且经过可靠评估的SVAMP数据集被引入。该数据集改编自现有的数据集,用于评估模型在数学问题解决和推理能力方面的敏感性,其难度保持在相当于小学四年级的水平。
github 收录
Vehicle Energy Dataset (VED)
Vehicle Energy Dataset (VED)是由密歇根大学创建的一个大规模数据集,包含从2017年11月至2018年11月期间,在美国密歇根州安娜堡收集的383辆个人汽车的燃油和能量数据。该数据集捕捉了车辆的GPS轨迹以及燃油、能量、速度和辅助电源使用的时间序列数据。数据集中的车辆类型多样,包括264辆汽油车、92辆混合动力车和27辆插电式混合动力/电动车。VED数据集总里程约374,000英里,涵盖了从高速公路到交通密集的市中心区域等各种驾驶条件和季节。数据集创建过程中,研究团队通过安装在车辆上的OBD-II记录器收集数据,并对个人身份信息进行了去标识化处理,以保护参与者隐私。VED数据集的应用领域广泛,包括车辆能源消耗建模、驾驶员行为建模、机器学习和深度学习、交通模拟器的校准、最佳路线选择模型、人类驾驶员行为预测以及自动驾驶汽车的决策制定等。
arXiv 收录
GC10-DET
GC10-DET是在真实工业中收集的表面缺陷数据集。它包含十种类型的表面缺陷,即冲孔(Pu)、焊缝(Wl)、新月形缝隙(Cg)、水斑(Water Spot)、油斑(Os)、丝斑(Ss)、夹杂物(In)、轧坑(Rp)、折痕(Cr)、腰部折痕 (Wf)。所收集的缺陷都在钢板的表面。该数据集包括3570张灰度图像。
github 收录
