islamrokon/Test
收藏数据集概述
配置
- 默认配置:
- 训练数据:
- 路径:
data/train-*
- 路径:
- 测试数据:
- 路径:
data/test-*
- 路径:
- 训练数据:
数据特征
- 问题:
- 数据类型:字符串
- 答案:
- 数据类型:字符串
- 输入ID:
- 数据类型:整数序列(int32)
- 注意力掩码:
- 数据类型:整数序列(int32)
- 标签:
- 数据类型:整数序列(int64)
数据分割
- 训练集:
- 字节数:17012.625
- 样本数:14
- 测试集:
- 字节数:2430.375
- 样本数:2
数据大小
- 下载大小:17101字节
- 数据集大小:19443.0字节
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
CampusGuard
CampusGuard数据集专门针对校园环境中的学生行为进行标注与分类,旨在为改进YOLOv8模型提供丰富的训练样本。该数据集包含五个主要类别,分别是“使用手机”、“未佩戴头盔”、“睡觉”、“三人组行为”和“暴力行为”。这些类别不仅涵盖了课堂内外的常见行为,还反映了校园安全与学生行为管理的多样性。
github 收录
全国兴趣点(POI)数据
POI(Point of Interest),即兴趣点,一个POI可以是餐厅、超市、景点、酒店、车站、停车场等。兴趣点通常包含四方面信息,分别为名称、类别、坐标、分类。其中,分类一般有一级分类和二级分类,每个分类都有相应的行业的代码和名称一一对应。 POI包含的信息及其衍生信息主要包含三个部分:
CnOpenData 收录
MMOral
MMOral是一个针对全景X光片解读的大规模多模态指令数据集和基准。它包括20,563张带有1.3百万条指令跟随实例的注释图像,涵盖了多种任务类型,如属性提取、报告生成、视觉问答和基于图像的对话。此外,我们还提出了MMOral-Bench,这是一个涵盖牙科五个关键诊断维度的综合评估套件。我们评估了64个LVLMs在MMOral-Bench上的表现,发现即使是表现最好的模型GPT-4o,也只能达到41.45%的准确率,这揭示了当前模型在这一领域的显著局限性。为了促进该特定领域的发展,我们还提出了OralGPT,它使用我们精心策划的MMOral指令数据集对Qwen2.5-VL-7B进行监督微调。值得注意的是,一个SFT周期就为LVLMs带来了显著的性能提升,例如,OralGPT表现出24.73%的改进。MMOral和OralGPT都具有作为智能牙科关键基础的巨大潜力,并使牙科领域中的多模态AI系统更具临床意义。数据集、模型、基准和评估套件可在上述网址获取。
arXiv 收录
鱼类目标检测数据集
本数据集专为改进YOLOv8的鱼类目标检测系统而设计,包含了丰富的鱼类图像数据,旨在为研究人员和开发者提供一个高质量的训练基础。数据集的总图像数量达到了7480张,涵盖了30个不同的鱼类类别,展现了水生生态系统的多样性和复杂性。这些图像不仅为模型训练提供了充足的样本,还确保了模型在实际应用中的泛化能力。
github 收录
