five

SCADI Dataset

收藏
arXiv2019-08-21 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1901.00756v3
下载链接
链接失效反馈
官方服务:
资源简介:
SCADI数据集是由史蒂文斯理工学院开发的,专注于儿童和青年的自我护理活动分类,特别是针对有运动和身体残疾的儿童。该数据集包含70个实例,每个实例有206个属性,主要来源于ICF-CY框架下的自我护理活动分类。数据集的创建过程涉及特征选择和机器学习算法的应用,以优化分类模型。SCADI数据集主要应用于医疗健康领域,旨在通过自动化分类过程,简化ICF-CY的使用,提高对儿童和青年残疾、功能和健康的分类效率。

The SCADI dataset was developed by Stevens Institute of Technology, focusing on the classification of self-care activities for children and adolescents, especially those with motor and physical disabilities. It comprises 70 instances, each with 206 attributes, and is primarily derived from the classification of self-care activities under the ICF-CY framework. The dataset's creation process involved feature selection and the application of machine learning algorithms to optimize classification models. The SCADI dataset is mainly applied in the healthcare sector, aiming to simplify the utilization of the ICF-CY framework through automated classification procedures, and improve the efficiency of classifying disabilities, functional status and health status for children and adolescents.
提供机构:
史蒂文斯理工学院
创建时间:
2018-12-29
搜集汇总
数据集介绍
main_image_url
构建方式
在儿童与青少年健康功能评估领域,SCADI数据集的构建体现了对国际功能、残疾和健康分类儿童与青少年版(ICF-CY)框架的精准应用。该数据集聚焦于ICF-CY中“活动与参与”维度下的“自我照顾”类别,通过收集70名患有运动与身体残疾儿童的数据,涵盖了206个属性,包括性别、年龄以及基于ICF-CY的自我照顾活动特征。数据由职业治疗师专业标注,将自我照顾问题划分为七种类别,从而形成了一个结构化的多维度分类数据集,为后续的预测建模提供了可靠基础。
特点
SCADI数据集的核心特点在于其高度专业化的多维结构,紧密贴合ICF-CY的分类标准。数据集不仅包含了丰富的自我照顾活动指标,还通过二元编码清晰标识了儿童是否存在特定功能特征。其样本规模虽有限,但属性维度较高,呈现出典型的“高维小样本”特性,这为特征选择与降维技术的应用提供了实践场景。此外,数据集的响应变量涵盖了从单一问题到复合问题的多种类别,反映了残疾儿童自我照顾能力的复杂谱系,增强了数据在临床与科研中的实用价值。
使用方法
该数据集主要用于开发与评估基于机器学习的残疾分类预测模型。研究人员可首先利用特征选择算法(如Boruta)对高维属性进行降维,提取关键预测变量,以优化模型性能与解释性。随后,可应用随机森林、支持向量机等多种监督学习算法进行训练与比较,并通过十折交叉验证确保评估的稳健性。模型性能可从分类准确率、均方根误差及受试者工作特征曲线等多维度进行综合衡量,从而为ICF-CY的自动化分类工具开发提供实证依据,辅助医疗专业人员提升诊断效率。
背景与挑战
背景概述
SCADI数据集源于国际功能、残疾和健康分类儿童与青少年版(ICF-CY)在儿童自我照护能力评估领域的应用需求。该数据集由伊朗亚兹德伊斯兰阿扎德大学的法特米·布谢里博士于2018年捐赠,旨在通过机器学习方法对患有运动与身体残疾的儿童自我照护问题进行自动化分类。研究团队通过整合ICF-CY框架中“活动与参与”维度的自我照护类目,构建了包含70名儿童样本、206个属性的多维数据集,为医疗康复领域的精准评估提供了结构化数据基础。该数据集的出现,标志着生物心理社会模型在残疾评估中与预测性分析技术的深度融合,为儿童康复服务的智能化决策支持开辟了新路径。
当前挑战
该数据集致力于解决ICF-CY框架下儿童自我照护问题分类的复杂性挑战。ICF-CY体系涵盖约1400个类目,其多维结构与语义复杂性使得传统分类方法效率低下,而临床专家资源的稀缺进一步加剧了评估延迟。在数据构建层面,研究面临高维稀疏数据的处理难题:206个属性中大量特征存在冗余或噪声,需通过Boruta等特征选择算法识别最小最优特征子集。同时,样本规模有限与类别不平衡问题对模型泛化能力构成考验,需采用交叉验证与集成学习方法提升分类稳健性。这些挑战共同指向如何在保持ICF-CY理论完整性的前提下,实现高效可靠的自动化分类系统。
常用场景
经典使用场景
在儿童康复医学领域,SCADI数据集被广泛应用于构建和验证机器学习模型,以自动化分类儿童自我护理功能障碍。该数据集基于国际功能、残疾和健康分类儿童与青少年版(ICF-CY)框架,涵盖70名运动与身体残疾儿童的206个属性,包括性别、年龄及具体自我护理活动特征。通过随机森林、支持向量机等算法,研究者能够高效识别儿童在进食、穿衣、洗漱等日常活动中的障碍类型,为临床评估提供数据驱动的决策支持。
解决学术问题
SCADI数据集有效解决了ICF-CY多维分类系统在实际应用中复杂度高、人工分析效率低下的学术难题。通过特征选择技术如Boruta算法,该数据集将原始属性维度缩减约74%,在保持分类精度的同时显著提升计算效率。其构建的预测模型实现了84.75%的分类准确率,为残疾儿童功能评估提供了标准化量化工具,推动了健康信息学与康复医学的跨学科融合。
衍生相关工作
基于SCADI数据集的特征工程方法启发了多项残疾分类研究,如采用混合神经网络优化ICF-CY环境因素分析框架。相关成果延伸至自闭症谱系障碍预后预测、肾移植决策支持系统等医疗辅助领域。同时,该数据集推动ICF核心集与机器学习融合研究,衍生出面向脑瘫儿童的跨文化功能评估模型,为国际残疾统计标准化提供了算法验证基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作