Vertebral Column Dataset

github2020-02-15 更新2024-05-31 收录

下载链接：

https://github.com/pratishtha9/KNN-Vertebral-Column-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该生物医学数据集由Dr. Henrique da Mota在法国里昂的医学住院期间构建。数据集中的每位患者通过六个生物力学属性表示，这些属性源自骨盆和腰椎的形状及方向（依次为）：骨盆倾斜度、骨盆倾斜、腰椎前凸角、骶骨坡度、骨盆半径和脊椎滑脱等级。分类标签使用以下约定：DH（椎间盘突出）、脊椎滑脱（SL）、正常（NO）和异常（AB）。在此练习中，我们仅关注二元分类任务，即NO=0和AB=1。

This biomedical dataset was constructed by Dr. Henrique da Mota during his medical residency in Lyon, France. Each patient in the dataset is represented by six biomechanical attributes derived from the shape and orientation of the pelvis and lumbar spine (in order): pelvic incidence, pelvic tilt, lumbar lordosis angle, sacral slope, pelvic radius, and degree of spondylolisthesis. The classification labels follow the convention: DH (Disc Herniation), SL (Spondylolisthesis), NO (Normal), and AB (Abnormal). In this exercise, we focus solely on the binary classification task, where NO=0 and AB=1.

创建时间：

2019-09-28

原始信息汇总

数据集概述

数据集名称

Machine Learning: Data Analysis and KNN Classification

数据集创建者

Dr. Henrique da Mota

数据集来源

创建于法国里昂的医学住院期间。

数据集描述

该生物医学数据集包含六个由骨盆和腰椎的形状及方向导出的生物力学属性，具体为：

骨盆倾斜度
骨盆倾斜
腰椎前凸角
骶骨斜率
骨盆半径
脊椎滑脱等级

分类标签

数据集中的分类标签包括：

椎间盘突出（DH）
脊椎滑脱（SL）
正常（NO）
异常（AB）

当前分析任务

本分析任务专注于二元分类，其中：

正常（NO）标记为0
异常（AB）标记为1

搜集汇总

数据集介绍

构建方式

Vertebral Column Dataset是由Dr. Henrique da Mota在法国里昂进行医学住院期间构建的生物医学数据集。该数据集的构建基于患者的骨盆和腰椎的形状及方向，从中提取出六个生物力学属性作为特征，分别为：骨盆入口角、骨盆倾斜角、腰椎前凸角、骶骨倾斜角、骨盆半径以及脊柱滑脱等级。

特点

该数据集的特点在于，它包含的是从患者骨盆和腰椎的生物力学测量中得出的数值特征，这些特征对于诊断椎间盘突出、脊柱滑脱等疾病具有重要意义。数据集的分类标签采用DH（椎间盘突出）、SL（脊柱滑脱）、NO（正常）和AB（异常）四种，且在当前任务中专注于正常与异常的二分类问题。

使用方法

用户在使用Vertebral Column Dataset时，可以将其作为机器学习模型的输入，以进行数据分析和KNN分类任务。数据集中的特征可以直接用于模型的训练和测试，而标签则用于指导模型的分类。用户需注意的是，数据集已经按照二分类问题进行了标签转换，即正常标记为0，异常标记为1。

背景与挑战

背景概述

Vertebral Column Dataset是由Dr. Henrique da Mota在法国里昂进行医学实习期间构建的生物医学数据集。该数据集汇集了来自不同患者的六种生物力学属性，这些属性源自骨盆和腰椎的形状及方向，包括骨盆入射角、骨盆倾斜角、腰椎前凸角、骶骨倾斜角、骨盆半径以及脊椎滑脱等级。该数据集的研究旨在通过对这些属性的分类，以区分正常与异常的脊椎状态，进而对椎间盘突出和脊椎滑脱等疾病进行诊断。自构建以来，Vertebral Column Dataset为脊椎疾病的相关研究提供了宝贵的数据资源，对医学图像分析和机器学习分类算法的发展产生了显著影响。

当前挑战

尽管Vertebral Column Dataset为脊椎疾病诊断研究提供了重要支持，但在应用中也面临诸多挑战。首先，数据集的样本量相对有限，这可能会限制模型的泛化能力。其次，数据集的标签具有二分类特性，即正常与异常，这在实际临床场景中可能过于简化。此外，数据集中的生物力学属性提取过程复杂，需要专业知识，这对数据集的广泛应用构成了障碍。最后，数据集在构建过程中可能存在的偏差和不确定性，也对该数据集在实际医疗诊断中的应用效果造成影响。

常用场景

经典使用场景

在机器学习领域，尤其是生物医学数据分析分支中，Vertebral Column Dataset数据集的经典使用场景在于其对脊椎生物力学属性的分类研究。通过该数据集提供的六个生物力学参数，研究者能够运用KNN分类算法等机器学习技术，对患者的脊椎状况进行判别，区分正常与异常状态，进而对疾病进行预测与诊断。

解决学术问题

该数据集解决了学术研究中对于脊椎疾病分类与预测的难题，提供了量化的生物力学参数，使得研究能够基于客观数据而非主观判断进行。它促进了医学图像分析、模式识别等领域的研究，提高了疾病诊断的准确性和效率，对医疗健康领域产生了重要影响。

衍生相关工作

基于Vertebral Column Dataset，学术界衍生了众多相关研究工作，包括但不限于更复杂的分类算法研究、疾病机理的深度分析、以及跨学科的综合应用研究。这些工作不仅深化了脊椎疾病的相关知识，也推动了机器学习技术在医疗领域的广泛应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集