有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
该数据集用于通过matplotlib、seaborn和pandas对医疗检查数据进行可视化和计算。数据集中的行代表患者,列代表身体测量、各种血液检测结果和生活方式选择等信息。数据集用于探索心血管疾病与身体测量、血液指标和生活方式选择之间的关系。
特征 | 变量类型 | 变量 | 值类型 |
---|---|---|---|
年龄 | 客观特征 | age | 整数(天) |
身高 | 客观特征 | height | 整数(厘米) |
体重 | 客观特征 | weight | 浮点数(千克) |
性别 | 客观特征 | sex | 分类代码 |
收缩压 | 检查特征 | ap_hi | 整数 |
舒张压 | 检查特征 | ap_lo | 整数 |
胆固醇 | 检查特征 | cholesterol | 1: 正常, 2: 高于正常, 3: 远高于正常 |
葡萄糖 | 检查特征 | gluc | 1: 正常, 2: 高于正常, 3: 远高于正常 |
吸烟 | 主观特征 | smoke | 二进制 |
酒精摄入 | 主观特征 | alco | 二进制 |
体育活动 | 主观特征 | active | 二进制 |
心血管疾病的有无 | 目标变量 | cardio | 二进制 |
examples/Figure_1.png
的图表,展示cholesterol
、gluc
、alco
、active
和smoke
变量在不同面板中患者的心血管疾病状态(cardio=1和cardio=0)的计数。overweight
列,通过计算BMI来确定一个人是否超重。如果BMI > 25,则该人超重,使用值0表示不超重,值1表示超重。cholesterol
或gluc
的值为1,则将其值设为0;如果值大于1,则将其值设为1。catplot()
创建一个图表,展示分类特征的值计数。数据应按Cardio分割,每个cardio
值对应一个图表,图表应类似于examples/Figure_1.png
。(df[ap_lo] <= df[ap_hi])
)(df[height] >= df[height].quantile(0.025))
)heatmap()
绘制相关矩阵图。遮罩上三角部分,图表应类似于examples/Figure_2.png
。中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
UCI Wine
UCI Wine数据集包含了178个样本,每个样本有13个特征,用于分类任务。这些特征包括葡萄酒的化学成分,如酒精含量、苹果酸、灰分等。数据集的目标是将葡萄酒分类为三个不同的品种。
archive.ics.uci.edu 收录
中国农村教育发展报告
该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。
www.moe.gov.cn 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录