diabetes dataset|糖尿病数据集|健康预测数据集
收藏数据集概述
数据集名称
- 糖尿病数据集
数据集内容
- 包含糖尿病患者的相关信息,如年龄、性别、血压、血糖水平、胰岛素水平、体质指数及患者是否患有糖尿病的结果。
数据集用途
- 用于预测患者是否患有糖尿病,基于其特征进行机器学习模型的训练和预测。
数据集在项目中的应用
- 在本项目中,数据集用于构建和部署一个数据分析应用。应用使用PyCaret进行数据预处理、模型选择、模型调优和模型评估,同时使用Streamlit创建交互式用户界面并展示结果。
数据集操作
- 用户可以通过应用的侧边栏导航,与数据和模型进行交互,也可以上传自己的数据进行预测。

Alexa Domains
该数据集由前 100 万个网站的 URL 组成。 域名使用 Alexa 流量排名进行排名 是使用浏览行为的组合来确定的 网站上的用户数、唯一身份访问者的数量和网页浏览量。更详细地说,唯一身份访问者是 在给定日期访问网站的唯一用户数, 和 pageviews 是用户 URL 请求的总数 网站。但是,对同一网站的多个请求 在同一天被计为一次综合浏览量。网站 独立访问者和综合浏览量的最高组合 排名最高
OpenDataLab 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录