scikit-learn/iris
收藏Hugging Face2022-06-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/scikit-learn/iris
下载链接
链接失效反馈官方服务:
资源简介:
Iris数据集最初由R.A. Fisher在1936年的论文中使用,并可在UCI Machine Learning Repository中找到。该数据集包含三种鸢尾花,每种有50个样本,每个样本有四个特征(萼片长度、萼片宽度、花瓣长度、花瓣宽度)和一个类别标签(鸢尾花的种类)。其中一种鸢尾花与其他两种线性可分,而另外两种之间则不能线性可分。数据集还包含一些错误样本,如第35个和第38个样本的特征值有误。
The Iris dataset was originally utilized by R.A. Fisher in his 1936 paper and is accessible via the UCI Machine Learning Repository. It comprises three species of iris flowers, with 50 samples for each species. Each sample includes four features (sepal length, sepal width, petal length, petal width) and a class label indicating the specific iris species. One iris species is linearly separable from the other two, while the remaining two species are not linearly separable from each other. Additionally, the dataset contains some erroneous samples, such as the 35th and 38th samples with incorrect feature values.
提供机构:
scikit-learn
原始信息汇总
Iris Species Dataset 概述
数据集来源
- 该数据集源自 UCI Machine Learning Repository,可通过 Kaggle 获取。
数据集描述
- 包含三种鸢尾花(Iris Setosa, Iris Versicolour, Iris Virginica)各50个样本。
- 每个样本包含以下四个特征:
- 萼片长度(cm)
- 萼片宽度(cm)
- 花瓣长度(cm)
- 花瓣宽度(cm)
- 预测属性为鸢尾花的种类。
数据集特点
- 一种鸢尾花种类与其他两种线性可分,但其他两种之间非线性可分。
- 数据集被广泛认为是模式识别文献中最著名的数据库之一。
数据集问题
- 第35个样本和第38个样本存在特征错误。



