hitorilabs/iris
收藏Hugging Face2023-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hitorilabs/iris
下载链接
链接失效反馈官方服务:
资源简介:
Iris数据集是用于演示简单分类模型的流行数据集,最初由R.A. Fisher在1936年的论文中使用,并可在UCI机器学习库中找到。数据集包含三种鸢尾花(Iris)的150个样本,每种50个样本,每个样本有四个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度,以及一个类别标签。数据集经过了一些修改,如删除了`id`列,将`species`列转换为ClassLabel类型,并将特征列从`float64`转换为`float32`。此外,特征名称被改为蛇形命名法。
提供机构:
hitorilabs
原始信息汇总
数据集概述
数据集信息
- 许可证: cc0-1.0
- 大小类别: n<1K
- 任务类别: tabular-classification
特征信息
- 特征列表:
petal_length: float32petal_width: float32sepal_length: float32sepal_width: float32species:- 类别标签:
- 0: Iris-setosa
- 1: Iris-versicolor
- 2: Iris-virginica
- 类别标签:
数据分割
- 训练集:
- 名称: train
- 字节数: 3600
- 样本数: 150
数据集大小
- 下载大小: 3835
- 数据集大小: 3600
配置
- 配置名称: default
- 数据文件: data/train-*
数据集描述
- 来源: 该数据集是从
scikit-learn/iris复制并转换而来,以更适应huggingface。 - 修改内容:
- 移除了
id列 species列转换为ClassLabel类型- 特征列从
float64降级为float32 - 特征名称改为蛇形命名法
- 移除了
数据集历史
- 首次使用: 在R.A. Fisher的1936年论文《The Use of Multiple Measurements in Taxonomic Problems》中使用。
- 数据来源: UCI Machine Learning Repository。
- 类别描述: 包含三种鸢尾花,每种50个样本,每个样本包含花的属性。一种花可以与其他两种线性分离,但其他两种不能相互线性分离。
- 预测属性: 鸢尾花类别。
特征描述
- 特征列表:
- 萼片长度(cm)
- 萼片宽度(cm)
- 花瓣长度(cm)
- 花瓣宽度(cm)
- 类别:
- Iris-setosa
- Iris-versicolor
- Iris-virginica



