five

hitorilabs/iris

收藏
Hugging Face2023-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hitorilabs/iris
下载链接
链接失效反馈
官方服务:
资源简介:
Iris数据集是用于演示简单分类模型的流行数据集,最初由R.A. Fisher在1936年的论文中使用,并可在UCI机器学习库中找到。数据集包含三种鸢尾花(Iris)的150个样本,每种50个样本,每个样本有四个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度,以及一个类别标签。数据集经过了一些修改,如删除了`id`列,将`species`列转换为ClassLabel类型,并将特征列从`float64`转换为`float32`。此外,特征名称被改为蛇形命名法。
提供机构:
hitorilabs
原始信息汇总

数据集概述

数据集信息

  • 许可证: cc0-1.0
  • 大小类别: n<1K
  • 任务类别: tabular-classification

特征信息

  • 特征列表:
    • petal_length: float32
    • petal_width: float32
    • sepal_length: float32
    • sepal_width: float32
    • species:
      • 类别标签:
        • 0: Iris-setosa
        • 1: Iris-versicolor
        • 2: Iris-virginica

数据分割

  • 训练集:
    • 名称: train
    • 字节数: 3600
    • 样本数: 150

数据集大小

  • 下载大小: 3835
  • 数据集大小: 3600

配置

  • 配置名称: default
  • 数据文件: data/train-*

数据集描述

  • 来源: 该数据集是从scikit-learn/iris复制并转换而来,以更适应huggingface。
  • 修改内容:
    • 移除了id
    • species列转换为ClassLabel类型
    • 特征列从float64降级为float32
    • 特征名称改为蛇形命名法

数据集历史

  • 首次使用: 在R.A. Fisher的1936年论文《The Use of Multiple Measurements in Taxonomic Problems》中使用。
  • 数据来源: UCI Machine Learning Repository。
  • 类别描述: 包含三种鸢尾花,每种50个样本,每个样本包含花的属性。一种花可以与其他两种线性分离,但其他两种不能相互线性分离。
  • 预测属性: 鸢尾花类别。

特征描述

  • 特征列表:
    • 萼片长度(cm)
    • 萼片宽度(cm)
    • 花瓣长度(cm)
    • 花瓣宽度(cm)
    • 类别:
      • Iris-setosa
      • Iris-versicolor
      • Iris-virginica
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作