hotfinda/smithsonian_butterflies_subset
收藏Hugging Face2023-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hotfinda/smithsonian_butterflies_subset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image_url
dtype: string
- name: image_alt
dtype: string
- name: id
dtype: string
- name: name
dtype: string
- name: scientific_name
dtype: string
- name: gender
dtype: string
- name: taxonomy
dtype: string
- name: region
dtype: string
- name: locality
dtype: string
- name: date
dtype: string
- name: usnm_no
dtype: string
- name: guid
dtype: string
- name: edan_url
dtype: string
- name: source
dtype: string
- name: stage
dtype: float64
- name: image
dtype: image
- name: image_hash
dtype: string
- name: sim_score
dtype: float64
splits:
- name: train
num_bytes: 237753960.0
num_examples: 1000
download_size: 237446351
dataset_size: 237753960.0
---
# Dataset Card for "smithsonian_butterflies_subset"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
hotfinda
原始信息汇总
数据集概述
数据集信息
- 数据集名称: smithsonian_butterflies_subset
- 下载大小: 237446351 字节
- 数据集大小: 237753960.0 字节
特征描述
- image_url: 字符串类型
- image_alt: 字符串类型
- id: 字符串类型
- name: 字符串类型
- scientific_name: 字符串类型
- gender: 字符串类型
- taxonomy: 字符串类型
- region: 字符串类型
- locality: 字符串类型
- date: 字符串类型
- usnm_no: 字符串类型
- guid: 字符串类型
- edan_url: 字符串类型
- source: 字符串类型
- stage: 浮点数类型
- image: 图像类型
- image_hash: 字符串类型
- sim_score: 浮点数类型
数据分割
- train:
- 样本数量: 1000
- 字节数: 237753960.0
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是史密森尼蝴蝶数据的一个子集,包含1,000条蝴蝶样本记录,每条记录包括蝴蝶的图片链接、俗名、学名、分类学信息和地理分布等丰富元数据。数据集以parquet格式存储,总大小为237 MB,适用于图像识别、物种分类和生物多样性研究等任务。
以上内容由遇见数据集搜集并总结生成



