five

A15_28119.jpg

收藏
DataONE2021-11-30 更新2024-06-08 收录
下载链接:
https://search.dataone.org/view/sha256:dec7d5c261f5da193c88df7a600bf1343fcd979d2128843f5dad69c5128014bd
下载链接
链接失效反馈
资源简介:
Link to OCHRE database: http://pi.lib.uchicago.edu/1001/org/ochre/c95dc75f-1081-4c12-8539-064291600a05
创建时间:
2023-11-13
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MNBVC

MNBVC数据集是一个超大规模的中文语料集,包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。

github 收录

Tara Oceans

Tara Oceans数据集包含了全球海洋微生物的宏基因组和宏转录组数据,涵盖了从极地到热带的多个海洋生态系统。数据包括微生物的DNA和RNA序列,以及相关的环境元数据。

www.ebi.ac.uk 收录

开源公平性干预数据集

开源公平性干预数据集由乔治梅森大学计算机科学系的研究团队创建,包含62个开源公平性干预项目。该数据集旨在帮助研究人员和从业者更好地理解和使用公平性干预工具,以提高机器学习模型的公平性。数据集涵盖了广泛的公平性干预工具,包括工具、工具包、库和框架等。该数据集的创建过程包括从GitHub上搜索和筛选公平性干预项目,并分析其可用性、兼容性、算法覆盖范围、区分因素和机器学习生命周期支持等方面。该数据集的应用领域包括医疗保健、金融和教育等领域,旨在解决机器学习模型中的偏见问题,促进公平和道德的决策。

arXiv 收录

Electrical-Lines-Defect-Detection

该数据集是针对电力线路缺陷检测的,包含了由APEPDCL线路工人使用移动相机捕获的图片,并由Sampath Balaji团队整理。数据集以CC BY 4.0许可证发布,旨在促进开源合作、可重现性和人工智能的实践学习。数据集分为两个模块:目标检测和分类。目标检测模块遵循YOLOv12格式,分类模块由文件夹和CSV文件组成,都提供了训练、验证和测试数据集。

huggingface 收录

Hospital Deterioration Dataset

这是一个高保真模拟医院队列数据集,包含10,000个模拟医院入院记录,每个记录跟踪最多72小时。数据集提供每小时的生命体征(心率、血压、呼吸频率等)和实验室数值(白细胞计数、乳酸、肌酐等),以及患者人口统计学信息和多种恶化结果标签。专门设计用于构建和基准测试早期预警系统和临床恶化风险模型的机器学习应用。

github 收录