有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?

MNBVC
MNBVC数据集是一个超大规模的中文语料集,包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。
github 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录
Electrical-Lines-Defect-Detection
该数据集是针对电力线路缺陷检测的,包含了由APEPDCL线路工人使用移动相机捕获的图片,并由Sampath Balaji团队整理。数据集以CC BY 4.0许可证发布,旨在促进开源合作、可重现性和人工智能的实践学习。数据集分为两个模块:目标检测和分类。目标检测模块遵循YOLOv12格式,分类模块由文件夹和CSV文件组成,都提供了训练、验证和测试数据集。
huggingface 收录
Tara Oceans
Tara Oceans数据集包含了全球海洋微生物的宏基因组和宏转录组数据,涵盖了从极地到热带的多个海洋生态系统。数据包括微生物的DNA和RNA序列,以及相关的环境元数据。
www.ebi.ac.uk 收录
中国社会事件数据库(CSED)
中国社会事件数据库(CSED)是一个基于时间线的事件汇总和分析工具,旨在记录每日社会动态与网络舆情。
github 收录