有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?

维基百科(wiki2019zh)
维基百科json版包含104万个词条,可作为通用中文语料,用于预训练的语料或构建词向量,也可用于构建知识问答。
github 收录
CESNET-TimeSeries24
CESNET-TimeSeries24数据集是由捷克技术大学和CESNET合作创建的,用于网络流量异常检测和预测的时间序列数据集。该数据集包含了40周内275,124个活跃IP地址的网络流量数据,涵盖了多种设备和网络异常类型。数据集的创建过程包括数据捕获、时间序列聚合和匿名化处理,确保了数据的真实性和隐私保护。该数据集主要应用于网络流量监控、资源分配和服务编排等领域,旨在解决网络流量预测和异常检测中的实际问题。
arXiv 收录
Fruits-360
一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。
github 收录
中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。时间为北京时间。
国家海洋科学数据中心 收录
ERIC (Education Resources Information Center)
ERIC (Education Resources Information Center) 是一个广泛的教育文献数据库,包含超过130万条记录,涵盖从1966年至今的教育研究、政策和实践。数据集内容包括教育相关的期刊文章、书籍、研究报告、会议论文、技术报告、政策文件等。
eric.ed.gov 收录