有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
Dunhuang Grottoes Painting Dataset
该数据集专为敦煌石窟壁画修复而设计,提供了大量的训练和测试样本,足以支持深度学习方法的应用。
arXiv 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
Kaggle - Digit Recognizer
该数据集包含手写数字(0-9)的图像数据,用于训练和测试数字识别模型。数据集包括训练集和测试集,训练集包含42000个样本,每个样本是一个28x28像素的灰度图像,以及对应的标签。测试集包含28000个样本,用于评估模型的性能。
www.kaggle.com 收录
CodeGen
CodeGen数据集是一个用于代码生成和理解的大型数据集,包含了多种编程语言的代码片段和相应的自然语言描述。该数据集旨在帮助研究人员和开发者训练和评估代码生成模型,提高代码生成的准确性和效率。
github.com 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录