有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
src/download.py
src/calculate.py
数据集 | 均值 | 标准差 |
---|---|---|
MNIST(train) | 0.1307 | 0.3013 |
fashionMNIST(train) | 0.2860 | 0.3202 |
Omniglot(images_background) | 0.9221 | 0.2622 |
数据集 | 均值(R, G, B) | 标准差(R, G, B) |
---|---|---|
CIFAR10(train) | (0.4914, 0.4822, 0.4465) | (0.2022, 0.1993, 0.2009) |
CIFAR100(train) | (0.5071, 0.4865, 0.4409) | (0.2008, 0.1983, 0.2022) |
Caltech101(all images) | (0.5487, 0.5313, 0.5050) | (0.2497, 0.2467, 0.2483) |
Caltech256(all images) | (0.5520, 0.5336, 0.5050) | (0.2420, 0.2412, 0.2438) |
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录