有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
字段 | 类型 | 描述 |
---|---|---|
unique_id | string | 由几何、时间、product_id和嵌入模型生成的哈希值 |
embedding | array | 原始嵌入数组 |
grid_cell | string | Major TOM 单元格 |
grid_row_u | int | Major TOM 单元格行 |
grid_col_r | int | Major TOM 单元格列 |
product_id | string | 原始产品的ID |
timestamp | string | 样本的时间戳 |
centre_lat | float | 片段中心的纬度 |
centre_lon | float | 片段中心的经度 |
geometry | geometry | 片段的多边形足迹 (WGS84) |
utm_footprint | string | 片段的多边形足迹 (图像 UTM) |
utm_crs | string | 原始产品的CRS |
pixel_bbox | bbox | 片段的边界框 (像素) |
python from datasets import load_dataset dataset = load_dataset("Major-TOM/Core-S2RGB-DINOv2")
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
中国农村教育发展报告
该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。
www.moe.gov.cn 收录
Breast Ultrasound Images (BUSI)
小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。
github 收录