Global Land Ice Measurements from Space (GLIMS)|冰川数据集|气候变化数据集
收藏
- GLIMS项目正式启动,旨在通过卫星遥感技术监测全球冰川变化。
- GLIMS数据库首次发布,包含了对全球冰川的初步观测数据。
- GLIMS数据集首次应用于科学研究,特别是在冰川学和气候变化领域。
- GLIMS数据集的覆盖范围扩展至全球,包括北极和南极地区。
- GLIMS数据集更新,引入了高分辨率卫星图像,提升了数据精度。
- GLIMS数据集被广泛应用于联合国气候变化框架公约(UNFCCC)的报告中。
- GLIMS数据集与NASA的冰、云和陆地高程卫星(ICESat-2)数据整合,进一步增强了全球冰川监测能力。
- GLIMS数据集发布了最新的全球冰川变化报告,为全球气候变化研究提供了重要数据支持。
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
jpft/danbooru2023
Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。
hugging_face 收录
ChemBL
ChemBL是一个化学信息学数据库,包含大量生物活性数据,涵盖了药物发现和开发过程中的各种化学实体。数据集包括化合物的结构信息、生物活性数据、靶点信息等。
www.ebi.ac.uk 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
Movies Dataset
这个数据集包含电影的详细信息,包括电影名称、评分、类型、年份、发布日期、IMDb评分、投票数、导演、编剧、主演、制作国家、预算、总收入、制作公司和电影时长。
github 收录