NeoBabel|多语言图像生成数据集|包容性AI数据集
收藏数据集概述
基本信息
- 数据集名称: NeoBabel-Pretrain
- 创建者: mderakhshani
- 托管平台: Hugging Face
- 数据集地址: https://hf.co/datasets/mderakhshani/NeoBabel-Pretrain
数据集状态
- 当前状态: 空数据集(无数据文件)
- 提示信息: 需上传或创建新数据文件后才能使用Dataset Viewer浏览
数据集描述
- 用途: 官方多语言预训练数据集(用于NeoBabel项目)
- 开发状态: 即将发布(coming soon)
其他信息
- YAML元数据警告: 仓库卡片中元数据为空或缺失
- 最近下载量: 0次(上月统计)

- 1NeoBabel: A Multilingual Open Tower for Visual GenerationCohere Labs, University of Amsterdam · 2025年
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
China Health and Retirement Longitudinal Study
中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)是一个全国性的、具有代表性的老年人调查项目,旨在收集有关中国45岁及以上人群的健康、经济和社会状况的数据。该数据集包括个人和家庭层面的信息,涵盖健康状况、医疗使用、经济状况、社会支持等多个方面。
charls.pku.edu.cn 收录
中国省级灾害统计空间分布数据集(1999-2020年)
该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。
国家地球系统科学数据中心 收录
ERIC (Education Resources Information Center)
ERIC (Education Resources Information Center) 是一个广泛的教育文献数据库,包含超过130万条记录,涵盖从1966年至今的教育研究、政策和实践。数据集内容包括教育相关的期刊文章、书籍、研究报告、会议论文、技术报告、政策文件等。
eric.ed.gov 收录
GFS
数据来源采自美国国家环境预报中心的GFS(全球预报系统),该系统每天发布4次全球范围的气象数据,分辨率最高可达到0.25° x 0.25°。GFS数据提供FTP下载方式:https://nomads.ncep.noaa.gov/pub/data/nccf/com/gfs/。每次发布的数据保存在命名为gfs.YYYYMMDDHH的文件夹中。本次需要的数据精度为0.25°(0p25),所以数据的文件名为:gfs.t{ HH }z.pgrb2.0p25.f{ XXX }
地球大数据科学工程 收录