ISO Language Codes|语言代码数据集|国际化数据集
收藏数据集概述
数据来源
- 数据来源于Library of Congress作为ISO 639-2注册机构,以及Unicode Common Locale Data Repository。
数据文件
data/language-codes.csv
- 包含184种语言的ISO 639-1(alpha 2 / 两字母)代码及其英文名称。
data/language-codes-3b2.csv
- 包含184种语言的ISO 639-2(alpha 3 / 三字母)书目代码和ISO 639-1代码,以及它们的英文名称。
data/language-codes-full.csv
- 包含所有ISO 639-2(alpha 3 / 三字母)代码的语言,相应的ISO 639-1代码(如果有),以及每种语言的英文和法文名称。
- 存在两种三字母代码版本:书目和术语。每种语言都有一个书目代码,但只有少数语言有术语代码。术语代码设计为与相应的ISO 639-1两字母代码相似。
- 包含四个特殊代码:mul, und, mis, zxx;以及一个保留范围qaa-qtz。
data/ietf-language-tags.csv
- 列出所有IETF语言标签,这些标签来自http://www.iana.org/assignments/language-tag-extensions-registry,并被包含在http://www.unicode.org/Public/cldr/latest/core.zip的/main文件夹中。
许可证
- 本数据集根据Public Domain Dedication and License (PDDL)授权。
- 使用这些数据时,建议检查原始来源以确认任何特定限制。

中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
基于站点观测的中国1km土壤湿度日尺度数据集(2000-2022)
本研究提供了中国范围1km高质量的土壤湿度数据集-SMCI1.0(Soil Moisture of China by in situ data, version 1.0),SMCI1.0是包含2000-2022年、日尺度、以10厘米为间隔10层深度(10-100cm)的高时空分辨率土壤湿度,数据单位为0.001m³/m³,缺失值为-999,投影为WGS1984。该数据集是以中国气象局提供的1,648个站点观测10层土壤湿度作为基准,使用ERA5_Land气象强迫数据、叶面积指数(LAI)、土地覆盖类型(Landtypes)、地形(DEM)和土壤特性(Soil properties)作为协变量,通过机器学习方式获得。本研究进行了两组实验以验证SMCI1.0的精度,时间尺度上:ubRMSE为0.041-0.052,R为0.883-0.919;空间尺度上:ubRMSE为0.045-0.051,R为0.866-0.893。 由于SMCI1.0是基于实地观测的土壤湿度,它可以作为现有基于模型和卫星数据集的有效补充。该数据产品可用于各种水文、气象、生态分析和建模,尤其在需要高质量、高分辨率土壤湿度的应用上至关重要。有关数据集的引用及详细描述,请阅读说明文档。为便于使用,本研究提供了两种不同分辨率的版本:30 秒(~1km)和0.1度(~9km)。
国家青藏高原科学数据中心 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
中国逐日降水数据集(1961-2022,0.1°/0.25°/0.5°)
CHM_PRE数据集基于中国境内及周边1961至今共2839个站点的日降水观测,在传统的“降水背景场 + 降水比值场”的数据集构建思路上,尝试应用月值降水约束和地形特征校正,并依据中国范围内约4万个高密度站点2015–2019年的日降水量插值后数据进行精度评价。经评估认为,CHM_PRE可以较好的表征降水的空间变异性,其日值时间序列与高密度站点日值降水观测结果之间的相关系数中位数为0.78,均方根误差中位数为8.8 mm/d,KGE值中位数为0.69,与目前常用的降水数据集(CGDPA、CN05.1、CMA V2.0)有很好的一致性。 数据集的时间范围为1961年至今,空间分辨率为0.1°、0.25°和0.5°,经纬度范围为18°N–54°N, 72°E–136°E。
国家青藏高原科学数据中心 收录