北京市社会建设和民政事业发展统计公报|社会建设数据集|民政事业数据集

北京市公共数据开放平台2024-03-01 收录

社会建设

民政事业

下载链接：

http://data.beijing.gov.cn/zyml/ajg/smzj/340d7c80c3644358b4e1561c542e1065.htm

下载链接

链接失效反馈

资源简介：

该数据是北京市社会建设和民政事业发展统计公报，包括统计公报等字段信息。

提供机构：

市民政局

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4099个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国裁判文书网

中国裁判文书网是中国最高人民法院设立的官方网站，旨在公开各级法院的裁判文书。该数据集包含了大量的法律文书，如判决书、裁定书、调解书等，涵盖了民事、刑事、行政、知识产权等多个法律领域。

wenshu.court.gov.cn 收录

中文人名语料库（Chinese-Names-Corpus）

本项目包含多个数据集，如中文常见人名、中文古代人名、中文姓氏等，数据大小从数千到数百万不等，语料来源广泛，经过数据清洗处理，适用于中文分词、人名识别等场景。

github 收录

suno

该数据集包含由人工智能生成的659,788首歌曲的元数据，这些歌曲由suno.com平台生成。数据集是多语言的，主要语言为英语，但也包含日语和其他语言的歌词和标题。每个歌曲的元数据包括唯一标识符、视频和音频URL、封面图像URL、AI模型版本、生成状态、创作者信息等。数据集根据CC0许可证公开，允许任何用途的使用、修改和分发。

huggingface 收录

UniMed

UniMed是一个大规模、开源的多模态医学数据集，包含超过530万张图像-文本对，涵盖六种不同的医学成像模态：X射线、CT、MRI、超声、病理学和眼底。该数据集通过利用大型语言模型（LLMs）将特定模态的分类数据集转换为图像-文本格式，并结合现有的医学领域的图像-文本数据，以促进可扩展的视觉语言模型（VLM）预训练。

github 收录

CCNC

CCNC是一个包含365万姓名样本的大型中文姓名语料库，数据来源于姓名大全和中文人名语料库，经过处理和注音，用于中文姓名研究和实体识别。

github 收录