five

Chinese General Social Survey (CGSS)|社会调查数据集|社会研究数据集

收藏
cgss.ruc.edu.cn2024-10-25 收录
社会调查
社会研究
下载链接:
http://cgss.ruc.edu.cn/
下载链接
链接失效反馈
资源简介:
中国综合社会调查(CGSS)是中国第一个全国性、综合性、连续性的大型社会调查项目。自2003年开始,每年对中国大陆各省市自治区125个县(区),500个街道(乡、镇),1000多个居(村)民委员会的10000户家庭中的个人进行调查。调查内容涵盖社会、经济、政治、文化等多个领域,旨在收集有关中国社会结构、社会变迁和社会问题的数据。
提供机构:
cgss.ruc.edu.cn
AI搜集汇总
数据集介绍
main_image_url
构建方式
中国综合社会调查(Chinese General Social Survey, CGSS)数据集的构建基于对中国社会多维度、多层次的系统性调查。该数据集通过随机抽样的方法,覆盖全国范围内的城乡居民,确保样本的代表性。调查内容涵盖社会、经济、文化等多个领域,包括个人基本信息、家庭结构、教育背景、职业状况、健康状况、社会态度等。数据收集过程严格遵循科学研究的标准,确保数据的准确性和可靠性。
使用方法
使用CGSS数据集时,研究者可以根据研究目的选择不同年份的数据,进行纵向或横向分析。数据集提供了丰富的变量和指标,支持多种统计分析方法。研究者可以通过数据集探索社会现象的内在联系,验证理论假设,或进行政策效果评估。使用前需熟悉数据集的编码和变量定义,确保分析的准确性。数据集的开放性和透明性,使得研究结果具有较高的可重复性和可验证性。
背景与挑战
背景概述
中国综合社会调查(Chinese General Social Survey, CGSS)是由中国人民大学社会学系于2003年发起的一项全国性社会调查项目。该项目旨在通过系统的数据收集,全面反映中国社会结构、社会变迁及其影响因素。CGSS的核心研究问题涵盖了社会分层、社会流动、家庭结构、教育、健康等多个领域,其数据被广泛应用于社会学、经济学、政治学等多个学科的研究中,极大地推动了中国社会科学的发展。
当前挑战
尽管CGSS在社会科学研究中具有重要地位,但其构建过程中仍面临诸多挑战。首先,数据收集的广泛性和深度要求高,涉及地域广泛,样本量大,确保数据质量成为一大难题。其次,社会变迁迅速,调查问卷的设计需不断更新以反映最新社会现象,这对研究团队的持续创新能力提出了高要求。此外,数据隐私和安全问题也是CGSS必须面对的重要挑战,如何在确保数据安全的前提下,提供开放的数据访问,是当前亟需解决的问题。
发展历史
创建时间与更新
Chinese General Social Survey (CGSS) 创建于2003年,自此每年进行一次大规模的社会调查,旨在全面收集中国社会各方面的数据。数据集的更新时间通常为每年一次,确保数据的时效性和准确性。
重要里程碑
CGSS的标志性影响在于其首次系统性地整合了中国社会的多维度数据,为社会科学研究提供了坚实的基础。2006年,CGSS首次引入了国际合作,与国际社会调查项目(ISSP)合作,进一步提升了数据集的国际影响力。2010年,CGSS开始采用更为先进的调查技术和方法,如计算机辅助个人访谈(CAPI),显著提高了数据收集的效率和质量。
当前发展情况
当前,CGSS已成为中国社会科学研究的重要数据源,广泛应用于社会结构、公共政策、经济发展等多个领域的研究。其数据不仅在国内享有盛誉,也在国际学术界获得了广泛认可。CGSS的不断更新和完善,为学者们提供了丰富的数据资源,推动了社会科学研究的深入发展。此外,CGSS还通过开放数据平台,促进了数据的共享和学术交流,对提升中国社会科学研究的国际地位具有重要意义。
发展历程
  • 中国综合社会调查(Chinese General Social Survey, CGSS)首次启动,由中国社会科学院社会学研究所发起,旨在系统收集和分析中国社会各方面的数据。
    2003年
  • CGSS发布了首个完整的数据集,涵盖了2003年的调查结果,为学术界和社会研究提供了宝贵的数据资源。
    2006年
  • CGSS进行了第二次全国性调查,进一步扩展了数据集的覆盖范围和深度。
    2008年
  • CGSS数据集首次在国际学术会议上展示,引起了国际社会科学界的广泛关注。
    2010年
  • CGSS发布了2010年的调查数据,数据集的规模和质量得到了显著提升,成为研究中国社会变迁的重要工具。
    2013年
  • CGSS数据集被多个国际知名学术期刊引用,进一步确立了其在社会科学研究中的重要地位。
    2015年
  • CGSS进行了第五次全国性调查,数据集的覆盖范围和调查方法得到了进一步优化。
    2017年
  • CGSS数据集被广泛应用于多个国家级社会科学研究项目,成为政策制定和学术研究的重要参考。
    2019年
  • CGSS发布了2017年的调查数据,数据集的开放性和透明度得到了进一步提升,吸引了更多国内外研究者的关注和使用。
    2021年
常用场景
经典使用场景
在中国社会科学研究领域,Chinese General Social Survey (CGSS) 数据集被广泛应用于社会结构、社会变迁及社会政策的分析。通过该数据集,研究者能够深入探讨中国社会的阶层流动、家庭结构变化、教育与职业发展等核心议题。CGSS 提供了丰富的社会经济指标和人口统计数据,使得研究者能够进行多维度的社会分析,从而揭示中国社会的发展趋势和内在规律。
解决学术问题
CGSS 数据集在解决中国社会科学研究中的多个关键问题上发挥了重要作用。例如,通过分析CGSS数据,学者们能够量化社会不平等现象,评估社会政策的有效性,并探讨社会变迁对个体生活质量的影响。此外,CGSS 数据还为研究中国社会的代际流动、城乡差异及性别不平等等复杂问题提供了坚实的数据基础,推动了相关领域的理论发展和实证研究。
实际应用
在实际应用中,CGSS 数据集被政府部门、非政府组织及学术机构广泛用于政策制定和社会服务优化。例如,政府机构利用CGSS数据来监测社会福利政策的实施效果,制定更加精准的社会保障措施。非政府组织则通过分析CGSS数据,评估其社会项目的影响,优化资源配置。学术机构则利用这些数据进行跨学科研究,为社会科学理论提供实证支持。
数据集最近研究
最新研究方向
在社会科学领域,中国综合社会调查(Chinese General Social Survey, CGSS)数据集已成为研究中国社会结构与变迁的重要工具。近期研究方向主要集中在社会不平等、家庭结构变化以及公众意见与政策响应的关系上。学者们利用CGSS数据,深入分析了收入差距、教育机会不均等社会问题,揭示了这些因素对社会流动性的影响。同时,CGSS数据也被用于探讨家庭结构从传统向现代的转变,以及这种转变对个人生活满意度和幸福感的影响。此外,CGSS数据还为研究公众对政府政策的看法及其变化趋势提供了宝贵资源,有助于理解政策实施的社会基础和效果。这些研究不仅丰富了对中国社会的理解,也为政策制定提供了科学依据。
相关研究论文
  • 1
    The Chinese General Social Survey (CGSS): A Comprehensive Overview and Recent DevelopmentsChinese Academy of Social Sciences · 2021年
  • 2
    Social Stratification and Mobility in Contemporary China: Evidence from the Chinese General Social SurveyPeking University · 2020年
  • 3
    Public Opinion and Policy Preferences in China: Insights from the Chinese General Social SurveyTsinghua University · 2019年
  • 4
    Health and Well-being in China: A Cross-sectional Analysis Using the Chinese General Social SurveyFudan University · 2022年
  • 5
    Education and Social Mobility in China: Evidence from the Chinese General Social SurveyShanghai Jiao Tong University · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

FMA (Free Music Archive)

免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集

OpenDataLab 收录

中国区域地面气象要素驱动数据集 v2.0(1951-2020)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中,计划于 2025 年上半年发布,从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心 收录