청와대 국민청원 데이터셋

github2023-04-22 更新2024-05-31 收录

下载链接：

https://github.com/lovit/petitions_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含从韩国总统府国民请愿公告板收集的数据，提供了一个方便使用的API形式。数据每月从请愿完成的数据中整理并更新，存储在数据档案中。

This dataset comprises data collected from the National Petition Bulletin Board of the South Korean Presidential Office, offering a user-friendly API format. The data is compiled and updated monthly from completed petitions and stored in a data archive.

创建时间：

2019-01-14

原始信息汇总

数据集概述

数据来源

数据集来源于韩国青瓦台国民请愿公告板，通过青瓦台国民请愿爬虫每月收集已完成的请愿数据。

数据存储

收集的数据存储在数据档案库中。

数据集安装

通过git clone命令安装数据集：

git clone https://github.com/lovit/petitions_dataset.git
安装后，使用setup.py进行包的安装：

cd petitions_dataset python setup.py install

数据获取

安装的包不包含数据，需使用fetch函数下载数据： python from petitions_dataset import fetch fetch()
可通过data_dir参数指定下载目录： python data_dir=./downloaded_petitions fetch(data_dir)

数据使用

使用Petitions类访问数据： python from petitions_dataset import Petitions petitions = Petitions()
可设置请愿的开始和结束日期进行筛选： python petitions = Petitions(data_dir, begin_date=2018-08-03, end_date=2018-11-28)
可设置迭代时输出的项目： python petitions.set_keys(begin, category, title) for date, category, title in petitions: print(date, category, title)

搜集汇总

数据集介绍

构建方式

청와대 국민청원 데이터셋은 청와대 국민청원 게시판에서 수집된 데이터를 기반으로 구축되었습니다. 이 데이터셋은 매월 청원이 완료된 데이터를 정리하여 업데이트하며, 수집된 데이터는 특정 아카이브에 저장됩니다. 데이터는 API 형태로 제공되어 사용자들이 쉽게 접근하고 활용할 수 있도록 설계되었습니다.

使用方法

데이터셋은 git clone을 통해 설치할 수 있으며, 설치 후 `fetch` 함수를 사용하여 데이터를 다운로드할 수 있습니다. 사용자는 `Petitions` 클래스를 통해 데이터를 로드하고, 특정 기간의 청원 데이터를 필터링하거나, 필요한 필드만 선택적으로 추출할 수 있습니다. 이는 데이터 분석 및 연구에 있어 높은 유연성을 제공합니다.

背景与挑战

背景概述

청와대 국민청원 데이터셋은 대한민국 청와대 국민청원 게시판에서 수집된 데이터를 기반으로 구성된 데이터셋이다. 이 데이터셋은 국민들이 제출한 청원 내용을 체계적으로 정리하여 연구자와 개발자들이 쉽게 접근하고 활용할 수 있도록 API 형태로 제공된다. 데이터셋은 매월 업데이트되며, 청원의 제목, 내용, 카테고리, 동의 수, 청원 기간 등 다양한 정보를 포함하고 있다. 이 데이터셋은 정치학, 사회학, 데이터 과학 등 다양한 학문 분야에서 국민의 의견과 요구를 분석하는 데 중요한 자료로 활용될 수 있다.

当前挑战

청와대 국민청원 데이터셋은 국민의 다양한 의견을 수집하고 분석하는 데 있어 몇 가지 도전 과제를 안고 있다. 첫째, 청원 데이터의 양이 방대하고 다양하여 이를 효과적으로 분류하고 분석하는 것이 어렵다. 둘째, 청원 내용의 텍스트 데이터는 비정형 데이터로서 자연어 처리 기술을 적용하여 의미를 추출하는 데 어려움이 있다. 셋째, 청원 데이터의 시간적 변화를 고려하여 동적 분석을 수행하는 것은 데이터의 복잡성을 더욱 증가시킨다. 이러한 도전 과제를 극복하기 위해서는 고급 데이터 처리 기술과 분석 방법론이 요구된다.

常用场景

经典使用场景

청와대 국민청원 데이터셋은 정치학, 사회학 및 데이터 과학 연구에서 널리 활용됩니다. 특히, 이 데이터셋은 대중의 정치적 의견과 사회적 이슈를 분석하는 데 중요한 역할을 합니다. 연구자들은 이를 통해 특정 기간 내의 청원 동향을 파악하거나, 특정 카테고리의 청원이 어떻게 변화하는지를 추적할 수 있습니다.

解决学术问题

이 데이터셋은 대중의 정치적 참여와 사회적 이슈에 대한 이해를 돕는 데 중요한 자료로 활용됩니다. 예를 들어, 특정 정책에 대한 국민의 반응을 분석하거나, 사회적 이슈가 어떻게 정치적 담론으로 전환되는지를 연구하는 데 유용합니다. 이를 통해 정책 결정자와 학계는 보다 데이터 기반의 의사결정을 할 수 있게 됩니다.

实际应用

실제로 이 데이터셋은 정부 기관, 연구소, 그리고 언론사에서 활발히 사용됩니다. 정부는 국민의 요구를 더 잘 이해하고 정책을 조정하는 데 이 데이터를 활용하며, 언론사는 대중의 관심사와 사회적 이슈를 보도하는 데 이 데이터를 참고합니다. 또한, 데이터 과학자들은 이 데이터를 활용하여 자연어 처리 및 텍스트 마이닝 기술을 개발하고 테스트합니다.

数据集最近研究