five

公共政策语料包migu2024

收藏
西部数据交易中心2024-12-03 更新2024-12-04 收录
下载链接:
https://westdex.com.cn/market/data/detail/8911
下载链接
链接失效反馈
官方服务:
资源简介:
公共政策语料包-migu2024,是公共政策分析评估的中文专业语料包,聚合2024年全国、部分省市、部分区县、部分街镇正式发布的4356 个有效公共政策资料,形成精选语料包(6.9671万tokens去重分词、聚类词性标注)。语料包年度更新,按照语料数据“采、洗、标、测、用”标准,依托公共政策分析专业研究人员清洗和标注及多重筛选,多维对齐情绪价值、文化价值、社会价值的最新标准要求,构建公共政策专用词汇的分级分类标注标准,持续补充新语料,剔除旧语料,确保语料库的数据保持时效性和相关性,为垂类模型训练提供公共政策文本分析的专业语料支持。

Public Policy Corpus - migu2024 is a professional Chinese corpus dedicated to public policy analysis and evaluation. It aggregates 4,356 valid official public policy documents released in 2024 at the national level and across select provincial, municipal, district/county, and sub-district/township administrative regions, forming a curated corpus with 69,671 deduplicated tokens processed via word segmentation, clustering, and part-of-speech tagging. The corpus is updated annually. Following the standardized workflow of "collection, cleaning, annotation, validation, and application" for corpus data, it is cleaned, annotated, and multi-screened by professional researchers in public policy analysis, and multi-dimensionally aligned with the latest standard requirements for emotional value, cultural value, and social value. It has established a hierarchical and categorized annotation standard for domain-specific public policy vocabulary, continuously supplements new corpus materials, and eliminates outdated corpus to maintain the timeliness and relevance of the corpus data, providing professional corpus support for public policy text analysis in domain-specific model training.
提供机构:
重庆迷殼科技有限公司
创建时间:
2024-12-03
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集名为'公共政策语料包migu2024',推测是一个专注于公共政策领域的文本语料集合,可能用于自然语言处理或政策分析研究。由于当前访问受限,无法获取详细内容描述,建议重试或查阅其他来源以了解具体数据特点和用途。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作