five

irlspbru/RusLawOD

收藏
Hugging Face2026-04-29 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/irlspbru/RusLawOD
下载链接
链接失效反馈
官方服务:
资源简介:
俄罗斯立法语料库是一个包含俄罗斯联邦法律、总统令和政府规定的文本数据集,时间范围为1991年至2023年。该语料库包括所有非秘密联邦法规和法案的281,413篇文本(176,523,268个词汇)及其元数据。语料库有两个版本:原始文本(经过最小预处理)和用于语言分析的文本(带有形态句法标注)。

The Russian Legislative Corpus is a dataset that includes texts of laws, decrees by the President, and regulations by the government of the Russian Federation, covering the period from 1991 to 2023. The corpus consists of all 281,413 texts (176,523,268 tokens) of non-secret federal regulations and acts, along with their metadata. There are two versions of the corpus: the original text with minimal preprocessing and a version prepared for linguistic analysis with morphosyntactic markup.
提供机构:
irlspbru
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作