five

FrancophonIA/ParisParl

收藏
Hugging Face2025-03-30 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/FrancophonIA/ParisParl
下载链接
链接失效反馈
官方服务:
资源简介:
ParisParl议会议事记录语料库包含了1996年至2019年法国国民议会全体会议的所有记录。该语料库基于国民议会发布的pdf文档构建,并使用frappp R包进行结构化信息的提取,转换为XML格式。语料库经过了语言学注释,包括词性标注和词干提取,并可在Corpus Workbench (CWB)中使用。请注意,这个语言资源仍在开发中,使用时没有提供任何保证。

The ParisParl Corpus of Parliamentary Debates comprises all protocols of plenary sessions in the French Assemblée nationale between 1996 and 2019. The corpus is built based on pdf documents issued by the Assemblée nationale and uses the frappp R package to extract structural information and convert it into an XML format. The corpus has been linguistically annotated with POS-tagging and lemmatization and can be used in the Corpus Workbench (CWB). Please note that this language resource is still under development and is provided without any guarantees.
提供机构:
FrancophonIA
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作