Herelles/lupan
收藏Local Urban Plans And Natural risks (LUPAN)
概述
在法国,城市规划和自然风险管理通过地方土地规划(PLU – Plan Local dUrbanisme)和自然风险预防计划(PPRn – Plan de Prévention des Risques naturels)来实施,这些计划包含土地使用规则。为了便于自动提取这些规则,我们手动标注了与蒙彼利埃相关的部分文档,蒙彼利埃是一个快速发展的城市,面临自然风险。
我们定义了一个标注示例的格式,每个条目包括标题和副标题。此外,我们提出了一种类标签的层次表示,以推广我们语料库的使用。我们的语料库包含1934个文本片段,每个片段被标记为四个类别之一(可验证、不可验证、信息性和不相关),这是法语中城市规划和自然风险管理领域的首个语料库。
获取数据集
要加载我们的语料库,请先安装datasets库:
bash
pip install datasets
然后使用以下代码: python from datasets import load_dataset
dataset = load_dataset(herelles/lupan)
引用
要引用该数据集,请使用:
@article{koptelov2023manually, title={A manually annotated corpus in French for the study of urbanization and the natural risk prevention}, author={Koptelov, Maksim and Holveck, Margaux and Cremilleux, Bruno and Reynaud, Justine and Roche, Mathieu and Teisseire, Maguelonne}, journal={Scientific Data}, volume={10}, number={1}, pages={818}, year={2023}, publisher={Nature Publishing Group UK London} }



