five

ACCORD-NLP/CODE-ACCORD-Relations

收藏
Hugging Face2025-02-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ACCORD-NLP/CODE-ACCORD-Relations
下载链接
链接失效反馈
官方服务:
资源简介:
CODE-ACCORD语料库包含来自英格兰和芬兰建筑法规的注释句子,旨在支持建筑、翻新或拆除工作的自动合规性检查规则生成。该数据集包含英语建筑法规和芬兰国家建筑法规的英文翻译。数据集主要关注从文本中提取信息以支持规则生成,包括标注实体和关系。

The CODE-ACCORD corpus contains annotated sentences from the building regulations of England and Finland, aiming to support rule generation for automated compliance checks in construction, renovation, or demolition works. The dataset includes both the English Building Regulations and the English translation of the Finnish National Building Code. The corpus focuses on extracting information from text to support rule generation, including entity and relation annotations.
提供机构:
ACCORD-NLP
原始信息汇总

数据集概述

数据集名称

  • CODE-ACCORD: A Corpus of Building Regulatory Data for Rule Generation towards Automatic Compliance Checking

数据集内容

  • 语言: 英语
  • 来源: 包含英格兰和芬兰的建筑法规的标注句子,以及芬兰国家建筑规范的英文翻译。
  • 目的: 支持规则生成,用于建筑、翻新或拆除工作的自动合规检查。

数据标注

  • 实体类型: 对象、属性、质量和价值。
  • 关系类型: 选择、必要性、部分-属于、非-部分-属于、大于、大于等于、等于、小于等于、小于和无。
  • 数据分割: 训练集占80%,测试集占20%。

数据文件格式

实体数据文件

  • 属性: example_id, content, processed_content, label, metadata
  • 描述: 包括唯一ID、原始文本内容、分词后的文本内容、实体标签和元数据。

关系数据文件

  • 属性: example_id, content, metadata, tagged_sentence, relation_type
  • 描述: 包括唯一ID、原始文本内容、元数据、标记的实体对句子及其关系类型。

数据使用

  • 实体数据: 使用Python代码通过Pandas DataFrames加载训练和测试数据集。
  • 关系数据: 同样使用Python代码通过Pandas DataFrames加载训练和测试数据集。

引用信息

  • 论文: 详细介绍了数据标注、统计和分布。
  • 作者: Hettiarachchi, Hansi 等。
  • 发表: arXiv预印本,2024年。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作