rubenamtz0/law_entity_recognition
收藏Hugging Face2024-06-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/rubenamtz0/law_entity_recognition
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个专门用于法律文本分析的集合,其中每个输入是一段法律文本,范围从判例法到法定条款,相应的输出是精心提取的数据点,旨在构建知识图谱。输入包括冗长的法律语言,充满了术语和复杂的句子结构。对于每个输入段落,输出包括三个主要部分:1. 实体:捕捉文本中的基本元素,如法律案例、机构、个人、法律和地点。每个实体由一个包含实体名称、类型和描述其法律意义的上下文的元组表示。2. 关系:描述实体之间的动态联系。这些关系被记录为识别源实体、目标实体和关系类型(如管辖权、引用、层次结构)的元组,并附有解释法律框架内关系的描述。3. 声明:从文本中提取的事实或论点性陈述,每个陈述都与一个表明其法律地位的状态相关联,并提供任何相关的时间限制,为法律主张提供时间维度。总体而言,该数据集作为法律论述的结构化表示,将法律段落的复杂性转化为相互关联的数据点网络,从而支持复杂的分析和应用,如法律研究、案例预测和法律领域内的自动推理。
该数据集是一个专门用于法律文本分析的集合,其中每个输入是一段法律文本,范围从判例法到法定条款,相应的输出是精心提取的数据点,旨在构建知识图谱。输入包括冗长的法律语言,充满了术语和复杂的句子结构。对于每个输入段落,输出包括三个主要部分:1. 实体:捕捉文本中的基本元素,如法律案例、机构、个人、法律和地点。每个实体由一个包含实体名称、类型和描述其法律意义的上下文的元组表示。2. 关系:描述实体之间的动态联系。这些关系被记录为识别源实体、目标实体和关系类型(如管辖权、引用、层次结构)的元组,并附有解释法律框架内关系的描述。3. 声明:从文本中提取的事实或论点性陈述,每个陈述都与一个表明其法律地位的状态相关联,并提供任何相关的时间限制,为法律主张提供时间维度。总体而言,该数据集作为法律论述的结构化表示,将法律段落的复杂性转化为相互关联的数据点网络,从而支持复杂的分析和应用,如法律研究、案例预测和法律领域内的自动推理。
提供机构:
rubenamtz0
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别: 文本生成
- 语言: 英语、西班牙语
- 数据集大小: 1K<n<10K
- 配置:
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: "train.csv"
数据集描述
该数据集旨在将复杂的法律文本转换为结构化输出,详细描述实体、它们之间的相互关系和主张,为构建法律知识图谱提供基础,以促进高级分析和应用。
详细描述
- 输入: 法律文本段落,包括案例法和法定条款。
- 输出: 精心提取的数据点,用于构建知识图谱,包括:
- 实体: 文本中的基本元素,如法律案例、机构、个人、法律和地点。
- 关系: 实体间的动态相互连接,描述源实体、目标实体和关系类型。
- 主张: 从文本中提取的事实或论点,附带法律地位和相关时间限制。
数据集作为法律论述的结构化表示,将法律文本的复杂性转化为相互关联的数据点网络,从而支持法律研究、案例预测和法律领域的自动推理等高级分析和应用。



