darrow-ai/LegalLensNLI
收藏Hugging Face2024-07-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/darrow-ai/LegalLensNLI
下载链接
链接失效反馈官方服务:
资源简介:
LegalLensNLI数据集是一个独特的条目集合,旨在展示法律案件与受其影响的人之间的联系。它专门为机器学习工具设计,旨在深入调查法律违规领域,特别是集体诉讼投诉。主要目标是找到因某些法律案件而受到伤害的人,并帮助他们处理赔偿申请。数据集中的每一行包含三个关键元素:前提(Premise)是实际集体诉讼案件的简明摘要,突出核心法律问题;假设(Hypothesis)是类似于社交媒体平台上的投诉或评论的人工生成文本,反映与摘要案件相关的个人表达或报告;标签(Label)是前提和假设之间的关系。数据集的结构包括一个主文件和一个按法律领域分类的目录,支持机器学习任务。数据字段包括前提、假设、法律行为和标签。数据集由Darrow.ai在2023年策划。
提供机构:
darrow-ai
原始信息汇总
数据集概述
名称: JusticeLens
任务类别:
- zero-shot-classification
- text-classification
语言:
- en
标签:
- legal
- legalnlp
- class action
大小类别:
- n<1K
概述: LegalLensNLI数据集是一个独特的条目集合,旨在展示法律案件与受其影响的人之间的联系。该数据集专为旨在调查法律违规行为(特别是集体诉讼投诉)的机器学习工具而设计。其主要目标是找到因某些法律案件而受到伤害的人,并帮助他们处理赔偿索赔。
数据结构:
- Premise: 对实际集体诉讼案件的简明摘要,突出核心法律问题。
- Hypothesis: 人工生成的文本,类似于Reddit、Twitter或各种博客文章上的投诉或评论,反映与摘要案件相关的个人表达或报告。
- Label: 前提和假设之间的关系。
数据文件:
LegalLensNLI.csv: 包含所有法律领域数据的主数据集文件。mnli-by-legal-act: 进一步将数据分类到特定法律领域,并包含每个领域的train、test和validation文件,以支持机器学习任务。
数据字段:
- premise: (str) 从法律文件中提取的背景信息或上下文,提供法律推理依据的设定或事实。
- hypothesis: (str) 从前提中得出的陈述,代表在给定前提的上下文中要评估其真实性的可能场景或断言。
- legal_act: (str) 与前提和假设相关的特定法律行为或法规,指示所涉及的法律领域。
- label: (int) 分配给前提和假设之间关系分类标签,通常指示假设在法律上下文中是基于前提的蕴含、矛盾还是中性。
数据加载: python from datasets import load_dataset dataset = load_dataset("darrow-ai/LegalLensNLI")
引用信息:
@article{bernsohn2024legallens, title={LegalLens: Leveraging LLMs for Legal Violation Identification in Unstructured Text}, author={Bernsohn, Dor and Semo, Gil and Vazana, Yaron and Hayat, Gila and Hagag, Ben and Niklaus, Joel and Saha, Rohit and Truskovskyi, Kyryl}, journal={arXiv preprint arXiv:2402.04335}, year={2024} }
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



