darrow-ai/LegalLensNLI

Name: darrow-ai/LegalLensNLI
Creator: darrow-ai
Published: 2024-07-08 06:35:09
License: 暂无描述

Hugging Face2024-07-08 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/darrow-ai/LegalLensNLI

下载链接

链接失效反馈

官方服务：

资源简介：

LegalLensNLI数据集是一个独特的条目集合，旨在展示法律案件与受其影响的人之间的联系。它专门为机器学习工具设计，旨在深入调查法律违规领域，特别是集体诉讼投诉。主要目标是找到因某些法律案件而受到伤害的人，并帮助他们处理赔偿申请。数据集中的每一行包含三个关键元素：前提（Premise）是实际集体诉讼案件的简明摘要，突出核心法律问题；假设（Hypothesis）是类似于社交媒体平台上的投诉或评论的人工生成文本，反映与摘要案件相关的个人表达或报告；标签（Label）是前提和假设之间的关系。数据集的结构包括一个主文件和一个按法律领域分类的目录，支持机器学习任务。数据字段包括前提、假设、法律行为和标签。数据集由Darrow.ai在2023年策划。

提供机构：

darrow-ai

原始信息汇总

数据集概述

名称: JusticeLens

任务类别:

zero-shot-classification
text-classification

语言:

标签:

legal
legalnlp
class action

大小类别:

n<1K

概述: LegalLensNLI数据集是一个独特的条目集合，旨在展示法律案件与受其影响的人之间的联系。该数据集专为旨在调查法律违规行为（特别是集体诉讼投诉）的机器学习工具而设计。其主要目标是找到因某些法律案件而受到伤害的人，并帮助他们处理赔偿索赔。

数据结构:

Premise: 对实际集体诉讼案件的简明摘要，突出核心法律问题。
Hypothesis: 人工生成的文本，类似于Reddit、Twitter或各种博客文章上的投诉或评论，反映与摘要案件相关的个人表达或报告。
Label: 前提和假设之间的关系。

数据文件:

LegalLensNLI.csv: 包含所有法律领域数据的主数据集文件。
mnli-by-legal-act: 进一步将数据分类到特定法律领域，并包含每个领域的train、test和validation文件，以支持机器学习任务。

数据字段:

premise: (str) 从法律文件中提取的背景信息或上下文，提供法律推理依据的设定或事实。
hypothesis: (str) 从前提中得出的陈述，代表在给定前提的上下文中要评估其真实性的可能场景或断言。
legal_act: (str) 与前提和假设相关的特定法律行为或法规，指示所涉及的法律领域。
label: (int) 分配给前提和假设之间关系分类标签，通常指示假设在法律上下文中是基于前提的蕴含、矛盾还是中性。

数据加载: python from datasets import load_dataset dataset = load_dataset("darrow-ai/LegalLensNLI")

引用信息:

@article{bernsohn2024legallens, title={LegalLens: Leveraging LLMs for Legal Violation Identification in Unstructured Text}, author={Bernsohn, Dor and Semo, Gil and Vazana, Yaron and Hayat, Gila and Hagag, Ben and Niklaus, Joel and Saha, Rohit and Truskovskyi, Kyryl}, journal={arXiv preprint arXiv:2402.04335}, year={2024} }

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集