five

darrow-ai/LegalLensNLI

收藏
Hugging Face2024-07-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/darrow-ai/LegalLensNLI
下载链接
链接失效反馈
官方服务:
资源简介:
LegalLensNLI数据集是一个独特的条目集合,旨在展示法律案件与受其影响的人之间的联系。它专门为机器学习工具设计,旨在深入调查法律违规领域,特别是集体诉讼投诉。主要目标是找到因某些法律案件而受到伤害的人,并帮助他们处理赔偿申请。数据集中的每一行包含三个关键元素:前提(Premise)是实际集体诉讼案件的简明摘要,突出核心法律问题;假设(Hypothesis)是类似于社交媒体平台上的投诉或评论的人工生成文本,反映与摘要案件相关的个人表达或报告;标签(Label)是前提和假设之间的关系。数据集的结构包括一个主文件和一个按法律领域分类的目录,支持机器学习任务。数据字段包括前提、假设、法律行为和标签。数据集由Darrow.ai在2023年策划。
提供机构:
darrow-ai
原始信息汇总

数据集概述

名称: JusticeLens

任务类别:

  • zero-shot-classification
  • text-classification

语言:

  • en

标签:

  • legal
  • legalnlp
  • class action

大小类别:

  • n<1K

概述: LegalLensNLI数据集是一个独特的条目集合,旨在展示法律案件与受其影响的人之间的联系。该数据集专为旨在调查法律违规行为(特别是集体诉讼投诉)的机器学习工具而设计。其主要目标是找到因某些法律案件而受到伤害的人,并帮助他们处理赔偿索赔。

数据结构:

  • Premise: 对实际集体诉讼案件的简明摘要,突出核心法律问题。
  • Hypothesis: 人工生成的文本,类似于Reddit、Twitter或各种博客文章上的投诉或评论,反映与摘要案件相关的个人表达或报告。
  • Label: 前提和假设之间的关系。

数据文件:

  • LegalLensNLI.csv: 包含所有法律领域数据的主数据集文件。
  • mnli-by-legal-act: 进一步将数据分类到特定法律领域,并包含每个领域的traintestvalidation文件,以支持机器学习任务。

数据字段:

  • premise: (str) 从法律文件中提取的背景信息或上下文,提供法律推理依据的设定或事实。
  • hypothesis: (str) 从前提中得出的陈述,代表在给定前提的上下文中要评估其真实性的可能场景或断言。
  • legal_act: (str) 与前提和假设相关的特定法律行为或法规,指示所涉及的法律领域。
  • label: (int) 分配给前提和假设之间关系分类标签,通常指示假设在法律上下文中是基于前提的蕴含、矛盾还是中性。

数据加载: python from datasets import load_dataset dataset = load_dataset("darrow-ai/LegalLensNLI")

引用信息:

@article{bernsohn2024legallens, title={LegalLens: Leveraging LLMs for Legal Violation Identification in Unstructured Text}, author={Bernsohn, Dor and Semo, Gil and Vazana, Yaron and Hayat, Gila and Hagag, Ben and Niklaus, Joel and Saha, Rohit and Truskovskyi, Kyryl}, journal={arXiv preprint arXiv:2402.04335}, year={2024} }

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作