five

CUAD

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/theatticusproject/cuad/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是由专业律师监督下手动标注的510份商业法律合同组成,涵盖了41种法律条款类型,共计超过13,000个标注。研究重点在于该语料库中存在的12种最常见的条款级别类型。任务是对合同中的法律条款进行识别和注释。

This dataset comprises 510 commercial legal contracts manually annotated under the supervision of professional lawyers, encompassing 41 categories of legal clauses with a total of over 13,000 annotations. The research focuses on the 12 most common clause hierarchy types present in this corpus. The core task is to identify and annotate legal clauses within these contracts.
提供机构:
The Atticus Project
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CUAD(Contract Understanding Atticus Dataset)是一个用于法律合同审查的专家标注NLP数据集,旨在为自然语言处理社区提供具有挑战性的研究基准。该数据集包含训练好的Transformer模型(如RoBERTa和DeBERTa)和额外的未标注合同预训练数据,发表于NeurIPS 2021。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作