five

schematise/ICAT-version1

收藏
Hugging Face2024-11-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/schematise/ICAT-version1
下载链接
链接失效反馈
官方服务:
资源简介:
Indian Contracts in Adjudicated Texts(ICAT)是一个通过自动化管道生成的文本分离和分类数据集。版本1是专家注释的,数据源通过法院网站的PDF验证,所有判决的PDF都共享以确保数据的原创性。该数据集用于文本分类模型,该模型是查询管道的一部分,用于生成更多数据。文件结构包括训练文件、数据表和判决PDF的压缩文件夹。

Indian Contracts in Adjudicated Texts(ICAT)是一个通过自动化管道生成的文本分离和分类数据集。版本1是专家注释的,数据源通过法院网站的PDF验证,所有判决的PDF都共享以确保数据的原创性。该数据集用于文本分类模型,该模型是查询管道的一部分,用于生成更多数据。文件结构包括训练文件、数据表和判决PDF的压缩文件夹。
提供机构:
schematise
原始信息汇总

Indian Contracts in Adjudicated Texts (ICAT) 数据集概述

基本信息

  • 许可证: cc-by-sa-4.0
  • 任务类别:
    • 文本分类
    • 表格问答
  • 语言: 英语
  • 数据集大小: n<1K
  • 数据集名称: Indian Contracts in Adjudicated Texts (ICAT)

数据集版本

  • 版本1:
    • 专家标注
    • 数据来源通过法院网站的PDF文件验证
    • 所有判决的PDF文件与数据集一同共享,确保数据来源的真实性
    • 用于文本分类模型,该模型是查询管道的一部分,用于生成更多数据

文件结构

  • 训练文件:
    • 文件名: train.csv
    • 内容: 包含用于训练文本分类模型的合同条款
  • 数据表文件:
    • 文件名: CombinedDatasheet.ods
    • 内容: 包含分类矩阵,包含60个判决中的合同条款,并带有标注讨论,用于进一步的机器学习训练和推理
  • 判决PDF文件夹:
    • 文件名: PDFs.zip
    • 内容: 包含含有合同条款的判决列表
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作