supreme-court-of-india-judgements|法律判决数据集|文本生成数据集
收藏数据集概述
数据集名称
Supreme Court of India Judgements
数据集描述
该数据集包含印度最高法院所有判决的元数据。
数据集特征
- title: 判决标题,数据类型为字符串。
- filename: 文件名,数据类型为字符串。
- date: 判决日期,数据类型为字符串。
- case_number: 案件编号,数据类型为字符串。
- scr_citation: SCR引用,数据类型为字符串。
- neutral_citation: 中立引用,数据类型为字符串。
- judges: 法官,数据类型为字符串。
- length: 判决长度,数据类型为浮点数。
数据集分割
- train:
- 字节数: 11851182
- 样本数: 36914
下载信息
- 下载大小: 3857778 字节
- 数据集大小: 11851182 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:
任务类别
- 文本生成
- 摘要生成
语言
- 英语 (en)
标签
- 法律
- 印度
数据集大小类别
- 10K < n < 100K
访问判决PDF
所有判决文件上传至Cloudflare R2存储桶:https://pub-93a7aae0244344319e35611fdc1c80ef.r2.dev
访问特定判决PDF的方法:将判决的filename
属性加上".pdf",然后进行URL编码作为路径。
示例:对于filename
为"(ex)-capt.-randhir-singh-dhull-vs.-s.-d.-bhambri-,-others"的判决,可以通过以下链接访问PDF:https://pub-93a7aae0244344319e35611fdc1c80ef.r2.dev/(ex)-capt.-randhir-singh-dhull-vs.-s.-d.-bhambri-%26-others.pdf
数据来源
该数据从印度最高法院的数字最高法院报告网站(DigiSCR)抓取:https://digiscr.sci.gov.in
用途
该数据集旨在帮助用户查找和处理最高法院判决,而无需手动抓取数据。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
糖尿病预测数据集
糖尿病相关的医学研究或者健康数据
AI_Studio 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录