five

joonhok-exo-ai/korean_law_open_data_precedents

收藏
Hugging Face2024-06-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/joonhok-exo-ai/korean_law_open_data_precedents
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含截至2023年6月从韩国国家法令共同利用中心获取的全部判例数据。数据集旨在提供一个方便访问和处理的判例数据集合,避免了通过API访问时的复杂性和预处理工作。数据集中包含的判例信息包括判例编号、案件名称、判决日期、法院名称等。此外,数据集中可能存在重复数据和部分字段缺失的情况,使用时需注意。
提供机构:
joonhok-exo-ai
原始信息汇总

데이터셋 카드

데이터셋 설명

  • 언어: 한국어
  • 태그: 법률
  • 크기 카테고리: 10K<n<100K
  • 라이선스: openrail

사용상 주의사항

  • 사건번호가 동일한 중복 데이터가 약 200여건 포함되어 있습니다. 이는 법제처 국가법령 공동활용 센터의 판례 목록 조회 API가 판례정보일련번호는 다르지만 사건번호 및 다른 필드 값들은 완전히 동일한 데이터들을 리턴하기 때문입니다.

데이터셋 요약

2023년 6월 기준으로 법제처 국가법령 공동활용 센터에서 제공된 전체 판례 데이터셋입니다. 이후 추가되는 판례들은 정기적으로 데이터셋에 추가할 예정입니다.

데이터셋 구조

데이터 인스턴스

개별 데이터의 모양은 다음과 같습니다.

json { "판례정보일련번호": 101924, "사건명": "손해배상", "사건번호": "85다카1594", "선고일자": 19860722, "선고": "선고", "법원명": "대법원", "사건종류명": "민사", "판결유형": "판결", "판시사항": "가. 미성년자가 부모의 개호를 받을 수 있는 경우, 손해로서의 개호인 비용 / 나. 호프만식계산법에 의한 일실이익 산정의 적부 다. 연별 호프만식계산법에 의하여 중간이자를 공제하는 경우, 단리연금 현가율이 20을 넘는 경우의 일실이익 산정방법", "판결요지": "가. 신체의 부자유로 인하여 개호인의 조력을 받을 필요가 있는 경우에는 비록 피해자가 미성년자이고 그의 부모가 개호를 할 수 있는 형편에 있다 하더라도 반드시 그 부모의 개호를 받아야 한다고 단정할 수 없음은 물론, 가사 그 부모의 개호를 받게 된다고 하더라도 이로 인하여 피해자가 입는 손해는 특별한 사정이 없는 한 통상의 개호인 비용 전액이다. 나. 호프만식계산법에 의하여 중간이자를 공제하여 장래의 일실이익의 현가를 산정하는 것은 위법한 것이 아니다. 다. 연별 호프만식계산법에 의하여 중간이자를 공제하는 경우에 단리연금현가율이 20을 넘는 경우에는 그 단리연금현가율을 그대로 적용하여 그 현가를 산정하게 되면 현가로 받게 되는 금액의 이자가 매월 입게 되는 손해액보다 많게 되어 손해액보다 더 많은 금원을 배상하게 되는 불합리한 결과를 가져오게 되므로 그 단리연금현가율이 결과적으로 20을 넘는 경우에 있어서는 그 수치표상의 단리연금현가율이 얼마인지를 불문하고 모두 20을 적용 계산함으로써 피해자가 과잉배상을 받는 일이 없도록 하여야 한다.", "참조조문": "가.나.다. 민법 제763조", "참조판례": "나. 대법원 1981.9.22 선고 81다588 판결, 1985.10.22 선고 85다카819 판결 / 다. 대법원 1985.10.22 선고 85다카819 판결, 1986.3.25 선고 85다카2375 판결", "판결유형": "판결", "전문": "【원고, 피상고인】 (...이하 생략...)" }

데이터 필드

  • "선고일자" 필드의 값은 숫자이며, 일부 데이터에서는 월, 일 정보가 누락되어 4자리 숫자인 경우도 있습니다.
  • "사건명" 등 일부 필드는 값이 없는 경우도 있습니다.

데이터셋 생성

큐레이션 이유

이 데이터셋은 다음과 같은 이유로 만들어졌습니다:

  1. API 방식으로는 전체 데이터를 순회하는 것이 까다롭고
  2. API 응답 데이터를 매번 파싱하고 전처리하는 번거로움이 있으며
  3. 일부 API 응답 데이터에 있는 오류를 미리 정제하기 위하여

소스 데이터

초기 데이터 수집 및 정규화

이 데이터셋은 국가법령 공동활용 센터의 "판례 목록 조회 API"와 "판례 본문 조회 API"를 이용하여 데이터를 수집하였습니다. 판례 본문을 조회할 때 XML과 HTML 두 가지 형식으로 요청하였으며, 데이터의 완결성 검증 및 정제 작업을 위해 두 가지 형식으로 모두 요청을 보낸 뒤 두 응답 데이터를 비교하였습니다. 일부 데이터에서 요청 형식에 따라 데이터 값이 다른 것을 확인하였고, 이 데이터셋에는 더 많은 정보를 담고 있는 데이터로 사용하였습니다. 또한, 데이터 자체에 잘못된 데이터가 포함된 경우들은 수작업으로 수정하였습니다.

추가 정보

데이터셋 큐레이터

김준호: 이 데이터셋은 인공지능 법률 서비스를 만들고 있는 제가 직접 필요해서 만들게 되었습니다.

기여

데이터 중 잘못된 부분을 발견하신 분은 joonhok@smartfitnow.com로 연락 주시면 확인 후 반영하겠습니다.

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作