five

Corpus der Entscheidungen des Bundesgerichtshofs (CE-BGH)

收藏
NIAID Data Ecosystem2026-05-02 收录
下载链接:
https://zenodo.org/record/3942742
下载链接
链接失效反馈
官方服务:
资源简介:
Überblick Das Corpus der Entscheidungen des Bundesgerichtshofs (CE-BGH) ist der bislang größte, frei verfügbare Datensatz von Entscheidungen des Bundesgerichtshofs. Er ist eine Zusammenstellung aller Entscheidungen ab 2000, die in der amtlichen Datenbank des Bundesgerichtshofs am jeweiligen Stichtag veröffentlicht waren. Bitte beachten Sie das beiliegende Codebook! Es enthält wichtige Informationen zur korrekten Nutzung des Datensatzes. Es hilft auch bei der Entscheidung, welche Variante für Sie am besten geeignet ist. In der Regel empfehle ich für quantitative Forschung die CSV-Dateien und für traditionelle Forschung die PDF-Sammlung. Für Praktiker:innen stelle ich zusätzlich nach Senat sortierte PDF-Sammlungen aller Leitsatzentscheidungen und aller Entscheidungen mit Namen (z.B. »Trabrennbahn«) zur Verfügung. Ab Version 2023-03-10 ist auch das Zitationsnetzwerk des BGH (Aktenzeichen, BGHZ und BGHSt) für die einfache Nutzung mit graphischer Software wie Gephi oder für die maschinelle Weiterverarbeitung als GraphML verfügbar. Das Zitationsnetzwerk enthält ca. 600.000 Zitate und ca. 100.000 Knoten (Aktenzeichen, BGHZ oder BGHSt). Die strafrechtlichen Entscheidungen des BGH von 1950 bis 1999 finden Sie im Datensatz Entscheidungen des Bundesgerichtshofs in Strafsachen aus dem 20. Jahrhundert (BGH-Strafsachen-20Jhd).   Aktualisierung Dieser Datensatz wird 1-2 mal im Jahr aktualisiert. Benachrichtigungen über neue und aktualisierte Datensätze veröffentliche ich immer zeitnah auf Mastodon unter @seanfobbe@fediscience.org   NEU in Version 2025-04-07 Vollständige Aktualisierung der Daten Überarbeitung der Dokumentation zu den Varianten des Datensatzes Expliziter R Package Version Lock für 2024-06-13 (CRAN Date) Überarbeitung des Dockerfiles Vereinfachung der Run-Skripte und stärkere Integration mit Docker Compose Vereinheitlichung der Berechnung kryptographischer Hashes /tmp in Arbeitsspeicher ausgelagert Entfernung von exakten Prozentzahlen in den Frequenztabellen Entfernung der Tesseract System Library Entfernung der Nummerierung des Workflow-Diagramms   Features Insgesamt bis zu 36 Variablen in der CSV-Variante Fortlaufende Aktualisierung Urheberrechtsfreiheit Offene und plattformunabhängige Formate (PDF, TXT, CSV) Zitationsnetzwerk zwischen allen Aktenzeichen, BGHZ und BGHSt Verknüpfung mit PräsidentIn/Vize-PräsidentIn Linguistische Kennzahlen Umfangreiches Codebook Compilation Report um den Erstellungs-Prozess zu erläutern Dutzende Diagramme und Tabellen für alle Zwecke (im ZIP-Archiv 'ANALYSE') Diagramme liegen jeweils in einem für den Druck (PDF) und das Web (PNG) optimierten Format vor Tabellen sind im CSV-Format bereitgestellt und sind damit sowohl für Menschen als auch für Maschinen gut lesbar Kryptographische Signaturen Veröffentlichung des Source Codes   Eckdaten Stichtag: 7. April 2025 Inhaltlicher Umfang: 79.708 Entscheidungen Zeitlicher Umfang: 2000 bis 2025 Formate: PDF, TXT, CSV und GraphML   Source Code und Compilation Report Der gesamte Erstellungs-Prozess ist ab Version 2021-04-27 vollautomatisiert und detailliert dokumentiert. Mit jeder Kompilierung des vollständigen Datensatzes wird auch ein umfangreicher Compilation Report in einem attraktiv designten PDF-Format erstellt (ähnlich dem Codebook). Zudem werden Robustness Checks auf Vollständigkeit und Plausibilität durchgeführt und in einem separaten Bericht dokumentiert. Der Compilation Report enthält den Source Code für die Daten-Pipeline, dokumentiert relevante Rechenergebnisse, gibt sekundengenaue Zeitstempel an und ist mit einem klickbaren Inhaltsverzeichnis versehen. Wenn Sie sich für Details des Erstellungs-Prozesses interessieren, lesen Sie diesen bitte zuerst. Der vollständige Source Code, der Compilation Report und die Robustness Checks sind öffentlich einsehbar und dauerhaft erreichbar im wissenschaftlichen Archiv des CERN unter diesem Link hinterlegt: https://doi.org/10.5281/zenodo.4459415   Kryptographische Signaturen Die Integrität und Echtheit der einzelnen Archive des Datensatzes sind durch eine Zwei-Phasen-Signatur sichergestellt. In Phase I werden während der Kompilierung für jedes ZIP-Archiv, das Codebook und die Robustness Checks Hash-Werte in zwei verschiedenen Verfahren (SHA2-256 und SHA3-512) berechnet und in einer CSV-Datei dokumentiert. In Phase II werden diese CSV-Datei und der Compilation Report mit meinem persönlichen geheimen GPG-Schlüssel signiert. Dieses Verfahren stellt sicher, dass die Kompilierung von jedermann durchgeführt werden kann, insbesondere im Rahmen von Replikationen, die persönliche Gewähr für Ergebnisse aber dennoch vorhanden ist. Die während der Kompilierung des Datensatzes erstellte CSV-Datei mit den Hash-Prüfsummen ist mit meiner persönlichen GPG-Signatur versehen. Der mit dieser Version korrespondierende Public Key ist sowohl mit dem Datensatz als auch mit dem Source Code hinterlegt. Er hat folgende Kenndaten: Name: Sean Fobbe (fobbe-data@posteo.de) Fingerabdruck: FE6F B888 F0E5 656C 1D25 3B9A 50C4 1384 F44A 4E42   Kein Urheberrecht: Public Domain An den Entscheidungstexten und amtlichen Leitsätzen besteht gem. § 5 Abs. 1 UrhG kein Urheberrecht, da sie amtliche Werke sind. § 5 UrhG ist auf amtliche Datenbanken analog anzuwenden (BGH, Beschluss vom 28.09.2006 - I ZR 261/03, "Sächsischer Ausschreibungsdienst"). Alle eigenen Beiträge (z.B. durch Zusammenstellung und Anpassung der Metadaten) und damit den gesamten Datensatz stelle ich gemäß einer CC0 1.0 Universal Public Domain License vollständig urheberrechtsfrei.   Disclaimer Dieser Datensatz ist eine private wissenschaftliche Initiative und steht in keiner Verbindung zu Behörden, Gerichten oder anderen amtlichen Stellen der Bundesrepublik Deutschland.   Weitere Open Access Veröffentlichungen (Fobbe) Website — www.seanfobbe.de Open Data  —  zenodo.org/communities/sean-fobbe-data/ Source Code  —  zenodo.org/communities/sean-fobbe-code/ Volltexte regulärer Publikationen  —  zenodo.org/communities/sean-fobbe-publications/   Kontakt Fehler gefunden? Anregungen? Melden Sie diese entweder im Issue Tracker auf Codeberg oder kontaktieren Sie mich über www.seanfobbe.de
创建时间:
2025-04-09
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作