emin037/turk_ceza_kanunlari
收藏Hugging Face2026-03-21 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/emin037/turk_ceza_kanunlari
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- tr
license: mit
task_categories:
- question-answering
- text-classification
tags:
- tck
- turkish
- law
- legal
- ceza-hukuku
- sft
- fine-tuning
- rag
- nlp
- dataset
datasets:
- emin037/turk_ceza_kanunlari
size_categories:
- 1K<n<10K
---
# 🇹🇷 Türk Ceza Kanunu Soru-Cevap & RAG Veri Seti
Bu veri seti, Türk hukuk sistemindeki temel kanunları (başta TCK olmak üzere) kapsayan, model eğitimi ve bağlamsal bilgi çıkarma (RAG) süreçleri için optimize edilmiş **6.439 adet** zenginleştirilmiş kayıt içermektedir.
## 📊 Veri Seti Özeti
| Özellik | Detay |
|---------|-------|
| **Toplam Soru** | 6.000+ |
| **Dosya Boyutu** | ~17.74 MB (JSON) |
| **Kapsanan Mevzuat** | TCK, CMK, TMK (3713), KVKK (6698), Trafik (2918), Bahis (7258), Kabahatler (5326) ve fazlası |
| **Format** | JSON (Zenginleştirilmiş Metadata) |
| **Lisans** | MIT |
## 📥 Veri Şeması (Schema)
Veri seti, sadece cevap üretmekle kalmayıp, cevabın yasal dayanağını da (context) modele sunacak şekilde yapılandırılmıştır:
| Sütun | Tip | Açıklama |
| :--- | :--- | :--- |
| **`soru`** | string | Kullanıcı tarafından sorulan hukuki soru veya vaka. |
| **`cevap`** | string | Sorunun mevzuata uygun, net ve açıklayıcı yanıtı. |
| **`context`** | string | Yanıtın dayandırıldığı kanun maddesi veya geniş metin (7.85k karaktere kadar). |
| **`kaynak`** | string | Bilginin alındığı kanun adı ve madde numarası. |
| **`veri türü`** | string | İçeriğin kategorisi (örn: hukuk). |
| **`Score`** | int64 | Verinin doğruluğu veya niteliğine dair güven puanı (1 ile 10 arası). |
## 🎯 Kullanım Alanları
* **Hukuki Chatbotlar:** Vatandaşların temel sorularına yasal dayanak göstererek cevap veren asistanlar.
* **RAG (Retrieval-Augmented Generation):** Geniş `context` alanı sayesinde vektör veritabanları (Pinecone, ChromaDB vb.) ile entegre çalışma.
* **Model Değerlendirme:** `Score` alanı kullanılarak model çıktılarının kalitesini ölçme.
* **Hukuki NLP:** Suç tipi sınıflandırma ve yasal metin analizi.
## ⚖️ Kapsanan Başlıca Konular
1. **Ceza Hukuku (Genel & Özel):** Suçun unsurları, cezayı artıran/azaltan nedenler.
2. **Dijital Suçlar:** Sosyal medya hakaretleri, bilişim sistemlerine sızma, KVKK ihlalleri.
3. **Toplumsal Güvenlik:** Trafik suçları, ruhsatsız silahlar, yasa dışı bahis süreçleri.
4. **Yargılama Usulü (CMK):** Gözaltı süreleri, tutuklama şartları, ifade verme hakları.
## 🚀 Veri Hazırlık Süreci
Veri seti, CSV ve JSON kaynaklarından gelen 6.000+ ham satırın **benzerlik temizliği** (deduplication) işleminden geçirilmesiyle rafine edilmiştir.
## ⚠️ Uyarı ve Feragatname
Bu veri seti **eğitim ve araştırma amaçlı** hazırlanmıştır. Model tarafından üretilen yanıtlar kesinlikle **hukuki tavsiye niteliği taşımaz**. Hukuki uyuşmazlıklarda mutlaka bir avukata başvurulmalıdır.
## 📚 Atıf ve Katkı
Veri setini geliştiren: **Emin M.** Veri seti üzerinde iyileştirme yapmak veya hata bildirmek için "Community" sekmesini kullanabilirsiniz.
提供机构:
emin037



