five

emin037/turk_ceza_kanunlari

收藏
Hugging Face2026-03-21 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/emin037/turk_ceza_kanunlari
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - tr license: mit task_categories: - question-answering - text-classification tags: - tck - turkish - law - legal - ceza-hukuku - sft - fine-tuning - rag - nlp - dataset datasets: - emin037/turk_ceza_kanunlari size_categories: - 1K<n<10K --- # 🇹🇷 Türk Ceza Kanunu Soru-Cevap & RAG Veri Seti Bu veri seti, Türk hukuk sistemindeki temel kanunları (başta TCK olmak üzere) kapsayan, model eğitimi ve bağlamsal bilgi çıkarma (RAG) süreçleri için optimize edilmiş **6.439 adet** zenginleştirilmiş kayıt içermektedir. ## 📊 Veri Seti Özeti | Özellik | Detay | |---------|-------| | **Toplam Soru** | 6.000+ | | **Dosya Boyutu** | ~17.74 MB (JSON) | | **Kapsanan Mevzuat** | TCK, CMK, TMK (3713), KVKK (6698), Trafik (2918), Bahis (7258), Kabahatler (5326) ve fazlası | | **Format** | JSON (Zenginleştirilmiş Metadata) | | **Lisans** | MIT | ## 📥 Veri Şeması (Schema) Veri seti, sadece cevap üretmekle kalmayıp, cevabın yasal dayanağını da (context) modele sunacak şekilde yapılandırılmıştır: | Sütun | Tip | Açıklama | | :--- | :--- | :--- | | **`soru`** | string | Kullanıcı tarafından sorulan hukuki soru veya vaka. | | **`cevap`** | string | Sorunun mevzuata uygun, net ve açıklayıcı yanıtı. | | **`context`** | string | Yanıtın dayandırıldığı kanun maddesi veya geniş metin (7.85k karaktere kadar). | | **`kaynak`** | string | Bilginin alındığı kanun adı ve madde numarası. | | **`veri türü`** | string | İçeriğin kategorisi (örn: hukuk). | | **`Score`** | int64 | Verinin doğruluğu veya niteliğine dair güven puanı (1 ile 10 arası). | ## 🎯 Kullanım Alanları * **Hukuki Chatbotlar:** Vatandaşların temel sorularına yasal dayanak göstererek cevap veren asistanlar. * **RAG (Retrieval-Augmented Generation):** Geniş `context` alanı sayesinde vektör veritabanları (Pinecone, ChromaDB vb.) ile entegre çalışma. * **Model Değerlendirme:** `Score` alanı kullanılarak model çıktılarının kalitesini ölçme. * **Hukuki NLP:** Suç tipi sınıflandırma ve yasal metin analizi. ## ⚖️ Kapsanan Başlıca Konular 1. **Ceza Hukuku (Genel & Özel):** Suçun unsurları, cezayı artıran/azaltan nedenler. 2. **Dijital Suçlar:** Sosyal medya hakaretleri, bilişim sistemlerine sızma, KVKK ihlalleri. 3. **Toplumsal Güvenlik:** Trafik suçları, ruhsatsız silahlar, yasa dışı bahis süreçleri. 4. **Yargılama Usulü (CMK):** Gözaltı süreleri, tutuklama şartları, ifade verme hakları. ## 🚀 Veri Hazırlık Süreci Veri seti, CSV ve JSON kaynaklarından gelen 6.000+ ham satırın **benzerlik temizliği** (deduplication) işleminden geçirilmesiyle rafine edilmiştir. ## ⚠️ Uyarı ve Feragatname Bu veri seti **eğitim ve araştırma amaçlı** hazırlanmıştır. Model tarafından üretilen yanıtlar kesinlikle **hukuki tavsiye niteliği taşımaz**. Hukuki uyuşmazlıklarda mutlaka bir avukata başvurulmalıdır. ## 📚 Atıf ve Katkı Veri setini geliştiren: **Emin M.** Veri seti üzerinde iyileştirme yapmak veya hata bildirmek için "Community" sekmesini kullanabilirsiniz.
提供机构:
emin037
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作