cihatyldz/akce-bankacilik-20k
收藏Hugging Face2026-04-18 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/cihatyldz/akce-bankacilik-20k
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- tr
license: apache-2.0
size_categories:
- 10K<n<100K
task_categories:
- conversational
- text-generation
pretty_name: "Akçe: Türkçe Bankacılık Diyalog Dataseti"
tags:
- turkish
- banking
- finance
- chatbot
- synthetic
- llm
---
# 🪙 Akçe — Türkçe Bankacılık Diyalog Dataseti
**8,367** adet sentetik Türkçe bankacılık diyaloğundan oluşan SFT (Supervised Fine-Tuning) dataseti.
## 📊 Kompozisyon
| Aşama | Sayı | Açıklama |
|---|---|---|
| Temel Q&A (seed + varyasyon) | 2,124 | 7 kategori × seed × paraphrase |
| Multi-turn takip diyalog | 743 | Doğal follow-up soruları |
| Tool-use (kredi/kur) | 3,500 | Template + gerçek hesaplama + LLM yorumu |
| Edge cases | 2,000 | PII ret, OOS, dolandırıcılık, yatırım reddi |
| **TOPLAM** | **8,367** | |
## 🏷️ Kategoriler
- Havale / EFT / FAST
- Kredi Kartı işlemleri
- Bireysel ve ticari krediler
- Yatırım ürünleri
- Güvenlik ve dolandırıcılık
- Hesap işlemleri
- Dijital bankacılık
## 📝 Format (ShareGPT/Alpaca uyumlu)
```json
{
"category": "kredi_karti",
"source": "variation",
"stage": "single_turn",
"messages": [
{"role": "system", "content": "Sen Akçe adında..."},
{"role": "user", "content": "Kredi kartı ekstresi nasıl okunur?"},
{"role": "assistant", "content": "..."}
]
}
```
## 🚀 Kullanım
```python
from datasets import load_dataset
ds = load_dataset("cihatyldz/akce-bankacilik-20k")
print(ds["train"][0])
```
## ⚠️ Uyarı
- **Sentetik**: Qwen2.5-7B-Instruct ile üretildi, manuel doğrulama yapılmadı
- **Demo amaçlı**: Production bankacılık sistemlerinde kullanmadan önce insan review şart
- **Kurlar ve faizler statik**: Dataset'teki rakamlar referans zamanına göredir
## 👤 Yazar
**Cihat Yıldız** — Senior Data Scientist, MSc (NLP/LLM)
🤗 [@cihatyldz](https://huggingface.co/cihatyldz) · 💼 [LinkedIn](https://www.linkedin.com/in/cihatyldz)
## 📄 Lisans
Apache 2.0
提供机构:
cihatyldz



