Jianshu001/arabic-conversation-v3-gpt5.4mini
收藏Hugging Face2026-04-07 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/Jianshu001/arabic-conversation-v3-gpt5.4mini
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- ar
task_categories:
- text-generation
tags:
- arabic
- synthetic
- multi-turn
size_categories:
- n<1K
---
# Arabic Multi-Domain Conversations (gpt-5.4-mini)
19 synthetic multi-turn Arabic conversations across 6 UAE/Middle East domains.
Generated with **gpt-5.4-mini** (user + assistant + factuality check).
## Domains
| Domain | Count |
|--------|-------|
| Education | 4 |
| Government Services | 4 |
| Real Estate | 4 |
| Islamic Finance | 3 |
| Healthcare | 2 |
| Energy | 2 |
## Stats
- 19 conversations, 79 user messages, 79 assistant messages
- Average user message: 143 chars
- Markdown headings in assistant: 0%
- 3-5 turns per conversation
## Format
JSONL: id, domain, domain_ar, topic, topic_ar, subtopic_ar, persona, conversation, metadata, factuality
语言:
- 阿拉伯语(ar)
任务类别:
- 文本生成
标签:
- 阿拉伯语
- 合成数据
- 多轮对话
数据规模分类:
- 样本量小于1000(n<1K)
# 阿拉伯语多领域对话数据集(gpt-5.4-mini)
该数据集包含19条合成生成的阿拉伯语多轮对话,覆盖阿联酋/中东地区共6个领域,所有对话均由**gpt-5.4-mini**生成,生成流程涵盖用户轮次、助手轮次及事实性校验环节。
## 领域分布
| 领域 | 样本数量 |
|--------------------|----------|
| 教育 | 4 |
| 政府服务 | 4 |
| 房地产 | 4 |
| 伊斯兰金融 | 3 |
| 医疗健康 | 2 |
| 能源 | 2 |
## 统计信息
- 共计19条对话,包含79条用户消息与79条助手消息
- 单条用户消息平均字符长度为143
- 助手消息中未包含Markdown标题,占比0%
- 单条对话的轮次范围为3至5轮
## 数据格式
采用JSONL格式存储,每条数据包含以下字段:id、domain、domain_ar、topic、topic_ar、subtopic_ar、persona、conversation、metadata、factuality
提供机构:
Jianshu001



