Jianshu001/arabic-conversation-v3-sonnet
收藏Hugging Face2026-04-07 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/Jianshu001/arabic-conversation-v3-sonnet
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- ar
task_categories:
- text-generation
tags:
- arabic
- synthetic
- multi-turn
size_categories:
- n<1K
---
# Arabic Multi-Domain Conversations (Claude Sonnet 4.6)
19 synthetic multi-turn Arabic conversations across 6 UAE/Middle East domains.
Generated with **claude-sonnet-4-6** (user + assistant), factuality checked with **claude-sonnet-4-6**.
## Domains
| Domain | Count |
|--------|-------|
| Government Services | 4 |
| Energy | 4 |
| Real Estate | 4 |
| Islamic Finance | 3 |
| Healthcare | 3 |
| Education | 1 |
## Stats
- 19 conversations, 74 user messages, 74 assistant messages
- Average user message: 155 chars
- Markdown headings in assistant: 0%
- Factuality: 9 pass, 10 review, 1 rejected
- 3-5 turns per conversation
## Format
JSONL: id, domain, domain_ar, topic, topic_ar, subtopic_ar, persona, conversation, metadata, factuality
---
语言:
- 阿拉伯语
任务类别:
- 文本生成
标签:
- 阿拉伯语
- 合成数据
- 多轮对话
样本规模:
- 少于1000条
---
# 阿拉伯语多领域对话数据集(Claude Sonnet 4.6)
本数据集包含覆盖阿联酋/中东地区6个领域的19条合成多轮阿拉伯语对话,所有对话由**claude-sonnet-4-6**生成(包含用户与助手双角色),并通过**claude-sonnet-4-6**完成事实性校验。
## 领域分布
| 领域名称 | 样本数量 |
|--------|-------|
| 政府服务 | 4 |
| 能源 | 4 |
| 房地产 | 4 |
| 伊斯兰金融 | 3 |
| 医疗健康 | 3 |
| 教育 | 1 |
## 统计信息
- 共19组对话,包含74条用户消息与74条助手消息
- 单条用户消息平均长度为155个字符
- 助手消息中Markdown标题占比为0%
- 事实性校验结果:9条通过,10条待审核,1条未通过
- 每组对话包含3至5轮交互
## 数据格式
采用JSONL(JSON Lines)格式存储,字段依次为:id、领域名称、阿拉伯语领域名称、主题、阿拉伯语主题、阿拉伯语子主题、角色设定、对话内容、元数据、事实性校验结果。
提供机构:
Jianshu001



