five

Jianshu001/arabic-conversation-v3-sonnet

收藏
Hugging Face2026-04-07 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/Jianshu001/arabic-conversation-v3-sonnet
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - ar task_categories: - text-generation tags: - arabic - synthetic - multi-turn size_categories: - n<1K --- # Arabic Multi-Domain Conversations (Claude Sonnet 4.6) 19 synthetic multi-turn Arabic conversations across 6 UAE/Middle East domains. Generated with **claude-sonnet-4-6** (user + assistant), factuality checked with **claude-sonnet-4-6**. ## Domains | Domain | Count | |--------|-------| | Government Services | 4 | | Energy | 4 | | Real Estate | 4 | | Islamic Finance | 3 | | Healthcare | 3 | | Education | 1 | ## Stats - 19 conversations, 74 user messages, 74 assistant messages - Average user message: 155 chars - Markdown headings in assistant: 0% - Factuality: 9 pass, 10 review, 1 rejected - 3-5 turns per conversation ## Format JSONL: id, domain, domain_ar, topic, topic_ar, subtopic_ar, persona, conversation, metadata, factuality

--- 语言: - 阿拉伯语 任务类别: - 文本生成 标签: - 阿拉伯语 - 合成数据 - 多轮对话 样本规模: - 少于1000条 --- # 阿拉伯语多领域对话数据集(Claude Sonnet 4.6) 本数据集包含覆盖阿联酋/中东地区6个领域的19条合成多轮阿拉伯语对话,所有对话由**claude-sonnet-4-6**生成(包含用户与助手双角色),并通过**claude-sonnet-4-6**完成事实性校验。 ## 领域分布 | 领域名称 | 样本数量 | |--------|-------| | 政府服务 | 4 | | 能源 | 4 | | 房地产 | 4 | | 伊斯兰金融 | 3 | | 医疗健康 | 3 | | 教育 | 1 | ## 统计信息 - 共19组对话,包含74条用户消息与74条助手消息 - 单条用户消息平均长度为155个字符 - 助手消息中Markdown标题占比为0% - 事实性校验结果:9条通过,10条待审核,1条未通过 - 每组对话包含3至5轮交互 ## 数据格式 采用JSONL(JSON Lines)格式存储,字段依次为:id、领域名称、阿拉伯语领域名称、主题、阿拉伯语主题、阿拉伯语子主题、角色设定、对话内容、元数据、事实性校验结果。
提供机构:
Jianshu001
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作