five

Jianshu001/arabic-conversation-v3-gpt5.4mini

收藏
Hugging Face2026-04-07 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/Jianshu001/arabic-conversation-v3-gpt5.4mini
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - ar task_categories: - text-generation tags: - arabic - synthetic - multi-turn size_categories: - n<1K --- # Arabic Multi-Domain Conversations (gpt-5.4-mini) 19 synthetic multi-turn Arabic conversations across 6 UAE/Middle East domains. Generated with **gpt-5.4-mini** (user + assistant + factuality check). ## Domains | Domain | Count | |--------|-------| | Education | 4 | | Government Services | 4 | | Real Estate | 4 | | Islamic Finance | 3 | | Healthcare | 2 | | Energy | 2 | ## Stats - 19 conversations, 79 user messages, 79 assistant messages - Average user message: 143 chars - Markdown headings in assistant: 0% - 3-5 turns per conversation ## Format JSONL: id, domain, domain_ar, topic, topic_ar, subtopic_ar, persona, conversation, metadata, factuality

语言: - 阿拉伯语(ar) 任务类别: - 文本生成 标签: - 阿拉伯语 - 合成数据 - 多轮对话 数据规模分类: - 样本量小于1000(n<1K) # 阿拉伯语多领域对话数据集(gpt-5.4-mini) 该数据集包含19条合成生成的阿拉伯语多轮对话,覆盖阿联酋/中东地区共6个领域,所有对话均由**gpt-5.4-mini**生成,生成流程涵盖用户轮次、助手轮次及事实性校验环节。 ## 领域分布 | 领域 | 样本数量 | |--------------------|----------| | 教育 | 4 | | 政府服务 | 4 | | 房地产 | 4 | | 伊斯兰金融 | 3 | | 医疗健康 | 2 | | 能源 | 2 | ## 统计信息 - 共计19条对话,包含79条用户消息与79条助手消息 - 单条用户消息平均字符长度为143 - 助手消息中未包含Markdown标题,占比0% - 单条对话的轮次范围为3至5轮 ## 数据格式 采用JSONL格式存储,每条数据包含以下字段:id、domain、domain_ar、topic、topic_ar、subtopic_ar、persona、conversation、metadata、factuality
提供机构:
Jianshu001
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作