FreedomIntelligence/ACVA-Arabic-Cultural-Value-Alignment
收藏Hugging Face2023-09-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/FreedomIntelligence/ACVA-Arabic-Cultural-Value-Alignment
下载链接
链接失效反馈官方服务:
资源简介:
ArabicCulture数据集由gpt3.5生成,包含8000多个真假问题,涵盖58个不同领域。其中,59.62%的答案为“真”,40.38%为“假”。数据集分为两个子集:data-all和data-select。data-all包含8000+数据,每个领域选取5个数据作为few-shot数据。data-select则是通过两位阿拉伯人对4000条数据进行筛选,最终保留2400条数据,覆盖9个领域,并分为测试集和验证集。
提供机构:
FreedomIntelligence
原始信息汇总
阿拉伯文化数据集概述
数据集基本信息
- 语言: 阿拉伯语
- 许可证: Apache 2.0
- 数据规模: 1K<n<10K
数据集内容
- 生成方式: 由gpt3.5生成
- 数据量: 超过8000条真假问题
- 问题领域: 涵盖58个不同领域
- 答案分布:
- “真”占59.62%
- “假”占40.38%
数据处理
- 数据选择:
- 从每个领域选取5条数据作为少量样本数据
- 由两名阿拉伯人评估4000条数据,最终保留两人均认为良好的数据,共2400条,覆盖9个领域
- 数据划分: 将筛选后的数据分为测试集和验证集



